データ拡張

機械学習をしたいがデータがない
自分でデータセットを見つけるのは大変。
少ないデータセットでより良い精度を出すためのデータ水増しの方法。

・線形変換(コントラスト、反転、拡大縮小、トリミング、ノイズ付加)

これらの技術をデータオーギュメンテーションという。

・cifar-10 ー 10クラスの写真が格納されたDB

過学習に注意が必要。
おかしな汎用性によりF値低下。
ノイズによる分類の複雑化。
移動により正常範囲が狭まると精度低下も。

<Aidemy Tech Blog http://blog.aidemy.net/entry/2017/10/04/033336>

F値
  真の 結果
  (正) (負)
予測結果(正) TP FP
(負)
FN TN

精度(真-正/予-正)
Precision= {\frac{TP}{TP+FP}}

再現率(予ー正/真-正)
Recall= {\frac{TP}{TP+FN}}

F値(精度と再現率の調和平均)
{\frac{2Recall・Precision}{Recall+Precision}}
 
・調和平均
{\frac{1}{H}}=[tex:{\frac{1/a1+1/a2+…+1/an}{n}}]
  <高校数学の美しい物語 https://mathtrain.jp/hmean>

<朱鷺の杜Wiki http://ibisforest.org/index.php?F%E5%80%A4>