データ拡張
機械学習をしたいがデータがない
自分でデータセットを見つけるのは大変。
少ないデータセットでより良い精度を出すためのデータ水増しの方法。
・線形変換(コントラスト、反転、拡大縮小、トリミング、ノイズ付加)
これらの技術をデータオーギュメンテーションという。
・cifar-10 ー 10クラスの写真が格納されたDB
過学習に注意が必要。
おかしな汎用性によりF値低下。
ノイズによる分類の複雑化。
移動により正常範囲が狭まると精度低下も。
<Aidemy Tech Blog http://blog.aidemy.net/entry/2017/10/04/033336>
真の | 結果 | |
---|---|---|
(正) | (負) | |
予測結果(正) | TP | FP |
(負)
|
FN | TN |
精度(真-正/予-正)
Precision=
再現率(予ー正/真-正)
Recall=
F値(精度と再現率の調和平均)
・調和平均
=[tex:{\frac{1/a1+1/a2+…+1/an}{n}}]
<高校数学の美しい物語 https://mathtrain.jp/hmean>
<朱鷺の杜Wiki http://ibisforest.org/index.php?F%E5%80%A4>