データ拡張 - 柚日記

機械学習をしたいがデータがない
自分でデータセットを見つけるのは大変。
少ないデータセットでより良い精度を出すためのデータ水増しの方法。

・線形変換(コントラスト、反転、拡大縮小、トリミング、ノイズ付加)

これらの技術をデータオーギュメンテーションという。

・cifar-10　ー　10クラスの写真が格納されたDB

過学習に注意が必要。
おかしな汎用性によりF値低下。
ノイズによる分類の複雑化。
移動により正常範囲が狭まると精度低下も。

F値
	真の	結果
	(正)	(負)
予測結果(正)	TP	FP
(負)	FN	TN

精度(真-正/予-正)
Precision= ${\frac{TP}{TP+FP}}$

再現率(予ｰ正/真-正)
Recall= ${\frac{TP}{TP+FN}}$

F値(精度と再現率の調和平均)
${\frac{2Recall・Precision}{Recall+Precision}}$
　
・調和平均
${\frac{1}{H}}$ =[tex:{\frac{1/a₁+1/a₂+…+1/a_n}{n}}]
　　<高校数学の美しい物語　https://mathtrain.jp/hmean>

<朱鷺の杜Wiki http://ibisforest.org/index.php?F%E5%80%A4>