ふらふら Diary (仮)

興味のあることを適当に書いていく感じです

人検出における評価指標

提案手法の有効性を示すためには評価実験をします.実験の評価基準にはいくつかありますが,本記事では2つを紹介し,そのうちの1つを詳しく書いていきます.

  • 縦軸にmiss rateを縦軸にFalse Positive Per Window (FPPW)を示すDetection Error Tradeoff (DET)カーブを描く*1

こちらは学習データと同じ大きさの画像を評価用画像として用いて比較実験を行います.

  • 縦軸にDetection Rateを横軸にFalse Positive Per Frameを示すROCカーブを描く*2

こちらは車載カメラや防犯カメラで撮影された画像を評価用画像として用いて比較実験を行います.この場合,画像データセットを用いた場合は,アノテーションデータとして人の存在する位置や大きさが記述されています.このアノテーションデータを用いて検出精度を比較します.


本記事ではmiss rateとFPPWを算出してDETカーブを描く評価指標について述べたいと思います.
まず,miss rate,FPPWは次の式で定義されます.

\text{miss rate} = 1 - \dfrac{\text{人画像を正しく人として識別した数}}{\text{人画像の数}}

\text{FPPW} = \dfrac{\text{背景画像を間違えて人と識別した数}}{\text{背景画像の数}}

評価手順としては,まず,前回の記事と同様にHOG特徴量を算出します.識別器を構築するときと同様,+1には人画像,-1には背景画像のHOG特徴量をそれぞれ算出します.今回は人画像10枚,背景画像10枚として評価を行います.これをexample.datとし,ファイルに書き込みます.そして,コマンドプロンプトを開き,SVM-Light (http://svmlight.joachims.org/)のあるディレクトリに移動します.
その後,前回で作成したmodel_fileを用いて以下のように記述します.

 > svm_classify example.dat model_file output_file

次に作成したoutput_fileを見てみます.

0.1131256
0.57471402
0.32858306
0.2575153
0.62797327
0.39330365
0.68454537
0.7337844
0.53083444
0.55778887
-0.40430174
0.019183116
-0.10045875
-0.19039516
-0.74474677
0.093509865
-0.30452128
-0.24911432
-0.26294845
-0.44431607

このうち,上の10行は人画像,残りは背景画像です.
人と判定するしきい値を0以上とした場合,この中では上の10行と12,26行目の画像は人画像と識別されたということになります.このしきい値を変化させることによってmiss rateとFPPWを算出し,これを曲線で結ぶことによって描画していきます.

二つ以上の手法で検出精度を比較する場合,DETカーブが原点に近く描かれる手法であるということを示します.
人検出の場合,人画像であるにも関わらず,背景画像と識別した誤検出と,背景画像であるにも関わらず,人画像と識別した未検出を算出して精度を比較します.

誤検出も未検出も小さい値を示すことが理想です.

*1:N. Dalal and B. Triggs. Histograms of oriented gradients for human detection. Proceedings of 2005 IEEE Computer Society Conference on Computer Vision and Pattern Recognition, Vol. 1, pp. 886-893, June 2005.

*2:M. Enzweiler and D. M. Gavrila. Monocular pedestrian detection: Survey and experiments. Pattern Analysis and Machine Intelligence, Vol. 31, No. 12, pp. 2179-2195, Dec. 2009.