野鳥の生態調査のための画像データセットの構築

野鳥の生態調査のための画像データセットの構築
吉橋亮太 † 川上玲 † 飯田誠 ‡ 苗村健 †
† 東京大学 大学院情報理工学系研究科 ‡ 東京大学 先端科学技術研究センター
E-mail: [email protected]
図 1
データセット
の構造
図2
画像例
1 はじめに
風力発電所における鳥とブレードの衝突(バードス
トライク)による生態系への悪影響が懸念されている.
対策のため,周囲を飛行している鳥の種類や飛行経路
を明らかにする生態調査が必要であるが,人手による
調査は高コストであり,物体認識による自動化が期待
されている.物体認識には大量の学習用画像が必要で
あるが,既存の画像データセットの内鳥画像を含むもの
[1][2] は,鳥を遠方から撮影した画像や時系列が含まれ
ず,風車周囲の生態調査目的には十分でない.一方で,
生態調査に向けた鳥検出システムとして,背景差分法
と識別器を組み合わせた手法 [3] が提案されているが,
[3] の学習用鳥画像は,専門家でない者により作成され
ているため,鳥の種類が不明な点,画像枚数が 3000 枚
弱と機械学習用としては完全でない点,撮影場所が風
車の周囲ではなかった点などのために,人手による調
査との相関が評価できなかった.
そこで本稿では,風力発電所での生態調査に向けた
基準となる野鳥画像データセットを提案する.データ
セットは,風車のある風景の連続写真を含み,各画像に
は鳥の位置を示すバウンディングボックスと,鳥の種
類を示すラベルが付加されており(図 1),合計 15725
枚の鳥画像が含まれる.ラベル付けは日本野鳥の会会
員らによって行われており,詳細な鳥の種類が参照で
きる.このデータセットは生態調査のための鳥検出や,
多クラスの詳細な画像分類の研究に利用できる.デー
タセットはウェブ公開する予定である.
2 鳥画像データセットの構築
データセットの画像は,近畿地方の風力発電所に固
定カメラを設置して撮影した.検出に必要な鳥画像の
解像度は 20 ピクセルであるとの [3] の知見から,カメ
ラの解像度は 5616 × 3744 ピクセル,望遠レンズを用
い画角は 27 °× 18 °とした.これにより 700m 離れた
図3
鳥認識の ROC 曲線
大きさ 1m の鳥が 20 ピクセルで写る.2 秒間隔で 7 時
間撮影を行い,10815 枚の画像が得られた.日本野鳥の
会会員らに依頼し,人手により画像中の鳥の周りにバ
ウンディングボックスを設定し,種類の入力を行った.
結果として 15725 羽の鳥が発見された.また鳥以外の
飛行物体も記録し,飛行機や昆虫などが 2399 体発見
された.これは鳥認識のための負例として利用できる.
図 2 はバウンディングボックス内の鳥画像の例である.
様々な解像度の画像が含まれ,鳥の種名が詳しく判明
している.現在も継続してデータを増やしており,写
真 30000 枚分までデータセットを拡張する予定である.
3 鳥認識の実験
データセットの応用の一例として,鳥/非鳥の二クラ
ス分類を行った.テストサンプルとして,画像の時系
列から背景差分法により切り抜かれた領域を利用した.
学習用の正例としては鳥領域,負例としては 1. 背景領
域,2. 鳥でない飛行物体の領域,の二種類を用いた.特
徴量として Haar-like または HOG,識別器として Real
AdaBoost を用いた.図 3 に示すように,負例に関わら
ず Haar-like によって HOG より良い認識結果を得た.
Haar-like を用いて負例を変えたときの精度を比べると,
1. 負例が背景のときは偽陽性率が 0 のとき真陽性率が
0.99 という良い結果が得られるものの,2. 負例が飛行
物体のときは偽陽性率が 0.1 でも真陽性率が 0.86 と精
度が低い.鳥と飛行機,昆虫といった似た画像の識別
精度を向上していくことが課題であることが分かる.
参考文献
[1] J. Deng et al., “ImageNet: A Large-Scale Hierarchical
Image Database,” Proc. CVPR,pp. 248–255 (2009).
[2] P. Welinder et al., “Caltech-UCSD Birds 200” (2010).
[3] 白石ら,“バードストライク防止のための画像認識を用い
た鳥の検出”,風力エネルギー学会,pp. 96–103(2012).