画像特徴とインデックスデータによる検索機能を備えた 花画像データベースの構築 Construction of the flower image database with feature and index-based searching mechanism 岡村 知明† 精廬 幹人† 中村 真吾† 青木 義満†† 橋本 周司† Tomoaki Okamura, Mikito Toguro , Shingo Nakamura, Yoshimitu Aoki, Shuji Hashimoto 早稲田大学大学院理工学研究科†芝浦工業大学工学部情報工学科†† 1.はじめに 2.1 花標本画像データベースの構築 近年、コンピュータ技術の発達により携帯電話にも CCD カメラが内蔵されるようになるなど、ユーザがディ ジタル画像を手軽に取得することができるようになった。 このようにして取得したディジタル画像を用いて、画像そ のものをキーとしたデータベースを利用することが現実 的になりつつある。そこで本研究では国立科学博物館附属 自然教育園内に生息する花画像をデータベース化した。そ して、自然環境下で撮影した画像から類似画像検索を行な いその結果に基づいて対話的に花の種類を特定し、さらに 花の情報を提示するシステムを構築した。 花画像データの収集のために、東京都港区の国立科学博 物館附属自然教育園内に生息する花を2000年4月∼ 2001年4月までの約一年間に渡り撮影を行ない、20 8種類1248枚のデータベースを作成した。撮影には2 11万画素(解像度1024×768)のディジタルスチ ルカメラ(DSC-F505K、SONY)を使用した。 2.花画像データベースシステムの概要 本システムは、花の標本画像とその画像特徴量(全体 色、色分布、エッジ分布、テクスチャ分布)を収めた画像 データベースと、花の名前、花弁の数など、花の属性を収 めたインデックスデータベースの2つを中心とするもの である。このシステムを利用するには、まずユーザが検索 対象となる花の画像を入力する。すると、システムは画像 特徴量を抽出した後、特徴空間で距離の近い画像をデータ ベースから選びユーザに結果を表示する。次にシステムは、 ユーザに花の属性情報を尋ねることにより候補画像から 花の種類を特定し、その花の情報を提示する。 (図1) 2.2 花領域の抽出 本研究で用いるのは自然環境下で撮影した花画像であ るので、この画像で類似画像検索を行なう際に花以外の背 景部分がノイズになる可能性が高い。したがって花の領域 だけを抽出する処理が重要になる。そこで本研究では、画 像の RGB 値から人間の知覚量である色相、明度、彩度を 用いた HLS 値に変換し、花の色と思われる色を検出する ことによって花領域を抽出する。 具体的には、HLS 空間において9つ(赤、黄、茶、緑、 水色、青、紫、白、暗)にクラスタリングした色領域のう ち、 1.葉の色等背景に多いと思われる茶、緑、暗以外 2.全体に対してある程度の画素数を持っている 3.画素の画像中心からの平均距離が最も近い という条件を満たした上位2つの色領域に属するピクセ ルを花領域として抽出する。図2は花領域抽出例である。 (a)原画像 (b) 処理後画像 図2 花領域抽出例 2.3 類似画像検索エンジン 図1 花画像検索システムの流れ 類似画像検索エンジン(株式会社リコー製)は、主に4 つの特徴量(全体色、色分布、エッジ分布、テクスチャ分 布)を用いて類似画像検索を行なう。このとき、4つの特 徴量の重みを調節することが可能である。このエンジンを 本研究で使用するには、どの特徴量が花画像の検索に対し て有効であるかを検証する必要がある。 表1 パラメータを変えたときの検索順位の変化 2.4 インデックスデータベース インデックスデータには、花の名前、科名、属名、生息 地、分布、花の咲く時期、色、花のつき方、花の大きさ、 花弁の数、葉の形、葉のつき方、茎の高さ、生活型の14 項目を用意した。その中で数値として表すことができる、 花の咲く時期、花の大きさ、花びらの枚数、茎の高さの4 つを質問項目に選んだ。残りの10項目は花の情報を提示 する時に用いる。画像検索を行なった後、残った画像の中 で特徴の分散の大きい項目を質問することにより、花の種 類を絞り込む。 3.花画像検索実験 構築したシステムで花の種類を特定できるのかを確か めるために以下のような実験を試みた。 3.1 花領域抽出処理による効果の検証 まず、花領域を抽出してから検索する手法の妥当性を検 証するため、花領域の抽出前と抽出後の画像を用いて画像 検索を行ない、検索順位を比較した。ここでは80種の花 の画像データベースを用意し15枚のキー画像を用いて 類似画像検索を行ない、入力画像と同一種の花の画像の類 似度の順位を調べた。図 3 はその結果である。この結果か ら花領域抽出処理は、効果があると考えられる。 花領域抽出処理前 1 2 3 最後に類似画像検索と対話型検索を組み合わせた検索 を行ない、目的の花の種類を絞り込むことができることを 実験的に確認した。例えばキー画像を入力し、画像検索に より上位30枚が候補として表示される。それらのインデ ックスデータの中で最も分散の大きな花弁の数の質問に 答えることにより、5枚に絞り込むことが出来た。 花領域抽出処理後 キー画像番号(検索順位の良い順にソート) 4 5 6 7 8 9 10 11 12 13 4.まとめ 14 15 1 検 6 索 11 順 位 16 21 抽出処理前の順位の平均 3.3 対話型検索と組み合わせた検索実験 抽出処理後の順位の平均 9.53 8.13 図3 類似画像検索結果 3.2 類似画像検索における特徴量の重要度の検証 3.1 の実験では、4つの画像特徴量の割合を均等にして 検索を行なったが、花画像に対してどの特徴量の組み合わ せが最適であるのかを検討する必要がある。そこで、特徴 量の重み付けを変えたときの検索順位の変化を調べた。 3.1 の実験で、花領域抽出はうまくいったが逆に検索順位 が下がってしまった3枚の画像について、4つのパラメー タの重み付けを変えて画像検索を行なった。 (表1) この結果から、全体色のパラメータを除いた場合に検索 順位が上がっていることが分かる。全体色のパラメータは 最もピクセル数の多い色を特徴量としている。ところが花 領域抽出後、背景部分を黒色としている。したがって、背 景面積が大きい場合には逆に検索精度が低下してしまう と考えられる。 花領域抽出処理と類似画像検索、さらにインデックスデ ータによる絞り込み処理を組み合わせることにより、花に 特化した検索システムを構築することができた。 近々、 花領域抽出処理のアルゴリズムを改良すると共に Web 上 で公開する予定である。さらに質問項目の追加をし、デー タ数を増やした場合の検索効率の検討を行なっている。 謝辞 画像のデータベースエンジンの試用でお世話になり、また研究の 全般において議論をいただいた株式会社リコーの立川道義氏、岩 崎雅二郎氏に深く感謝する。 参考文献 [1] 中村 真吾、橋本 周司、 “カメラ画像をキーとする花画像デー タベース検索システム、 ”情報処理学会第60回全国大会講演論 文集、3-189,190,2000 [2] S. Nakamura, M. Sawada, Y. Aoki, P. Hartono, S. Hashimoto, “Flower Image Database Construction and its Retrieval,” 7th Korea – Japan Joint Workshop on Computer Vision, FCV2001, pp37-42, 2001 [3] 中村 真吾、澤田 美絵、青木 義満、橋本 周司、 “花データベ ースの構築と絞り込み検索、 ”2001年電子情報通信学会総合 大会講演論文集、D-12-58, pp-225, 2001 [4] M. Flickner, et al, “Query by image and video content: The QBIC system,”IEEE Computer, vol.28, no.9, pp.23-32, Sept. 1995. [5] 渡辺 靖彦、長尾 真、 “画像の内容を説明するテキストを利用 した画像解析、 ”信学技報、NLC95-33,PRU95-1398(1995-10) [6] 武者 義則、広池 敦、杉本 晃宏、 “類似画像検索における特 徴量空間の可視化インタフェース、 ”電通学会、D-Ⅱ, Vol.J82-DⅡ, No10, pp.1626-1633(1999-10)
© Copyright 2024 Paperzz