《解説》 画像処理技術の最先端(PDF/825KB)

画像処理技術の最先端
画像データの利活用において、技術面ではどのようなことが可能になっているのだろうか。
デジタル画像の合成・加工・復元や画像に写っている物体の認識など、みずほ情報総研が取り組む
技術開発の事例から、今後さまざまな分野で活用が期待される先端技術を紹介する。
機械学習のアルゴリズム開発と実装
画像認識技術の大きな転換点となったのは、大量のデータを活
用し、パターン認識などを反復的に学習する﹁機械学習﹂技術の
進展である。音声認識や自然言語処理、人工知能開発にもその技
術は活用され、イノベーションがもたらされている。
機械学習では、コンピュータに何をどこまで学習させてルール
を作らせるかということが重要なポイントになる。たとえば、あ
る傾向を持つ画像を自動的に検出・解析するためにサンプル画像
そのものを学習させても、学習サンプルと同じパターンの画像し
か検出できない。そこで、たとえば人の顔であれば、﹁横長の顔﹂
﹁目は大きく垂れ目﹂などの抽象的な特徴量に変換する﹁抽象化﹂
という作業を行い、学習させる。設計者が工夫して抽象度を上げ
1
ることで、精度の高いシステムを構築することが可能となる。
case
用途によっても設定すべきルールは異なってくる。たとえば、
病理画像からガン細胞を検出するモデルを構築する場合、少しで
もガン細胞の疑いがあるものは見落としなく検出できるような
ルールを設けることが重要になる。仮にガン細胞以外の細胞を検
出したとしても、ガン細胞を見逃さないことが目的であるため、
形状が変化する細胞の同定・追跡
──再生する細胞の輪郭検出と追跡
ルール設定に問題はない。一方、群衆の中にいる男性と女性の数
を把握するというような目的の場合、男性・女性それぞれを認識
することが必要であるため、両者を同程度の精度で認識できるよ
うなルール設定が必要となる。
ン以外に適用でき
なくなる可能性が
あるなど、さじ加
減が難しい。用途
や目的、サンプル
データを考慮しな
がら、適切な画像
2
認識のアルゴリズ
ムを検討すること
が重要となる。
case
学習サンプルとなる画像は多いほうが望ましいが、学習させす
ぎてしまうと厳密なルールができあがってしまい、学習したパター
たとえば、
「○と×の2 つのデータに境界
線を引いて分類する」という課題があり、
データの分布にはずれ値が存在する場合
には、
さまざまな線の引き方が考えられる。
全てのデータを厳密に判別させるか(図
A)
、飛び出したデータは例外(ノイズ)で
あり無視してよいと判断させるか(図 B)
、
どちらのルールに基づいて線を引かせる
かを人間が決めて、コンピュータに学習さ
せる必要がある。
学習サンプルの量によってアルゴリズムを工夫
──欠陥検出
再生医療の研究・開発においては細胞画像の解析が不可
機械学習においては、学習サンプルが少ない場合は必然的に検出精度が
欠であり、形状が常に動きながら変化する細胞を3 次元物体
低くなり、逆に大量にある場合は計算時間が膨大になるなど、サンプルの量
として認識する必要がある。そこで、
「細胞らしい」輪郭とは
や質によって異なる課題が生じる。みずほ情報総研は、精密工学会が主催
何かをコンピュータに学習させ、自動的に認識・検出する仕組
する「外観検査アルゴリズムコンテスト」において、
学習サンプルの量に応じ
みを開発した。画像勾配のピーク点を輪郭の候補点として抽
たアルゴリズムの開発を行い、2 年連続最優秀賞を獲得した。
出し、どの候補点と候補点を結べば最も細胞らしい輪郭にな
2013 年のコンテストでは、わずか 5 枚の欠陥画像を基に、角度・サイズ・
るかを予測してつないでいく。隣り合う点同士のバランスだけ
位置等を微妙に変えた欠陥画像を擬似的に多数作成することで高精度な
ではなく、全体を通して細胞らしい形になるかを考えながら点
欠陥検出に成功した。一方、2014 年のコンテストでは欠陥画像が大量だっ
と点とを結んでいく必要があり、高度な判断がコンピュータに
たため、データ量を10 分の1以下
よって行われている。
に圧縮しながら高速かつ高精度に
機械学習できるアルゴリズムを開
発した。
用途に応じた学習モデルを構築
することにより、膨大な量の画像
データから対象物の検出、特定、カ
入力画像
勾配ピーク点の
抽出
輪郭検出
ウントや欠陥・異常の検出を行う
ことができ、医療、製造、インフラな
どの分野への適用が考えられる。
自動車鋳造部品の欠陥検出の例(上が正常部
品、
下が欠陥部品(赤枠が検出結果))
6
特集 ◆ 画像データ利活用の未来
次元画像と
2
3次元画像データの利活用
次元画像データが
大きく異なるのは、奥行き情報も把
3
握できるため、空間の把握が可能に
次元モデルを
3
な ど の RGB-D
な る こ と だ。 Kinect
カ メ ラ ︵ * ︶で 撮 影 し た 次 元 画 像
データを基に空間の
構築し、地図を作成することができ
れば、車いすが通れる道はどこかな
どの空間情報がわかる。車間距離や
物体との距離を把握する必要のある
自動車の自動運転にも、必須の技術
となるだろう。
カ メ ラ は、 セ ン サ ー が 照
RGB-D
射した電磁波が物体に当たって跳ね
返 っ て 戻 っ て く る ま で の 所 要 時 間、
あるいは照射した赤外線ランダムパ
ターンの投影位置から距離を計算す
次元計測センサーは高
る。測量や医療などの分野で使われ
る高精度な
価だが、ゲーム機のデバイスとして
が発売されたことにより安価
Kinect
カ メ ラ が 次 々 と 登 場 し、
RGB-D
画像データの撮影が容易になったこ
な
とで、さまざまな分野での利用や応
用が期待される。精度や実用性の向
上、 モ バ イ ル 機 器 へ の 搭 載 が 進 め
ば、利活用の流れは一気に加速する
1
だろう。
* RGB-D
カメラ⋮奥行きセンサーが搭載され
ており、カラー情報
︵ RGB
︶
に加えて奥行き情報
︵ Depth
︶を取得できるカメラ
case
3
3
3 次元画像上で加齢による変化を推定
──顔画像の加齢化シミュレーション
科学警察研究所(科警研)とみずほ情報総研が開発した顔画像の
る。世界でも類を見ないこのデータを基に、顔の特徴と加齢変化につ
加齢化シミュレーション技術(特許出願中)。科警研では、同一人物を
いて機械学習を行い、加齢による経年変化を推定するモデルを構築し
10 年単位で撮影した約 150人分の 3 次元顔画像データを保有してい
た。
また、3 次元顔画像データから作成したさまざまな角度の 2 次元顔
画像データを組み合わせて機械学習を行い、3 次元顔画像と2 次元
顔画像の関連性やルールをコンピュータに覚えさせることで、2 次元の
顔画像から 3 次元の顔画像を推測する仕組みも開発している。実際
のケースでは手配写真などは 2 次元の画像であるため、写真画像を3
次元化して加齢化推定を行い、さまざまな角度から見た加齢画像を推
定するシステムの開発が計画されている。2 次元画像データを3 次元
入力画像(30 歳)
case
3
加齢推定(40 歳)
加齢推定(45 歳)
低解像度の画像から高解像度画像を再現
──画像超解像技術
画像データに変換する手法は、今後さらにニーズが高まるだろう。
る。その組み合わせをコンピュータに学習させることで、両画像の関連
性や法則を考えさせ、推論モデルを構築させる。これによって、正解画
みずほ情報総研では、1枚の低解像度の画像から、従来技術より高
像に限りなく近い画像を復元することができる。
精細な高解像度画像を生成する単画像超解像技術を開発(特許出願
同技術の適用によって、携帯電話で撮影された写真の高画質化や監
中)。たとえば、高解像度の顔画像データを集め、低解像度の画像に加
視カメラ映像の鮮明化、また、DVD や地上デジタル放送の映像を高精
工して、同じ顔画像で解像度の高い画像と低い画像の組み合わせを作
細化して4Kテレビに表示することが可能になる。
入力画像
7
入力画像(拡大)
超解像結果
低解像度の写真は拡大すると画像が
粗く、ぼやけてしまう
コンピュータが学習結果から推定し、
画質の粗さを自動修復して復元
N av i s 0 2 7 – J u l y 2 0 1 5
正解画像