OCR機能を搭載した 「iPhone」アプリの開発

2013年度
情報教育コース
卒業研究
構想発表
OCR機能を搭載した
「iPhone」アプリの開発
所 属 : 仲野研究室
指導教員: 仲野誠
発 表 者: 神夏子
目次
§1 開発動機
§2 OCR
■OCRとは
■日本語対応のOCRエンジン
■インストール
■テスト
■TesseractとNhocrの比較
§3 今後の課題とスケジュール
・開発環境
・参考サイト
§1
はじめに
■研究動機
OCR機能が搭載されたアプリをよく目にする…
OCRについて
学びたい!!!
OCR機能を使って
何か便利なアプリを
自分でつくってみたい!
名刺認識管理アプリ,手書きメモ認識アプリ,
レシート認識家計簿アプリetc…
■アプリ内容について、、、
手書き文字認識のメモ帳アプリ
画像文字認識の家計簿アプリ
・既に同じ機能がついたアプリが存在していた
・OCRエンジンがどの程度認識するのかわからなかった
OCRエンジンの
テスト
アプリ内容の決定
§2
OCR
■OCR( Optical Character Recognition )とは
画像情報
・光学的に読み取り
・前もって記憶された
パターンと照合
文字データ
※OCR(Optical Character Recognition)の機能を備えた装置
→OCR(Optical Character Reader)
■日本語対応のOCRエンジン
Tesseract-OCR
・1984年~1994年Hewlerr Packardにて研究開発
・2005年オープンソース化
・現在はgoogleがスポンサー
・認識可能言語は日本語含む30カ国語以上
NHocr
・東北大学、サイバーサイエンスセンターの
後藤研究室にてweekend projectとして開発されてい
るフリーのエンジン
■Tesseractのインストール
パッケージ管理システム
homebrew
いくつかの
エラー
Tesseractをインストール
解決法
・libtoolsをインストールしておく
・XcodeでCのコンパイラをインストールしておく
■NHocrのインストール
nhocr
Makecharフォルダ
一緒にインストール
エラー
O2-tools
■NHocrのインストール
・ファイル形式
.ppm
.pgm
.pbm
ファイル形式
変換ソフトウェア
.jpg
Tesseract-OCR
■英文でのテスト
誤認識は赤下線の部分のみ
認識率は約98%
NHocr
■英文でのテスト
日本語限定対応のため、
日本語が混ざる。
認識率は約70%
■日本語でのテスト
短い文章の
ひらがな、カタカナ
長い文章の縦書き
■日本語でのテスト
認識は誤りだらけだが、
縦書きを自動で横書きに
してくれる
認識率は約65%
Tesseract-OCR
〜長い文章〜
■日本語でのテスト
NHocr
〜長い文章〜
縦書きはほぼ認識しない。
■日本語でのテスト
Tesseract-OCR
〜短い文章〜
認識率は約60%
■日本語でのテスト
NHocr
〜短い文章〜
認識率は約82%
■日本語でのテスト
Tesseract-OCR
〜レシート〜
(数字と文字の
組み合わせ)
認識率は約62%
フォントや大きさが違っても
読み取る事ができる
■日本語でのテスト
認識
できない
NHocr
〜レシート〜
(数字と文字の
組み合わせ)
認識率は約55%
フォントや大きさが違うと認識しない。
数字を認識しにくい。
■TesseractとNhocrの結果と比較
Tesseract
NHocr
英
語
・非常に高い認識率
日
本
語
・長文、短文ともに認識率は低い ・文字の大きさやフォントが違うと
認識しにくい
・大きさやフォントが異なる画像 ・縦書きの認識はほぼできない
でも認識できる
・長文の認識率は低い
・縦書きを横書きとして変換でき
る
・短文の認識率は非常に高い
OCRops
・認識率が低い
・英文を日本語として認識する場合
がある
認識率が上がる
§3 今後の課題とスケジュール
7月
・OCRopusの検討
・アプリ内容の検討・決定
8月
・Objective-Cの学習
・OCRエンジンをiOS SDKで
コンパイル
9月〜ドイツへ留学
・Objective-Cの学習
・Xcodeの学習
・機能の検討
(留学先が情報分野に特化した
大学の為,引き続き学習を続け
る。)
・開発環境
OS
使用言語
開発ツール
OCRエンジン
Mac OS X 10.7
Objective-C
Xcode 4.6
未決定
・参考サイト
・NHocr
http://code.google.com/p/nhocr/
・Tesseract-OCR
http://code.google.com/p/tesseract-ocr/
・拡張子辞典
http://www.7key.jp/data/ext_new/p/ppm.html
・画像
http://app-liv.jp/312391317/
http://app-liv.jp/338520753/
http://nochineta.net/weblog/archives/9591
http://www.jiyu-kobo.co.jp/ytl/ykyvm.html
http://www.field-works.co.jp/
・用語
http://www.sophia-it.com/content/OCR
http://matome.naver.jp/odai/2130267984478087401
http://www-al.nii.ac.jp/~kameda/blog/cmlog/0910211714.htm