SkypeAPIを用いた 音声認識通話システム

SkypeAPIを用いた
音声認識通話システム
情報理工学部情報システム工学科
ラシキア研究室 4年
H107022 岡田貴大
目次
1.
2.
3.
4.
5.
6.
7.
8.
研究背景,研究目的
開発環境
Skypeとは
使用したAPIについて
システムの現状
アプリケーションの流れ
音声認識辞書機能の効果
今後の課題
研究背景、研究目的
1. 研究背景
1. 近年携帯電話も無料で通話することが可能に!!
→ しかし、オプション料等が必要
2. Skypeならネット環境のあるPC+マイクがあれば
24時間いつでも無料でSkypeで通話が可能
2. 研究目的
1. Skypeで通話する際PCをマウス等で操作する必要がある
2. 本研究では音声認識によりマイクからの音声で
Skypeで通話操作を可能にすることを目的にしている
開発環境
1. 使用OS
2. 使用言語
3. 使用ツール
4. 使用ライブラリ
: windows7 Professional
: Visual C#
: VisualStudio2010
(Professional Edision)
: Skype4COM (SkypeAPI)
: iTunesLib (iTunesAPI)
Skypeとは
1. 世界中どこへでもIP電話を利用して無料コール
が楽しめる、操作が簡単なフリーソフトウェア
2. ルクセンブルグに籍を置く SkypeTechnologies
社のソフトウェア
3. Skype同士の通話はいくら通話しても、
国境を跨いでも通話料金が0円
使用したAPIについて
1. SkypeAPI
スカイプ社が提供するSkypeを外部アプリケー
ションから利用するための仕組み
2. iTunesAPI
プログラムからiTunesを操作可能にする仕組み
システムの現状
 主な機能
1.
2.
3.
4.
5.
6.
7.
Skypeによる通話機能、切断機能
自分の状態の変更、取得
コンタクトリストの状況取得
iTunesの再生停止、音量変更、曲変更
iTunesの音楽情報をムードボックスに表示
音声認識によるSkypeの通話機能、終話機能
辞書機能による音声認識の精度向上
アプリケーションの流れ
研究ソフト
MicroSoft
音声認識8.0
音声を入力
音声認識を行う
iTunes
音声認識用
辞書機能
Skype
辞書に登録されて
いる語句と照合
照合した名前で登録さ
れている人にCallする
コマンドを受けることでiTunesで
再生、停止、早送り、巻き戻し
シャッフル、ランダムを行う
デモンストレーション
音声認識辞書機能の効果
 ゼミ生9人の名前を辞書機能(有、無)で実験
1. 辞書機能あり
全員の名前を入力した通り認識(認識率100%)
2. 辞書機能なし
以下の名前で誤認識(認識率56%)
安藤→&う 佐藤→砂糖 神谷→かみ合
田中→った中
今後の課題
 音声認識率を上げるために形態素解析の導入
 UIの強化
以上で発表を終わります
ご静聴ありがとうございました