SkypeAPIを用いた 音声認識通話システム 情報理工学部情報システム工学科 ラシキア研究室 4年 H107022 岡田貴大 目次 1. 2. 3. 4. 5. 6. 7. 8. 研究背景,研究目的 開発環境 Skypeとは 使用したAPIについて システムの現状 アプリケーションの流れ 音声認識辞書機能の効果 今後の課題 研究背景、研究目的 1. 研究背景 1. 近年携帯電話も無料で通話することが可能に!! → しかし、オプション料等が必要 2. Skypeならネット環境のあるPC+マイクがあれば 24時間いつでも無料でSkypeで通話が可能 2. 研究目的 1. Skypeで通話する際PCをマウス等で操作する必要がある 2. 本研究では音声認識によりマイクからの音声で Skypeで通話操作を可能にすることを目的にしている 開発環境 1. 使用OS 2. 使用言語 3. 使用ツール 4. 使用ライブラリ : windows7 Professional : Visual C# : VisualStudio2010 (Professional Edision) : Skype4COM (SkypeAPI) : iTunesLib (iTunesAPI) Skypeとは 1. 世界中どこへでもIP電話を利用して無料コール が楽しめる、操作が簡単なフリーソフトウェア 2. ルクセンブルグに籍を置く SkypeTechnologies 社のソフトウェア 3. Skype同士の通話はいくら通話しても、 国境を跨いでも通話料金が0円 使用したAPIについて 1. SkypeAPI スカイプ社が提供するSkypeを外部アプリケー ションから利用するための仕組み 2. iTunesAPI プログラムからiTunesを操作可能にする仕組み システムの現状 主な機能 1. 2. 3. 4. 5. 6. 7. Skypeによる通話機能、切断機能 自分の状態の変更、取得 コンタクトリストの状況取得 iTunesの再生停止、音量変更、曲変更 iTunesの音楽情報をムードボックスに表示 音声認識によるSkypeの通話機能、終話機能 辞書機能による音声認識の精度向上 アプリケーションの流れ 研究ソフト MicroSoft 音声認識8.0 音声を入力 音声認識を行う iTunes 音声認識用 辞書機能 Skype 辞書に登録されて いる語句と照合 照合した名前で登録さ れている人にCallする コマンドを受けることでiTunesで 再生、停止、早送り、巻き戻し シャッフル、ランダムを行う デモンストレーション 音声認識辞書機能の効果 ゼミ生9人の名前を辞書機能(有、無)で実験 1. 辞書機能あり 全員の名前を入力した通り認識(認識率100%) 2. 辞書機能なし 以下の名前で誤認識(認識率56%) 安藤→&う 佐藤→砂糖 神谷→かみ合 田中→った中 今後の課題 音声認識率を上げるために形態素解析の導入 UIの強化 以上で発表を終わります ご静聴ありがとうございました
© Copyright 2024 Paperzz