高音質をそのままに小型音声合成エンジン

機器組込み用音声合成ライブラリ
高音質をそのままに小型音声合成エンジン
製品概要
Linux、Android、iPhone、iPad 等の組込み用
OSで、高品質な音声合成を実現する、機器組
み込み向け音声合成エンジンです。
動作環境
OS
CPU
Windows CE
iOS5 以上
Linux
Android ver2.2 以上
日本語解析
あり ※1
なし
あり ※1
なし
ARM11
512MHz 以上
ARM11
512MHz 以上
ARM9
400MHz 以上
ARM9
100MHz 以上
なし
あり ※1
iphone3GS,iphone4,iphone4S,ipad,ipad2
あり ※1
なし
未定
未定
メモリ
(RAM)
通常版
ワークエリア
40MB 以上
(1 話者の場合)
話者 1 名の追加につき
約 5MB 追加
ワークエリア
ワークエリア
26MB 以上
40MB 以上
(1 話者の場合)
(1 話者の場合)
話者 1 名の追加につき 話者 1 名の追加につき
約 5MB 追加
約 5MB 追加
ワークエリア
ワークエリア
ワークエリア
26MB 以上
40MB 以上
26MB 以上
(1 話者の場合)
(1 話者の場合)
(1 話者の場合)
話者 1 名の追加につき 話者 1 名の追加につき 話者 1 名の追加につき
約 5MB 追加
約 5MB 追加
約 5MB 追加
未定
未定
メモリ
(RAM)
コンパクト版
ワークエリア
30~35MB 以上
(1 話者の場合)
話者 1 名の追加につき
約 1.5MB 追加
ワークエリア
ワークエリア
24MB 以上
30~35MB 以上
(1 話者の場合)
(1 話者の場合)
話者 1 名の追加につき 話者 1 名の追加につき
約 1.5MB 追加
約 1.5MB 追加
ワークエリア
ワークエリア
ワークエリア
19~24MB 以上
30~35MB 以上
19~24MB 以上
(1 話者の場合)
(1 話者の場合)
(1 話者の場合)
話者 1 名の追加につき 話者 1 名の追加につき 話者 1 名の追加につき
約 1.5MB 追加
約 1.5MB 追加
約 1.5MB 追加
未定
未定
データサイズ
(ROM)
通常版
日本語辞書:11.6MB
プログラム:1.2MB
音声辞書:40MB
話者 1 名の追加につき
約 40MB 追加
日本語辞書:なし
日本語辞書:11.6MB
プログラム:0.8MB
プログラム:2.2MB
音声辞書:40MB
音声辞書:40MB
話者 1 名の追加につき 話者 1 名の追加につき
約 40MB 追加
約 40MB 追加
日本語辞書:なし
日本語辞書:11.6MB
日本語辞書:なし
プログラム:1.6MB
プログラム:1.0MB
プログラム:0.8MB
音声辞書:40MB
音声辞書:40MB
音声辞書:40MB
話者 1 名の追加につき 話者 1 名の追加につき 話者 1 名の追加につき
約 40MB 追加
約 40MB 追加
約 40MB 追加
未定
未定
データサイズ
(ROM)
コンパクト版
日本語辞書:4.2MB
プログラム:1.2MB
音声辞書:10MB
話者 1 名の追加につき
約 10MB 追加
日本語辞書:なし
日本語辞書:4.2MB
プログラム:0.8MB
プログラム:2.2MB
音声辞書:10MB
音声辞書:10MB
話者 1 名の追加につき 話者 1 名の追加につき
約 10MB 追加
約 10MB 追加
日本語辞書:なし
日本語辞書:4.2MB
日本語辞書:なし
プログラム:1.6MB
プログラム:1.0MB
プログラム:0.8MB
音声辞書:10MB
音声辞書:10MB
音声辞書:10MB
話者 1 名の追加につき 話者 1 名の追加につき 話者 1 名の追加につき
約 10MB 追加
約 10MB 追加
約 10MB 追加
ファイルフォーマット
16KHz 16bit Linear PCM モノラル
16KHz 16bit Linear PCM モノラル
16KHz 16bit Linear PCM モノラル
16KHz 16bit Linear PCM モノラル
※1:日本語解析エンジンには、Berkeley Software Distribution License(BSD)ライセンスに基づいてライセンスされているソフトウェア(Chasen)を使用しています。
※2:RAM のワークエリアはネイティブ領域の値です。
※Android 版では、Boris Fomitchev ライセンスでに基づいてライセンスされてい るソフトウェア(Stlport)を使用しています。
※付属ツール(日本語解析あり向け)の音声確認ツール「microAITalkClient」は Windows 版向けツールのみのご提供となります
主な機能
構成図
人の声をベースとした高品質音声合成
さまざまな機器への組込みが可能な低容量・低リソース
入力は 漢字かな交じり日本語テキスト及び
、
、
中間表 (AI 独自規格 JEITA TT-6004 規格 に対応
記
、
)
多彩な OS 向けにポーティング可能
音声データベース
API 処理イメージ
開
始
ユーザー辞書機能
ABC
組込み用音声合成ライブラリ
例えば、こんなシーンでご利用いただけます。
放送設備への組込み
駅や商業施設等の館内放送シ
ステムや、工場や倉庫内の自
動アラートシステム、遠隔操
作や自動 放送が可 能な防災
無線システム等、様々な放送
機器への組込みが可能です。
音声出力
AITalk.dll を組み込んだ
アプリケーション
(C 、VC++、C#、VB 等で開発)
テキスト
初
期
化
話
者
設
定
音
声
合
成
終
了
処
理
終
了
なら、
タブレット、スマーフォン、
電子ブックリーダー等の機器への組込み
スマートフォンや電子ブック
リーダーで、電子書籍や新聞
等のテキスト情報を音声で楽
しむことができるようになりま
す。