Fluent Soft™ Technology

Fluent Soft™ Technology
音声認識システムソフトウェア
●最大5万ワード迄の認識
センサリ社 Fluent Soft™は最大5万語(通常 2 万語)を認識することのできる音声認識ソフトウェアエンジンです。
自然なマンマシン・インターフェースの為に開発されたものでこの Fluent Soft™はワードスポッティングやフレーズス
ポッティングに対応したもので命令するときに単語単位での認識を必要としません。
この Fluent Soft™は不特定話者音声認識(Speaker Independent)を利用し、さまざまな発声アクセント、またノイズ
環境でも利用できる様に作られています。不特定話者技術を利用しているので、ユーザーが認識語 を登録する必
要はありません。また高速数値認識エコーキャンセルを利用することでより高い認識を行う事ができます。
●認識辞書を簡単に作成
この Fluent Soft™は文字(テキスト)情報とデータベース情報から新たな認識データをその場で作成することができ
ます。センサリ社の Fluent Soft™は複数の言語に対応しています。それはセンサリ社の音声認識エンジンのサイ
ズはスケーラブル(可変)でプロセッサ 性能とメモリーサイズにより最大5万語までの認識が可能です。
●高性能な音声認識技術をさまざまな分野へ
センサリ社の Fluent Soft™は組み込みDSPやマイクロプロセッサにて大容量単語認識を可能とする音声認識ソフ
トウェアです。Fluent Soft™の必要な演算性能は 50MIPs です。1000 ワードに対し、1MB 以下のメモリーしか必要と
しません。これ以上は1語当たり、250 バイトとなります。
●Text-to-Speech 音声合成機能
Fluent Animated Speech™に利用している、Text-to-Speech (Fluent Text-To-Speech™)音声合成機能を組み
込む事ができます。
アプリケーション
・ デジタルオーディオ機器(DVD プレイヤー、MP3 プレイヤーなど)
・ インターネット機器(検索システムなど)
・ 携帯機器(携帯電話、PDA など)
・ 自動車(ナビゲーション、カーオーディオ、電装機器など)
・ 医療機器
・ 工業機器
※ FluentSoft 認識、アニメーション、TTS のデモソフトを提供しています。ご希
望の方はお問い合わせください (右写真は携帯電話デモ機です)。
0604A
特
徴
・小さなシステムソフト
・大きな辞書に対応
・高認識率
技
術
・認識
Advanced Auditory Modeling
Hybrid HMM/Neural Net
Grammar Constrained Viterbi Search
・TTS(Text-to-Speech)
LPD Diphone Based Synthesis
仕
様
・辞書
: 50,000 ワード迄
(文字列からの不特定話者認識辞書生成方式)
※プラットフォーム性能により最大語数は制限されます。
・応用音声技術
: 不特定話者音声認識
ワードスポッティング、フレーズスポッティング、連続数字認識、
ノイズ、エコーキャンセル
・反応時間
: 設定可能
・排除レート
: 設定可能
・スケーラブル ROM
: 250KB ∼ 5MB
・スケーラブル RAM
: 8KB ∼ 1MB
・プロセッサ 速度
: 50 ∼ 100Mips
・対応OS
:SDK 対応:Windows®、Windows CE®、PocketPC®、Red Hat Linux®、
Monta Vista Linux®
開発中: Symbian®、VxWorks®、Solaris™、Digital Unix
(Platform supporting Gnu C++, MS Visual C++)
・対応プラットホーム
:SDK 対応:Intel®x86、StrongARM、XScale、ARM9x
対応可: ATT DSP3225-40MIPs、TexasInstruments®DSPs
Motorola®、PowerPCs and Siemens TriCore™、SH3、SH4
・対応言語
:SDK 対応:USEnglish、Castilian Spanish、German、Japanese、Korean
開発中: Italian、Portugesse、Mandarian、French
* 対応 OS,プラットホーム、言語は対応可能なもので移植開発を必要とするものも含まれます。SDK に対応して
いないものも含まれます。
* OS 及びプロセッサーは各メーカーの登録商標です。
0604A
Fl
uentSoft デモソフト
Fl
uentSoft 音声認識デモを体感していただくための Windows ベースのデモソフトを準備しております。簡易
NDA により無償提供しています(お問い合わせ先までご連絡ください)。
単語の入力
音素辞書は日本語 に対応しております。単語は日本語の場合、ロー
マにて入力することにより自由に追加することができます。
辞書は日本語、英語の切り替えが可能です。
図の例では電話、名前の2階層となっております。
アプリケーション設定
各認識結果に対し、アプリケーション を実行することができるように 準
備されています。
例えば、「メモ帳」と認識したら画面にメモ帳が現れる、「センサリーホ
ームページ」に対し、www.sensoryinc.com を開始するなどが 可能です
(動作に必要なアプリケーションがインストールされている必要があり
ます)。またシリアルポートへのデータ出力などができるため外部制
御が可能です。
プロパティ設定
アプリケーション 設定を行うためのプロパティを準備し
ています。
言語、認識手順、認識結果表示、階層などを設定でき
ます。
0604A
お問い合わせ:
Sensory, Inc.
センサリージャパン株式会社
575 N. Pastoria Avenue, Sunnyvale, CA 94085
〒241-0004 横浜市旭区中白根 1-26-28
Tel:1-408-625-3300/Fax:1-625-3350
Tel:045-958-1730/ Fax:045-958-1731
Email
: [email protected]
Email
: [email protected]
URL
: http://www.sensoryinc.com
URL
: http://www.sensory.co.jp
0604A