VoiceXML関連無償開ツール のご紹介 日本アイ・ビー・エム CRMソリューション推進 村上 光 (C)Copyright IBM Japan 2002 開発ツール類 WebSphere Voice Server SDK 電話回線・電話機・サーバー等無しにPC上でVoiceXMLのアプリケー ションを模擬実行 WebSphere Voice Tool Kit VoiceXMLエディター、Grammarエディター、発音ビルダー 日本語マニュアル Reusable Dialog Component( 英語版) Subdialogs AlphaNumeric, Confirmation, Number,Street Type, Major City, Postal code, State, Card Type, Digit, Expiration date, etc... Templates Address, Credit Card Info, 日本語マニュアル VoiceXMLプログラマーズガイド Voice サーバーでのVXML1.0のインプリメンテーション (VXML仕様との差分のみ。仕様書そのものは含まれません) WVS管理者ガイド(CISCO) CICSO プラットフォーム(VoIPゲートウェイ)でのサーバーの管理者ガイド WVS管理者ガイド(Dialogic) Dialogic プラットフォーム(音声処理ボード)でのサーバーの管理者ガイド Speech technologies管理者ガイド スピーチテクノロジー(音声認識・合成API)の管理者ガイド Speech technologiesAPIリファレンス スピーチテクノロジーのAPIリファレンス WVS2.0 Implementation Guide(英語) Redbook: SEによるWebSphere Voice Serverの導入経験報告 Voice Toolkitの使用法はこの中にあります ダウンロード・サイト WebSphere Voice Server SDK 2.0 http://www.ibm.com/pvc/products/voice/voice_server_sdk.shtml SDK LauncherとJapanese Languageの2つのexeをダウンロードしてください。 exeを実行するとインストールパッケージが解凍されます。2つとも同じディレクトリに解 凍してください。 WebSphere Voice Toolkit 2.0 http://www.ibm.com/pvc/products/voice/voice_toolkit.shtml Red Book - IBM WebSphere Voice Server 2.0 Implementation Guide http://www.redbooks.ibm.com/pubs/pdfs/redbooks/sg246537.pdf Dialog Component http://www.ibm.com/pvc/products/voice/voice_server_sdk.shtml 日本語マニュアルのダウンロード 1. Browser から http://www.ibm.com/shop/publications/order へアクセス します。 2. "Select a country to begin" で "Japan" を選択し、"Go" をクリックしま す。 3. 次のページの上部にある "Search for Publications" をクリックします。 4. "Quick Publications Center search" ページの真中の "Publication number のボックスに、日本語の資料番号10桁 (XXXX-XXXX-XX の形 式) を入力し、下にある "Go" をクリックします。 VoiceXML プログラマーズ・ガイド GB88-8602-00 Voice Server, Use with Cisco 管理者ガイド GB88-8603-00 Voice Server, Use with Intel Dialogic 管理者ガイド GB88-8604-00 Voice Server, Speech Technologies 管理者ガイド GB88-8605-00 Voice Server, Speech Technologies APIリファレンス GB88-8606-00 5. 検索結果の一番右側の "Download" のカラムにある青い下向き矢印を クリックします。 注意事項 SDKのご使用に当たってのご注意 WVS SDK 2.0はVoiceXML 1.0 に準拠しています。 SDKはVoiceXMLのプログラミングのためのツールです。音声認識や音声合成の性能 は(電話環境で使用する)製品版と異なることがあります。 音声合成は基本ライセンスで提供される規則音声合成のみ使用できます。(より人間 の声に近い)連結方式音声合成は使用できません。また、男声成人のみ使用できま す。声の調子は変えられません。 認識率を上げるためのヒント 内部ノイズの少ないPCを選んでください。 Notebookはあまりお勧めできません。 ノイズに強いマイクをご使用ください。 ANDREA NC-60などがお勧めです。 インストールの注意点 SDKはデスクトップ版のViaVoiceとは共存できません。 SDK,Toolkitのインストールは以下の順序でおこないます。 1. Java Runtime Environmentの導入 WVSSDKの ¥install¥jre131¥j2re-1_3_1-win-i.exe を実行します。 2. SDKの導入 WVSSDKの setup.exe を実行します。 導入後にスピーカーとマイクの調整を行います。 スタート・メニューからプログラム->IBM WebSphere Voice Server SDK -> Audio Setup-Japaneseを実行します。 3. VoiceToolkitの導入 VoiceToolkitSetup.exe を実行します。 VoiceToolkitの使用法 設定 プロジェクトの作成 VoiceXMLファイルの作成 グラマーファイルの作成とテスト 発音の定義 オーディオ・ プロンプトの作成 VoiceToolkitの使用法 設定 VoiceToolKitのメニューでWindow->Preferenceを選ぶと設定画 面が現れる。 Voice Toolkit の画面でVoice LanguageがJapaneseになって いることを確認する。 VoiceXMLの編集画面で日本語がうまく表示されない場合は、 WorkbenchのForntsで( たとえばText Fontで) Use System Font ボタンをおすことで日本語が出る。( ????表示が読 めるようになる。) VoiceToolkitの使用法 プロジェクトの作成 1. メニューからFile->New->Projectでウィザードを開く 2. Voice Toolkit->Voice Projectで新しいVoiceXMLプロジェクトに 名前をつける。 3. 他のプロジェクトのリソースを参照( Reference)することもでき る。 VoiceToolkitの使用法 VoiceXMLファイルの作成 1. メニューからFile->New->VoiceXMLファイルを選択 2. プロジェクト・ フォルダーを選びVoiceXMLファイルの名前を付 けると、VoiceXMLエディターが開く。 3. テキスト中にカーソルを置いてCtrl+Spaceを押すと、そこで可 能なでコマンドのリストが出る。( コンテント・ アシスト) 4. VoiceXMLの仕様が知りたい時はHelpのRelated Documentを 参照する。( 仕様書は英語) VoiceToolkitの使用法 テスト/デバッグ ソースの保存 1. File->Save All このときエラーがあると、ソース上にマークがつく。 テキスト・ モードのテスト/デバッグ 1. Run-> Run In Text Mode / Debug in Text Mode 2. WVSSDKが起動する。プロンプトは画面から出力される。認識させたい 言葉はキーボードから入力する。 オーディオ・ モードのテスト 1. Run-> Run In Audio Mode / Debug in Audio Mode 2. WVSSDKが起動する。プロンプトはスピ−カーから出力される。認識さ せたい言葉はマイクに向かって喋る。 VoiceToolkitの使用法 グラマー・ファイルの作成とテスト メニューからFile->New->JSGF Grammar File (SRCL Grammar File)を選択 プロジェクト・フォルダーを選びVoiceXMLファイルの名前を付けると、 Grammarエディターが開く。 Run->Test GrammarでGrammar Test Toolが起動する。 マイクの形のアイコンをクリックするとオーディオ・モードとテキスト・モードが 切り替わる。 オーディオ・モードではマイクに喋った声が照合される。 テキストモードでは画面またはファイルから入力したテキストが照合され る。 単語は半角のブランクで区切る必要がある。 Enumerateボタンを押すと、Grammarに合致する文がランダムに生成され る。 VoiceToolkitの使用法 発音の定義 Pronounciation->Compose PronounciationでPronounciation Builderを起動する。 Wordに対して「 かな」 でSound-Like Pronounciationを定義す る。 <ibmlexicon>タグ( 独自タグ) が生成されて、VoiceXMLファイル 中に埋め込まれる。 <ibmlexicon> <word spelling="上海" sound-like"しゃんはい"/> </ibmlexicon> 別法: プール・ ファイル( WVS独自のリソース) に発音を保存す る。 File->New->Pronounciationで"Pronounciation"を指定してPronouciation Builderを起動する。 VoiceToolkitの使用法 オーディオ・プロンプトの作成 メニューからFile->New->Audio Fileを選択 プロジェクト・フォルダーを選びAudio Fileの名前を付けると、Audio Recorderが開く。 録音開始/停止ボタンを使ってマイクからの声を録音する。 VoiceXML上で録音したファイルのURIを指定する。 <audio src="ファイル名"> テキスト・モードでテストする時には音声が聞こえないので、デフォルト・テ キストを<audio>タグで指定できる。 <audio src="ファイル名">表示されるテキスト</audio> 注意:Audio Recorderは簡易的なものなので、本格的に録音を使用する時 には Coolwave, Goldedit, Soundforge等の専門的な音声エディターの使用 をお勧めします。 付録:開発者用ツールCDについて WVS SDK, Voice Toolkit, 日本語マニュアルのダウンロード版 を集めたものです。 Reusable Dialog Componetsは納められていません。 Windows2000で稼動します。 保証は一切ありません。 初期画面から日本語マニュアルへのリンクが間違っています。日本語マ ニュアルはエクスプローラーから起動してください。
© Copyright 2024 Paperzz