VoiceXML関連無償開ツール のご紹介

VoiceXML関連無償開ツール
のご紹介
日本アイ・ビー・エム
CRMソリューション推進
村上 光
(C)Copyright IBM Japan 2002
開発ツール類
WebSphere Voice Server SDK
電話回線・電話機・サーバー等無しにPC上でVoiceXMLのアプリケー
ションを模擬実行
WebSphere Voice Tool Kit
VoiceXMLエディター、Grammarエディター、発音ビルダー
日本語マニュアル
Reusable Dialog Component(
英語版)
Subdialogs
AlphaNumeric, Confirmation, Number,Street Type, Major City, Postal
code, State, Card Type, Digit, Expiration date, etc...
Templates
Address, Credit Card Info,
日本語マニュアル
VoiceXMLプログラマーズガイド
Voice サーバーでのVXML1.0のインプリメンテーション
(VXML仕様との差分のみ。仕様書そのものは含まれません)
WVS管理者ガイド(CISCO)
CICSO プラットフォーム(VoIPゲートウェイ)でのサーバーの管理者ガイド
WVS管理者ガイド(Dialogic)
Dialogic プラットフォーム(音声処理ボード)でのサーバーの管理者ガイド
Speech technologies管理者ガイド
スピーチテクノロジー(音声認識・合成API)の管理者ガイド
Speech technologiesAPIリファレンス
スピーチテクノロジーのAPIリファレンス
WVS2.0 Implementation Guide(英語)
Redbook:
SEによるWebSphere Voice Serverの導入経験報告
Voice Toolkitの使用法はこの中にあります
ダウンロード・サイト
WebSphere Voice Server SDK 2.0
http://www.ibm.com/pvc/products/voice/voice_server_sdk.shtml
SDK LauncherとJapanese Languageの2つのexeをダウンロードしてください。
exeを実行するとインストールパッケージが解凍されます。2つとも同じディレクトリに解
凍してください。
WebSphere Voice Toolkit 2.0
http://www.ibm.com/pvc/products/voice/voice_toolkit.shtml
Red Book - IBM WebSphere Voice Server 2.0 Implementation
Guide
http://www.redbooks.ibm.com/pubs/pdfs/redbooks/sg246537.pdf
Dialog Component
http://www.ibm.com/pvc/products/voice/voice_server_sdk.shtml
日本語マニュアルのダウンロード
1. Browser から http://www.ibm.com/shop/publications/order へアクセス
します。
2. "Select a country to begin" で "Japan" を選択し、"Go" をクリックしま
す。
3. 次のページの上部にある "Search for Publications" をクリックします。
4. "Quick Publications Center search" ページの真中の "Publication
number のボックスに、日本語の資料番号10桁 (XXXX-XXXX-XX の形
式) を入力し、下にある "Go" をクリックします。
VoiceXML プログラマーズ・ガイド
GB88-8602-00
Voice Server, Use with Cisco 管理者ガイド
GB88-8603-00
Voice Server, Use with Intel Dialogic 管理者ガイド
GB88-8604-00
Voice Server, Speech Technologies 管理者ガイド
GB88-8605-00
Voice Server, Speech Technologies APIリファレンス
GB88-8606-00
5. 検索結果の一番右側の "Download" のカラムにある青い下向き矢印を
クリックします。
注意事項
SDKのご使用に当たってのご注意
WVS SDK 2.0はVoiceXML 1.0 に準拠しています。
SDKはVoiceXMLのプログラミングのためのツールです。音声認識や音声合成の性能
は(電話環境で使用する)製品版と異なることがあります。
音声合成は基本ライセンスで提供される規則音声合成のみ使用できます。(より人間
の声に近い)連結方式音声合成は使用できません。また、男声成人のみ使用できま
す。声の調子は変えられません。
認識率を上げるためのヒント
内部ノイズの少ないPCを選んでください。 Notebookはあまりお勧めできません。
ノイズに強いマイクをご使用ください。 ANDREA NC-60などがお勧めです。
インストールの注意点
SDKはデスクトップ版のViaVoiceとは共存できません。
SDK,Toolkitのインストールは以下の順序でおこないます。
1. Java Runtime Environmentの導入
WVSSDKの ¥install¥jre131¥j2re-1_3_1-win-i.exe を実行します。
2. SDKの導入
WVSSDKの setup.exe を実行します。
導入後にスピーカーとマイクの調整を行います。
スタート・メニューからプログラム->IBM WebSphere Voice Server SDK -> Audio
Setup-Japaneseを実行します。
3. VoiceToolkitの導入
VoiceToolkitSetup.exe を実行します。
VoiceToolkitの使用法
設定
プロジェクトの作成
VoiceXMLファイルの作成
グラマーファイルの作成とテスト
発音の定義
オーディオ・
プロンプトの作成
VoiceToolkitの使用法
設定
VoiceToolKitのメニューでWindow->Preferenceを選ぶと設定画
面が現れる。
Voice Toolkit の画面でVoice LanguageがJapaneseになって
いることを確認する。
VoiceXMLの編集画面で日本語がうまく表示されない場合は、
WorkbenchのForntsで(
たとえばText Fontで)
Use System Font ボタンをおすことで日本語が出る。(
????表示が読
めるようになる。)
VoiceToolkitの使用法
プロジェクトの作成
1. メニューからFile->New->Projectでウィザードを開く
2. Voice Toolkit->Voice Projectで新しいVoiceXMLプロジェクトに
名前をつける。
3. 他のプロジェクトのリソースを参照(
Reference)することもでき
る。
VoiceToolkitの使用法
VoiceXMLファイルの作成
1. メニューからFile->New->VoiceXMLファイルを選択
2. プロジェクト・
フォルダーを選びVoiceXMLファイルの名前を付
けると、VoiceXMLエディターが開く。
3. テキスト中にカーソルを置いてCtrl+Spaceを押すと、そこで可
能なでコマンドのリストが出る。(
コンテント・
アシスト)
4. VoiceXMLの仕様が知りたい時はHelpのRelated Documentを
参照する。(
仕様書は英語)
VoiceToolkitの使用法
テスト/デバッグ
ソースの保存
1. File->Save All
このときエラーがあると、ソース上にマークがつく。
テキスト・
モードのテスト/デバッグ
1. Run-> Run In Text Mode / Debug in Text Mode
2. WVSSDKが起動する。プロンプトは画面から出力される。認識させたい
言葉はキーボードから入力する。
オーディオ・
モードのテスト
1. Run-> Run In Audio Mode / Debug in Audio Mode
2. WVSSDKが起動する。プロンプトはスピ−カーから出力される。認識さ
せたい言葉はマイクに向かって喋る。
VoiceToolkitの使用法
グラマー・ファイルの作成とテスト
メニューからFile->New->JSGF Grammar File (SRCL Grammar File)を選択
プロジェクト・フォルダーを選びVoiceXMLファイルの名前を付けると、
Grammarエディターが開く。
Run->Test GrammarでGrammar Test Toolが起動する。
マイクの形のアイコンをクリックするとオーディオ・モードとテキスト・モードが
切り替わる。
オーディオ・モードではマイクに喋った声が照合される。
テキストモードでは画面またはファイルから入力したテキストが照合され
る。
単語は半角のブランクで区切る必要がある。
Enumerateボタンを押すと、Grammarに合致する文がランダムに生成され
る。
VoiceToolkitの使用法
発音の定義
Pronounciation->Compose PronounciationでPronounciation Builderを起動する。
Wordに対して「
かな」
でSound-Like Pronounciationを定義す
る。
<ibmlexicon>タグ(
独自タグ)
が生成されて、VoiceXMLファイル
中に埋め込まれる。
<ibmlexicon>
<word spelling="上海" sound-like"しゃんはい"/>
</ibmlexicon>
別法:
プール・
ファイル(
WVS独自のリソース)
に発音を保存す
る。
File->New->Pronounciationで"Pronounciation"を指定してPronouciation
Builderを起動する。
VoiceToolkitの使用法
オーディオ・プロンプトの作成
メニューからFile->New->Audio Fileを選択
プロジェクト・フォルダーを選びAudio Fileの名前を付けると、Audio
Recorderが開く。
録音開始/停止ボタンを使ってマイクからの声を録音する。
VoiceXML上で録音したファイルのURIを指定する。
<audio src="ファイル名">
テキスト・モードでテストする時には音声が聞こえないので、デフォルト・テ
キストを<audio>タグで指定できる。
<audio src="ファイル名">表示されるテキスト</audio>
注意:Audio Recorderは簡易的なものなので、本格的に録音を使用する時
には Coolwave, Goldedit, Soundforge等の専門的な音声エディターの使用
をお勧めします。
付録:開発者用ツールCDについて
WVS SDK, Voice Toolkit, 日本語マニュアルのダウンロード版
を集めたものです。
Reusable Dialog Componetsは納められていません。
Windows2000で稼動します。
保証は一切ありません。
初期画面から日本語マニュアルへのリンクが間違っています。日本語マ
ニュアルはエクスプローラーから起動してください。