会社概要

音声アプリケーション開発会社の
VoiceXMLへの取り組み
2001年11月19日 シナプスフォン株式会社
代表取締役 吉田 創
Copy right 2001
Synapse Phone Inc.
会社概要
„
„
„
„
„
„
„
名 称 シナプスフォン株式会社
設立日 1999年11月24日
資本金 453,425,000円
所在地 東京都渋谷区桜丘町4−23渋谷桜丘ビル
役 員
代表取締役 吉田 創 取締役 玉置 真理 取締役
川合 アユム 取締役
江見 淳
取締役
美澤 臣一
取締役
石見 浩一
監査役
今泉 智幸
海外展開
Synapse Phone USA Inc. Synapse Phone Korea
事業内容
–
–
–
–
–
–
–
携帯電話機、簡易携帯電話機等の移動体通信機器及び携帯情報端末の企画及び設計
携帯電話機、簡易携帯電話機等の移動体通信機器及び携帯情報端末の製造
携帯電話機、簡易携帯電話機等の移動体通信機器及び携帯情報端末の販売
携帯電話機、簡易携帯電話機等の移動体通信機器及び携帯情報端末向けのインターネット並びに電
話回線を利用した各種情報提供サービス及びその企画
コンピューターソフトウェアの開発及び販売
情報提供サービス業
インターネットと電話を使った通信提供サービス事業。
1
シナプスフォンの事業
„ 音声アプリケーション開発事業
„ 音声サービス提供事業
„ 音声ASP事業
„ 保守メンテナンス請負事業
シナプスフォンの特徴
SPT
IVR
SERVER
閲覧
インデックス獲得
インデックス登録
PHONE
PHONE
ユーザーA
もしくは
SPT
SPT
直接通話
ユーザーB
ネットワークでインデックスを取得し、直接通信に切り替えるネットワーク構造
(1999
1999年に特許化)=目的に応じた通信手段の組み合わせ
年に特許化)=目的に応じた通信手段の組み合わせ
■インターネット上の情報(インデックス)を元に音声での接続が可能(マルチモーダル対応)
■電話番号がわからない者同士の新しい通話市場
■プライバシーをユーザーが管理
■音声通話のみならず、メールやチャット(データ通信)の利用促進
■迷惑メール、いたずら電話などの防止
■コンテンツサーバー・インターネットモード網にかかる負担が軽減
発呼者・受話者ともに相手方の電話番号がわかない状態での通話=SPT
発呼者・受話者ともに相手方の電話番号がわかない状態での通話=SPT(
SPT(Secured Phone To)
To)
2
シナプスフォンの
VXMLへの取り組み
„
IVR開発会社
– システム開発
• ウェブ(データ)と電話(音声)を融合したシステム
• 音声認識ソフトの導入
– 一般消費者向けのサービス提供
– 音声サービス会社向けASP及びOEM
„
VXMLの導入
– 2000年よりVXMLの調査開始
– 2001年夏よりVXML開発体制
なぜVXMLを導入したか?
3
過去の音声サービス
„ コマンド:DMTF
„ ガイダンス:録音メッセージ
„ インフラ:電話回線のみ
DMTF
録音メッセージ
提供可能なサービス
現在の音声サービス
„ コマンド:
DMTF、音声認識
„ ガイダンス:録音メッセージ、音声合成
„ インフラ:電話回線、インターネット、その他
DMTF・音声認識
録音メッセージ
音声合成
提供可能なサービス
4
過去のシステム構築
„ 開発言語:C++(ボードメーカー依存)
–
–
–
–
リソースの共有が難しい
インフラの知識が必要
開発担当者のスキルに完成度が左右される
開発期間が長い
現在のシステム構築
„ 開発言語:VXML、CGI
–
–
–
–
リソースの共有
インフラの知識が不用
チームでの開発が容易
開発期間の短縮
5
注目すべきポイント・効果
音声認識
音声合成
簡易な操作
動的な情報へのす
ばやい対応
VXML
VoIP
開発のスピード化
開発コストの低減
インフラの多様化
音声コンテンツの
多様化
注目すべきポイント・
効果(VXML)
„
開発期間の短縮
– 約3分の1の短縮(現在)
– 今後さらなる短縮が見こめる
– 開発費の削減
„
リソースの共有
– 過去の開発ソフトを流用しやすい。
– 他の開発者が作成したアプリケーションを参照しやす
い。
6
サービス提供までの流れ①
「提案」
„ インターネットと違い音声サービスに対す
る情報が少ない
インフラからビジネスモデルの提案
サービス提供までの流れ②
「サービス仕様」
1.トップより
„ ガイダンスフローの作成
– ボイスコンテンツプロディーサー担当
– VUI(ボイスユーザーインターフェイス)
商品名をおっしゃってください。
商品名がわからない場合はヘルプとおっ
しゃってください。
商品名入力
• 聞きやすく、答えやすく、使いやすく
– 音声認識の効率アップ
– 録音音声と音声合成の使い分け
未入力/エラー3
回まで
ヘルプ
5.商品名案内【1】へ
(商品名)
申し訳ございません。認識できません
でした。もう一度
未入力/エラー4
回以上
7
サービス提供までの流れ③
「アプリケーション仕様設計」
„ 音声アプリケーション(VXML)設計
„ CGI設計
„ DB設計
サービス提供までの流れ④
「ハードウェア設計」
IP
Router
F/W
Webサーバー
Mailサーバー
Seg.A
音声認識サーバー
音声ファイル
サーバー
PSTN
VXML
インタープリター
音声合成サーバー
DBサーバー
*日本語版インタープリターの選択枠が少ない
8
サービス提供までの流れ⑤
「開発」
„ VXML
„ CGI
– ウェブアプリケーション開発者担当
„ 辞書
– 入力される可能性のものをVUIと合わせ作成
– 地道で地味な作業
サービス提供までの流れ⑤
「音声制作」
„ ボイスコンテンツプロディーサー担当
– ラジオ番組制作+音声応答のスキル
„ ガイダンス録音
„ 効果音作成
– BGM等含めユーザーがわかりやすく
„ 音声編集
– 克舌エフェクター等
9
サービス提供までの流れ⑥
「テスト⇒完成」
サービス提供後
「サポート・メンテナンス」
„ サービスの入れ替え
– VXMLファイルの差し替え
– サービスを止めることなく対応
„ サポート
– 自動検知システム(電話回線・インターネット)
– 24時間対応
10
音声市場の広がり
日本市場の問題点
„ 音声サービス市場が小さい
„ ウェブにアクセス可能な携帯端末の普及
が先行している
„ 音声認識・合成を使ったサービスモデルが
少ない
11
日本と先行する米国との違い
„
社会的バックグラウンドの違い
– 交通手段 日本(電車) 米国(車)
– 音声サービスの普及 日本<米国
– インターネット対応携帯端末の普及 日本>米国
„
市場規模の違い
– 米国10に対して、日本1
– IVR、ボイスメールの普及
– コールセンターの普及
„
通話料の違い
– フラットレートの採用
米国における音声サービス
„
一般向け情報サービス(音声ポータル)
• キャリアーブランド
– 月額利用料・通話料
• コンテンツプロバイダーブランド
– 月額利用料・通話料キックバック
• 音声ポータル提供会社ブランド
– 月額利用料・通話料キックバック
„
一般企業のサービス
• カスタマーサポート
• 情報提供(アンケート・資料請求)
• Voice EC
日本でも提供できるサービスの鍵
12
日本における音声サービスの鍵
„
マルチモーダル
– 音声とデータの同時サービス
⇒インターネット対応携帯端末との融合等
„
入力ツール
– 複雑なキーボードや携帯電話のキー操作
⇒簡単な音声入力
„
音声ならではのサービス
– 生の人間の声 ニュアンスが伝わり易い
日本における音声サービス
„ 皆さんのアイデアで!
13
音声市場のビジネスモデル
„ リソース集中型から
特性を活かした分業体制へ
サービス(運用)
コンテンツ
今まで
コールフロー
ボード依存のアプリケーション
辞書開発
音声合成
ソフト
音声処理ボード
音声認識
ソフト
音声アプリケーション
開発会社の担当範囲
プラットフォーム
インフラ
米国における業界の変化
„
過去3年で数十社の音声ポータル開発、
サービス提供会社の乱立
買収、合併、ビジネスモデルの変更
„
„
音声ポータルはキャリアーのサービスへ
音声ポータル開発会社はASP事業もしくは、技
術提供会社へ
14
これからの
音声市場のビジネスモデル
サービス
コンテンツ
VUI制作(デザイン)
ソフト開発(VXML)
VXMLインタープリター
音声合成
ソフト
辞書開発
音声認識
ソフト
音声処理ボード・ゲートウェイ
プラットフォーム
インフラ
音声アプリケーション開
発会社の担当範囲
(シナプスフォンの場合)
これからの
音声市場のビジネスモデル
„
サービス提供会社(一般企業等)
– 音声サービスの提供
– VXMLにより開発会社に頼らずに自社で運用可能
„
コンテンツ提供会社(コンテンツプロバイダー)
– コンテンツの提供
– ウェブページ(文字)と同じ情報を音声でも提供可能
„
VUI制作(デザイン)会社
– 音声フロー、ガイダンス原稿の制作
– 音声の録音、編集
– インタラクティブな自動音声応答のインターフェイス制
作
15
これからの
音声市場のビジネスモデル
„
ソフト開発(VXML)会社
– ソフトウェアの開発・販売
„
辞書開発会社
– 検索エンジンの提供
– 迅速な情報のアップデート
– 言語学の知識を持ち合わせ、音声認識率の向上を計
る
„
VXMLインタープリター開発会社
– インタープリターの開発・販売
– 独自タグを含め、サービス範囲が広がるソフトの提供
これからの
音声市場のビジネスモデル
„
音声合成ソフト
– 音声合成ソフトの開発・販売
– 自然な音声合成へ
„
音声認識ソフト開発会社
– 音声認識ソフトの開発・販売
– より自然な言語認識へ
„
音声処理ボード・ゲートウェイ
– ハードの販売
– 新しいインフラへの対応
16
これからの
音声市場のビジネスモデル
„
プラットフォーム提供会社
– プラットフォームの開発・販売
– 24時間運用可能なプラットフォームの提供
– リダンダンシー
„
インフラ提供会社(通信事業者)
– インフラの提供
– ネットワークIVRサービス
VXMLがもたらす
音声市場の広がり
„
簡単な開発
開発コストの低下
„
音声系以外の事業者の市場への参入
„
音声サービスの普及
事業の分業化
„
„
„ 音声市場の発展!
17
米国市場の展望
„ 米Datacom
Research社
– 音声ポータルおよび音声対応Webサイトは,従来の音声通信の世界に新風を吹
き込む。インターネット・ベースの電子商取引や顧客関係管理ソリューションを開
発するベンチャー企業を続々と生み出すだろう。インターネットと電話機を結ぶツー
ルとなるのがVxML(voice extensible markup language:音声拡張マークアップ言
語)である
– 電話システム,サポート要員,トレーニング要員,および音声対応の各種施設へ
の企業投資は,Voice ASPにより大幅に軽減されるだろう。Voice ASPは現在の
対話型音声応答(IVR: Interactive Voice Response)アプリケーションを次第に吸
収して行くだろう
– 音声ポータルは,モバイル・ユーザーに対する重要な情報源となって行くだろう。
新しい音声サービスはマイクロブラウザの機能を補足し,小さな携帯型デバイス
へのデータの送受信を補助する。
– 2005年度の音声認識などの新しい技術を使った音声システム市場は50
億ドルに達するだろう。
米国市場の展望
„ 米Cahners
In-Stat Group
– 音声認識ソフトウエア・エンジンの2005年における売上高は27億ドルに達する見
込みである。
18