高品位合成音声編集ソフトウェア - 日立産業制御ソリューションズ

高品位合成音声編集ソフトウェア「美音工房 奏」
仕 様
合成音フォーマット
下記、
サンプリング周波数 量子化ビットのPCM モノラル音声
8kHz 16bit/11.025kHz 16bit/16kHz 16bit/22.05kHz 16bit
テキスト入力
読みの設定、効果音、背景音の挿入、文節の開始時間、再生時間表示
音声合成設定
音声合成パラメーター設定
(文章全体および文節単位)
・音声種類:女性/男性
・各種調節
[読み上げ速度、声の高さ、音量、声の抑揚、文末ポーズ長、
無音化]
発音の設定
フレーズの各種設定/アクセント区切り、
アクセント位置、
アクセントの立ち上がり 、
ポーズ 、濁音の有無、
無声音の有無、声の高さ、
声の早さ
テンプレート機能
テンプレートによる定型文の作成/新規テンプレートの作成
音声出力
音声ファイル
(wav形式)
の出力
その他
音声再生時間の測定/テキストエディタでの原稿表示/単語登録/テキスト読み設定/記号読み設定
高品位合成音声編集ソフトウェア
動作環境
ハードウェア
CPU…2GHzクラス以上推奨/メモリ…1GB以上/ディスク領域…1GB使用/グラフィックボード…16ビットカラー以上/
サウンドデバイス…既定の音声デバイス/LAN…認証用/USBポート…USBキー認証用
ソフトウェア
OS…Microsoft® Windows® 7 (32bitOS)
組込み用API「美音工房 DLL」
仕 様
関数
・音声合成初期化処理、音声合成終了処理、
・テキスト文章−WAVファイル変換処理
(スレッド固定)
・テキスト文章−WAVファイル変換処理
(スレッド指定)
・音種設定処理、速度設定処理、
ユーザー辞書読み込み処理
・ユーザー辞書登録修正処理、
ユーザー辞書削除処理
・ユーザー辞書 単語表記−WAVファイル変換処理
・ユーザー辞書 単語読み−WAVファイル変換処理
合成音出力形式(※)
モノラル音声 8kHz 16bit/11.025kHz 16bit/16kHz 16bit/22.05kHz 16bit
発音の設定(※)
音声の種類:女性/男性、読み上げ速度:
10段階設定、
声の高さ
:
10段階設定、
音量:
10段階設定、声の抑揚:
10段階設定、無音化:無音化する/しない、
文末ポーズ長:
10段階設定
(※)
環境設定ファイルに設定します。
動作環境
ハードウェア
CPU…インテル®Pentium® 4プロセッサ 2GHzクラス以上推奨
メモリ…512MB以上
ディスク領域…1GB以上
ソフトウェア
OS…Microsoft Windows 7 (32bitOS)
Windows アプリケーションプログラム開発環境…Microsoft Visual Studio®2005 推奨
(2008/2010)
開発言語 Visual C++®、Visual C#®、Visual Basic®.NET など
(提供サンプルプログラムはVisual C#で記述)
※動作において、下記を必要といたします。
・高品位合成音声編集ソフトウェア「美音工房 奏」…音声合成エンジン及び音源データは、
「美音工房」
(4.0.0以上)
、
「美音工房 奏」のものを使用してください。
・Microsoft Visual C++ 2005 再頒布パッケージ
(x86)
…美音工房DLL本体の実行に必要です。
・Microsoft .NET Framework Version 2.0 再頒布パッケージ
(x86)
…サンプルプログラムの実行に必要です。
・Windows Media® Player…サンプルプログラムにて、
変換した音声合成WAVファイルの試聴に必要です。
●美音工房、
奏は、株式会社
日立情報制御ソリューションズの登録商標です。
Studio、
Visual C++、
Visual C#、
Visual Basic、
Windows Mediaは、
米国Microsoft Corp.の米国およびその他の国における商標または登録商標です。
.NET は、
お客さま、情報、
システムおよびデバイスを繋ぐソフトウェアです。
●インテル、
Pentiumは、
米国およびその他の国におけるIntel Corp.またはその子会社の商標または登録商標です。
●その他記載の会社名、
製品名は、それぞれの会社の商標もしくは登録商標です。
●製品仕様は、
改良のため予告なく変更することがあります。
●本製品を輸出される場合には、
外国為替および外国貿易法ならびに米国の輸出管理関連法規などの規制をご確認のうえ、
必要な手続きをお取りください。
なお、
ご不明の場合は、
弊社担当営業にお問い合わせください。
●Microsoft、
Windows、Visual
●Microsoft
株式会社日立情報制御ソリューションズ
http://www.hitachi-ics.co.jp
営
北
東
茨
中
関
中
九
業 本
海道営業
北 営 業
城 支
部 支
西 支
国 営 業
州 営 業
部
所
所
店
店
店
所
所
〒110ー0006
〒060ー0003
〒980−0811
〒310ー0011
〒460ー8435
〒530ー8270
〒730ー0036
〒814ー0001
東京都台東区秋葉原6番1号(秋葉原大栄ビル)
(03)3251ー7200 (代)
北海道札幌市中央区北三条西4丁目1番地1(日本生命札幌ビル) (011)221ー1383 (代)
宮城県仙台市青葉区一番町四丁目1番25号(東ニ番丁スクエアビル)(022)266ー7240 (代)
茨城県水戸市三の丸一丁目4番73号
(水戸三井ビル) (029)221ー2770 (代)
愛知県名古屋市中区栄三丁目17番12号(大津通電気ビル) (052)259ー1241 (代)
大阪府大阪市北区中之島三丁目6番16号(関電ビル)
(06)6225ー6766 (代)
広島県広島市中区袋町5番25号(広島袋町ビル)
(082)248ー2838 (代)
福岡県福岡市早良区百道浜二丁目1番1号(日立九州ビル)
(092)844ー7636 (代)
E-026-p
環境に配慮した大豆油インキを使用しています
2013.3
Printed in Japan(ICC)
音声コンテンツ作成例
音声ガイド端末
アナウンスは、私達の生活におけるさまざまな場面で必要なものになっています。 日立情報制御ソリューションズは、人間の肉声に極めて近い品質の音声を、
システムへの組込み
ホームページの
音声ガイダンス
端末機器への組込み
「美音工房 奏」
操作端末
メモリカード
パソコン上で編集して、音声ファイルとして出力する環境をご提供します。
お客さまがアナウンス音声を必要とする
さまざまな場面でお役に立ちます
*本製品は、株式会社 日立製作所 中央研究所で開発された合成音声技術を使用しています。
館内放送のシステム構成例
「美音工房 奏」操作 兼 放送端末
高品位合成音を支える「美音工房 奏」の機能
放送装置
●テンプレートからできる音声データ
テンプレート機能により、音声データ項目をあらかじめ定義することができます。
音声データ項目は、
テキスト文、効果音、背景音で構成され、音声データは、
テンプレートを指定して
可変部だけ入力すれば簡単に作成することができます。
「美音工房 奏」
操作端末
プレゼンテーションの読み上げ
放送装置
館内放送
●発音のチューニング
文の発音をひらがなで表記し、
フレーズごとに声の高さや速さ、
アクセントなどを調整できます。
発音記号を直接修正することもできます。
単語登録
テンプレート編集では、
各項目の種類や編集
可否を定義します
本文入力画面では、定型文を構成する項目
ごとに、表題、内容を表示し、
「 編集可」の項
目を入力して音声データを作成します
音声データの出力形式を設定(発音の
バリエーション、
数字、記号の読み方など)
発音記号のテキスト文字列を直接編集して、
より細かい調整ができます
発音記号編集画面
●操作性の高い編集機能
テキスト編集画面では、
ワープロ感覚でテキストを入力し、文ごとに音声出力形式を設定したり、
チャイムやバックグラウンドミュージックなど、既成の音源をかけ合わせることができます。
テキスト途中からの再生確認など、
長文の編集にも対応しました。
●組込み用API「美音工房 DLL」
「美音工房 奏」
で適用されている高品位な合成音を、
お客さまの開発プログラムに
組込むことができるツールです。
イメージ図
漢字かな混じり文のTTS
(Text to Speech)
合成音声の組込みを実現するために、
必要最小限でわかりやすい関数を準備いたしました。
効果音、背景音の挿入では、
再生時間が指定できます
テキスト編集画面
文 の 出 力 形 式を設 定
(発音のバリエーション、
数字、
記号の読み方など)
▶3種の機能分類の関数
1.
初期化、終了機能:2関数
2.
音声合成機能:6関数 (ユーザー辞書試聴用2関数を含みます。)
3.
ユーザー辞書
(※)
編集機能:3関数
ユーザーアプリケーション
美音工房 奏
美音工房 DLL
音声合成エンジン
(※)
ユーザー辞書:固有名詞・略語・専門用語など、
文の読み始め時間、
再生時間が判ります
独自の読み方をさせたい単語を登録する辞書
『美音工房 DLL』
をご利用いただくためには、
『 美音工房 奏』
本体が必要です。