The Intelligent Technology Company ラピスセミコンダクタ社(ROHM 社) 音声合成 LSI の魅力 文書管理番号:ELS100-00005 2013 年 12 月 ELS100-00005 音声合成 LSI 目次 1. はじめに .............................................................................................................. 3 2. 音声合成 LSI の魅力 ............................................................................................ 3 3. 音声合成 LSI の概要 ............................................................................................ 3 4. ROM データ作成までの流れ .................................................................................. 4 5. ラインアップ .......................................................................................................... 5 6. 評価ボードの構成 ................................................................................................. 7 7. メーカーのサポートサイトご案内 ............................................................................. 8 8. ML22Q573, ML22Q394 の機能概要 ........................................................................ 9 9. データ生成から Flash ROM 書込みまでの流れ(ML22Q573 使用)............................. 10 10. Speech LSI Utility で試聴する .............................................................................. 11 11. ML22Q394 のリファレンスボードでの注意点 .......................................................... 12 12. Speech LSI Utility から ML22Q394 へコマンド送信 ................................................. 13 13. 最後に ............................................................................................................... 14 改版履歴 .................................................................................................................... 15 参考文献 .................................................................................................................... 15 ver. 1.0 2013 年 12 月 2/15 ELSENA, Inc. ELS002-00005 1. はじめに この資料は、エルセナ取り扱い製品の魅力と使用方法を解説するシリーズ資料です。今回は、ラピスセミコ ンダクタ社(ROHM 社)の音声合成 LSI を取り上げます。メーカーより評価ボード(ML22Q573、ML22Q394)を借用 できましたので、評価ボードを実際に使用し、機能と利便性についてご説明します。本資料では私自身、分かり にくかった点を中心に記載しましたので、これから音声 IC をご検討中の方のご参考になれば幸いです。 ※使用した ML22Q573、ML22Q394 は Flash ROM を内蔵していますので、評価ボードを利用することにより、 簡単に ROM データ作成、Flash ROM への書込み、試聴ができます。 ※量産時の Flash ROM への書込みは メーカー書込み、もしくは専用ライターをご使用ください。 2. 音声合成 LSI の魅力 音声合成 LSI の最大の魅力は現状のシステムに手軽に音声機能を組込むことができる点です。 音声合成 LSI にはデコーダ、フィルタ、スピーカーアンプに加え、製品によっては複数音声の同時発声機能や 話速、音程変換の機能が 1 チップに内蔵されており、再生操作はホストマイコンからシンプルなコマンドを送信 するだけという、非常に簡単に音声(モノラル)再生がおこなえる専用 IC です。 また、スタジオなどで録音した原音を予め ROM に書込み、再生しますので音質が非常にきれいという点も魅力 です。 3. 音声合成 LSI の概要 以下に音声合成 LSI の概要について記載します。 ◆音声合成 LSI の概要 音声・効果音 編集/フォーマット変換/ROM データ生成 (.wav 形式ファイル) (Speech LSI Utility Tool) ROM データ生成までの流れ ROM への書込み(工場、専用ライターでのオンボード書込) 構成例 SPI,I2C 経由で コマンド送信 MCU 音声合成 LSI ROM CPU I/F Decoder Filter スピーカ直付け OK SPP SP-AMP SPM ver. 1.0 2013 年 12 月 3/15 ELSENA, Inc. ELS002-00005 4. ROM データ作成までの流れ 音声データを ROM に書き込む ROM データ生成までの手順について もう少し詳しくご説明します。 ご注意頂きたい点は、ラピス社の音声合成 LSI には音声や効果音などの原音が必要な点です。 原音には Windows 標準の.wav 形式のファイルが必要で、専用ツールにファイルを読込ませることによりフォー マット変換や ROM データの生成が可能になります。原音作成時、状況によってはナレータによる音声録音、ス タジオ録音が必要になりますが、仮にナレータ、スタジオが必要となった場合でも、ラピス社でサポート可能で す。 Flash ROM タイプ製品のデータ書込みについては、ある程度の数量があればメーカーでの書込み出荷が可 能です。また、お客様自身での書込みを希望される場合には、汎用ライターを使用し書込むこともできます。 ◆ STEP1: LSI シリーズ・ROM 容量選定 再生時間に合わせたメモリ容量、機能によりデバイスを選定します。 メモリ容量は 692Kbit ∼16Mbit をご用意しています。 ※次ページ以降に詳細を記載致します。 ◆ STEP2: フレーズリスト作成 フレーズをリストアップします。 ◆ STEP3: 原音作成 場合によっては、ナレータやスタジオ録音が必要になります。 ※ラピス社からナレータ、スタジオのご紹介も可能です。 ◆ STEP4: 音声分析・編集 評価ボード同梱 Speech LSI Utility ソフトで簡単に編集が可能です。 ◆ STEP5: ROM データ完成。書込み 書込みは出荷時書込み、もしくはサードバーティのライターを使用して 書込みます。 FlashROM 内蔵タイプの製品については汎用ラ イターでの書込みが可能です。詳細につきまして は、各メーカーにお問い合わせ下さい。 ver. 1.0 2013 年 12 月 4/15 ELSENA, Inc. ELS002-00005 5. ラインアップ 音声合成 LSI のラインアップのご紹介です。再生時間により、692Kbit∼16Mbit までの製品をご用意しておりま す。さらに長時間再生が必要な場合は外付けメモリシリーズ、マイコンも必要ということであれば、音声マイコン シリーズと豊富なラインアップをご用意しております。 ◆ラインアップ 音声合成専用 LSI 製品は下記の通りです。 印は今回使用した IC を示しています。 ●大容量 P2ROM™ 内蔵 音声合成 LSI シリーズ シリーズ名 機能概要 最大再生時間 ML2282x シリーズ シリアル I/F タイプ/SP-Amp 搭載/2ch 同時再生 ML2286x シリーズ 大容量 P2ROM 内蔵音声合成 LSI ML2272x シリーズ 話速・音程変換機能搭載/シリアル I/F タイプ/SP-Amp 搭載 ML2276x シリーズ 大容量 P2ROM 内蔵音声合成 LSI ML2280x シリーズ シリアル I/F タイプ ML22P80x シリーズ P2ROM 内蔵音声合成 LSI(ML2280x シリーズ)、OTP 内蔵音声合成 LSI(ML22P80x シリーズ) ver. 1.0 2013 年 12 月 1044 秒 1044 秒 524 秒 5/15 ELSENA, Inc. ELS002-00005 ●中・小容量 FlashROM/MaskROM 内蔵 音声合成 LSI シリーズ シリーズ名 機能概要 最大再生時間 ML2256x シリーズ シリアル I/F タイプ/SP-Amp 搭載/2ch 同時再生 201 秒 ML22Q563 MaskROM 内蔵音声合成 LSI(ML2256x シリーズ)、Flash メモリ内蔵音声合成 LSI(ML22Q563) ML22321 車載対応/シリアル I/F タイプ/SP-Amp 搭載 ML22Q321 シリーズ MaskROM 内蔵音声合成 LSI(ML22321)、Flash メモリ内蔵音声合成 LSI(ML22Q321) ML2233x シリーズ 車載対応/シリアル I/F タイプ/SP-Amp 搭載 ML22Q33x シリーズ MaskROM 内蔵音声合成 LSI(ML2234x シリーズ)、Flash メモリ内蔵音声合成 LSI(ML22Q34x シリーズ) ML2234x シリーズ 車載対応/スタンドアローンタイプ/SP-Amp 搭載 ML22Q34x シリーズ MaskROM 内蔵音声合成 LSI(ML2234x シリーズ)、Flash メモリ内蔵音声合成 LSI(ML22Q34x シリーズ) 43 秒 43 秒 43 秒 ●小容量 FlashROM 内蔵 音声合成 LSI シリーズ シリーズ名 ML22Q374 ML22Q394 機能概要 最大再生時間 D 級アンプ内蔵 21 秒 2 SPI(ML22Q374) / I C(ML22Q394) ●車載対応 音声合成 LSI シリーズ シリーズ名 ML22Q553 機能概要 最大再生時間 車載対応/シリアル I/F タイプ/SP-Amp 搭載/4ch 同時再生 201 秒 Flash メモリ内蔵音声合成 LSI ML2257x シリーズ 車載対応/シリアル I/F タイプ/SP-Amp 搭載/4ch 同時再生 201 秒 ML22Q573 MaskROM 内蔵音声合成 LSI(ML2257x シリーズ)、Flash メモリ内蔵音声合成 LSI(ML22Q573) ML2233x シリーズ 車載対応/シリアル I/F タイプ/SP-Amp 搭載 ML22Q33x シリーズ MaskROM 内蔵音声合成 LSI(ML2234x シリーズ)、Flash メモリ内蔵音声合成 LSI(ML22Q34x シリーズ) ML2234x シリーズ 車載対応/スタンドアローンタイプ/SP-Amp 搭載 ML22Q34x シリーズ MaskROM 内蔵音声合成 LSI(ML2234x シリーズ)、Flash メモリ内蔵音声合成 LSI(ML22Q34x シリーズ) 43 秒 43 秒 ※弊社では車載向けアプリケーションへの販売はできません。 ●外付けメモリ対応 音声合成シリーズ シリーズ名 ML22420 機能概要 シリアル I/F タイプ/SP-Amp 搭載/4ch 同時再生/シリアル外付けメモリ ML22460 ML22594 最大再生時間 8352 秒 (最大 128Mbit) シリアル I/F タイプ/SP-Amp 搭載/4ch 同時再生/シリアル外付けメモリ 5240 秒 (128Mbit 接続時) ML2011 MP3 デコーダ/シリアル・パラレル I/F タイプ/Sp-Amp 搭載/ステレオ 外部メモリ サイズに依存 ver. 1.0 2013 年 12 月 6/15 ELSENA, Inc. ELS002-00005 6. 評価ボードの構成 では早速、評価ボードについてご説明します。 評価には“SDCB2 キット” と “リファレンスボード”の 2 つが必要になります。 SDCB2 (Sound Device Control Board 2)キットには、Speech LSI Utility のソフトも同梱されています。 リファレンスボードはターゲットデバイスごとの専用品になります。 まとめると、構成は下記の様になります。 ハード構成 :SDCB2 + ターゲットデバイス用リファレンスボード ソフト :Speech LSI Utility ※Speech LSI Utility により波形編集、ROM データの生成、サンプル書込、SDCB2 操作、試聴が可能です。 ◆評価ボード構成 SDCB2 キット リファレンスボード SDCB2 Speech LSI Utility ver. 1.0 2013 年 12 月 7/15 リファレンスボード ELSENA, Inc. ELS002-00005 7. メーカーのサポートサイトご案内 最新の Speech LSI Utility、ドライバはユーザー登録が必要なサポートサイトから入手可能です。 (ドライバの更新方法については Speech LSI Utility ユーザーズマニュアルに記載されています。) Speech LSI Utility はライセンスキーが必要ですので、SDCB2 キットをご購入頂く必要があります。 ログイン画面 最新ソフトはココ ver. 1.0 2013 年 12 月 8/15 ELSENA, Inc. ELS002-00005 8. ML22Q573, ML22Q394 の機能概要 ここで、ML2Q573 と ML22Q394 について簡単にご説明します。下記の概要を見て頂ければ分かる様に、様々 な機能が 1 チップに集約されていますので、周辺部品は非常に少なくてすみます。また、MCU からの制御も SPI、 I2C 経由で行えますので、既存システムに簡単に音声機能を追加することができます。 ◆今回借用した製品の概要 ML22Q573 (Flash ROM:4Mb 内蔵) 再生時間目安:80 秒(HQ-ADPCM 方式、fs=16.0k 時) パッケージ :SSOP-30pin 動作電源電圧 :+2.7V∼+5.5V 動作温度範囲 :-40℃∼+105℃ SP-AMP 出力 :1.0W(8Ω、5V 時)モノラル CPU I/F :SPI 内蔵機能 :HQ-ADPCM デコーダ 16 ビット DAC ローパスフィルタ 4 チャンネル同時再生,編集再生 外部アナログミキシング 電源電圧検出 応用回路例 ML22Q394 (Flash ROM:692kb 内蔵) 再生時間目安:10.8 秒(ADPCM2 方式、fs=16.0k 時) パッケージ :SSOP-16pin 動作電源電圧 :+2.0V∼+5.5V 動作温度範囲 :-40℃∼+85℃ SP-AMP 出力 :1.0W(8Ω、5V 時)モノラル:D 級アンプ CPU I/F :I2C 内蔵機能 :ADPCM2 デコーダ 16 ビット DAC ローパスフィルタ スピーカ端子ショート検出 4.096MHz 内蔵 応用回路例 ver. 1.0 2013 年 12 月 9/15 ELSENA, Inc. ELS002-00005 9. データ生成から Flash ROM 書込みまでの流れ(ML22Q573 使用) Speech LSI Utility のインストールについては省略させて頂きます。また、ユーザーズマニュアルにつきまして は、ソフトインストール時に同時にインストールされますのでご確認ください。 ユーザーズマニュアル 以下に、ML22Q573 内の Speech LSI Utility を使って、FlashROM にデータ を書込むまでの例を記します。 最低限の内容を簡易的に紹介していますので、この他の機能、詳細について はユーザーズマニュアルをご参照ください。 ◆ML22Q573 の ROM 書込みまでの例 ② ファイル選択 ① デバイス選択 Drag&Drop ④ フォーマット変換 ③ 関連付け ☑すると Phase アドレスが割り振られます。 ⑥ ROM への書込み ⑤ ROM データ作成 Board Controller ウィンドウを立ち上げ Write ver. 1.0 2013 年 12 月 10/15 ELSENA, Inc. ELS002-00005 10. Speech LSI Utility で試聴する Speech LSI Utility を使用することにより、編集後の音質やデバイスからの音声を簡単に試聴できます。 編集後の試聴 編集後の試聴は Speech LSI Utility から ② 再生したいファイルを選択 ① 再生ボタンを押下 PC の USB へ デバイス 試聴用 22Q573 用 スピーカ リファレンスボード SDCB2 デバイスの試聴 ① 再生したい Phase を選択 ② 再生ボタンを押下 デバイスの試聴は SDCB Controller から ver. 1.0 2013 年 12 月 11/15 ELSENA, Inc. ELS002-00005 11. ML22Q394 のリファレンスボードでの注意点 もう一方の ML22Q394 のリファレンスボードを使用する際には、少し注意が必要です。 以下に要点を記載しましたのでご使用の際の参考にしてください。 ◆ML22Q394 リファレンスボード使用時の注意事項① ML22Q394 リファレンスボード上での試聴時、正常に動作しない場合は、ROM データ作成時、TEST ROM Data にて生成してください。お客様のボードを利用し CPU 等からのコマンドで再生する場合は Release ROM Data をご選択ください。 詳細は Speech LSI Utility の ユーザーズマニュアルを ご確認ください。 ◆ML22Q394 リファレンスボード使用時の注意事項② 今回メーカーから借りた ML22Q394 リファレンスボードでの試聴、ROM 書込みは、リファレンスボード上の 設定ピンを変更する必要がありますのでご注意ください。 JP3 JP2 JP1 ver. 1.0 2013 年 12 月 12/15 ELSENA, Inc. ELS002-00005 12. Speech LSI Utility から ML22Q394 へコマンド送信 生成した TEST ROM Data を ML22Q394 の FlashROM に書込んだ後、SDCB Controller から再生コマンドを実 行してみます。I2C 経由のコマンドをモニターしてみると、スレーブアドレスと Phase 番号を指定するコマンドだけ で、スピーカから音声が再生されました。 ML22Q394 は少ない周辺部品。CPU から簡単アクセス。ということで、非常に扱いしやすい製品です。 ◆Speech LSI Utility から ML22Q394 へのコマンド確認 Phase Number 再生ボタンを押下 を選択 ML22Q394 は I2C 経由によるシンプルなコマンドで音声再生が可能です。 この例では、スレーブアドレス(5h)と Phase 番号の指定コマンド(2h)を発行しています。 スレーブアドレスは”0000101”と設定 A D0 D1 D2 D3 D4 D5 D6 D7 A W A0 A1 A2 A3 A4 A5 A6 SDA コマンドは”V[2:1]=0、Phase2”を指定し再生 SCL ver. 1.0 2013 年 12 月 13/15 ELSENA, Inc. ELS002-00005 13. 最後に 音声合成 LSI ってどう使うの?という個人的な興味から、メーカーの技術担当者の方に概要を説明頂いたり、 評価ボードをお借りしたり、この場をお借りしてお礼申し上げます。 実際に音声合成 LSI を使ってみた感想は「非常に簡単」であったという一言につきます。MCU から SPI また は I2C 経由で制御できるという点はもちろんですが、評価環境が充実している点、特に専用ツール(Speech LSI Utility)が用意されているため、音声データの編集、ファイル変換、ROM 生成に至るまで、容易に作業すること ができました。 既存のシステムに音声機能を追加したいという方は、是非ご検討頂ければと思います。 ver. 1.0 2013 年 12 月 14/15 ELSENA, Inc. ELS002-00005 改版履歴 Version 改定日 改定内容 1.0 2013 年 12 月 ・新規作成 参考文献 各データシート ユーザーズマニュアル 免責、及び、ご利用上の注意 弊社より資料を入手されましたお客様におかれましては、下記の使用上の注意を一読いただ いた上でご使用ください。 1. 本資料は非売品です。許可無く転売することや無断複製することを禁じます。 2. 本資料は予告なく変更することがあります。 3. 本資料の作成には万全を期していますが、万一ご不審な点や誤り、記載漏れなどお気づきの点が ありましたら、弊社までご一報いただければ幸いです。 4. 本資料で取り扱っている回路、技術、プログラムに関して運用した結果の影響については、責任を 負いかねますのであらかじめご了承ください。 5. 本資料は製品を利用する際の補助的なものとしてかかれたものです。製品をご使用になる場合は、 英語版の資料もあわせてご利用ください。 本社 〒163-0928 東京都新宿区西新宿 2-3-1 新宿モノリス 28F TEL 03-3345-6205 FAX 03-3345-6209 松本営業所 〒390-0815 長野県松本市深志 2-5-26 松本第一ビル 8F TEL 0263-39-6134 FAX 0263-39-6135 大阪営業所 〒530-0005 大阪府大阪市北区中之島 2-3-33 大阪三井物産ビル 14F TEL 06-6227-6914 FAX 06-6227-6915 名古屋営業所 〒451-0045 名古屋市西区名駅 2-27-8 名古屋プライムセントラルタワー20F TEL.052-566-2513(代) FAX.052-566-2514 ver. 1.0 2013 年 12 月 15/15 ELSENA, Inc.
© Copyright 2025 Paperzz