(1)分散型音声認識システムの開発 携帯電話向けの高精度音声認識方式として分散型音声認識システムの研 究開発を行っている。同方式では、携帯端末内で音響分析を行い音声特 徴量のみをサーバに位置する認識システムに伝送する。これにより、こ ーデックの影響を回避できるため、高精度の音声認識を低ビットレート の回線で実現できる。一部の技術は、現在、NTT DoCoMo 905i シリーズ で実用化されており、音声翻訳サービス等を実現している。 (2)話者識別・話者照合手法の研究開発 音声から発声者を識別・照合する技術として、ノンパラメトリックモデ ルを用いた話者認識手法の研究開発を行っている。開発手法は、 (1)で 示した分散型音声認識システム上でも利用可能な方式であり、携帯電話 への搭載も可能となっている。2006 年に実施された中国語の話者識別コ ンテストでは最高性能を達成した。また、声紋鑑定のため人と計算機が 協力することで確実な個人同定を達成するための研究も進めている。 男性のスペクトログラム(声紋)の例 主に声道の情報を知ることができる。 これ以外に、声帯振動の情報等を総合して 話者認識を行う。
© Copyright 2025 Paperzz