KDDI研究所は19日、名古屋工業大学徳田恵一教授との共同研究により、携帯電話端末で動作可能な日本語音声合成技術を開発し、ダウンロードにより複数の声質での音声合成機能を携帯電話端末に追加するソフトウェアを試作した。 今回開発された日本語音声合成技術は、音声波形の断片をそのまま利用するのではなく、音声波形の特徴をHMM(隠れマルコフモデル)により効率的に表すことで、元のナレータの声質や話し方も再現する音声の高品質合成に必要な情報を、携帯電話で扱える1MB程度のデータサイズにまで圧縮したもの。音がなめらかで自然性が高いほか、ナレータの音声波形データから、その声質・話し方での音声合成に必要なデータを作成するまでの処理のほとんどが自動化されているため、制作コストが抑えられるのが特徴だ。 携帯電話向けソフトウェアは、この音声合成技術を携帯電話端末で動作するレベルまで高速化したもの。これにより、さまざまなナレータ・声優の中から好みの声を選んでダウンロードし、メールやブログを読み上げるサービスや小説を登場人物ごとに別の声で読み上げるサービスなどが実現する。 今後は、大規模な受聴試験を行いながら、合成音声の自然性をさらに高めていくとしている。
iPhone11 Pro、実際どうなの?iPhone 8 Plusを2年使って感じた進化をレポート 2019年10月9日 iPhone11 Pro/Pro Max、iPhone 11が先日リリースされた。売れ…