Google、音声合成システム「Tacotron 2」発表 人間そっくりの音声を合成

2018年1月1日 15:15

あるAnonymous Coward 曰く、 Googleは今月末に音声合成システム「Tacotron 2」を発表した。人工知能にテキストを読ませてリアルな音声を作り出すためのシステムで、TechCrunchによれば、気味が悪いほど本物そっくりの音声を合成できるという(QUARTZTechCrunchSlashdot)。

 Tacotron 2はこれまでの音声生成プロジェクトWaveNetと初代Tacotronの良いとこ取りをしており、2つのニューラルネットワークで構成されている。テキストをTacotronでスペクトログラムに変換し、それをWaveNetに入力して最終的な音声に出力する構成であるようだ。

 Googleが生成したサンプルと比較用の人間による音声サンプルがネット上にアップされている。英語だが聞いた範疇ではかなり自然な発音だ。TechCrunchによるとユーザーには文法知識がなくても使えるようだ。ただサンプルを聞くと句読点の位置は重要であるらしい

関連記事

最新記事