Google、音声合成システム「Tacotron 2」発表 人間そっくりの音声を合成

2018年1月1日 15:15

印刷

記事提供元:スラド

あるAnonymous Coward 曰く、 Googleは今月末に音声合成システム「Tacotron 2」を発表した。人工知能にテキストを読ませてリアルな音声を作り出すためのシステムで、TechCrunchによれば、気味が悪いほど本物そっくりの音声を合成できるという(QUARTZTechCrunchSlashdot)。

 Tacotron 2はこれまでの音声生成プロジェクトWaveNetと初代Tacotronの良いとこ取りをしており、2つのニューラルネットワークで構成されている。テキストをTacotronでスペクトログラムに変換し、それをWaveNetに入力して最終的な音声に出力する構成であるようだ。

 Googleが生成したサンプルと比較用の人間による音声サンプルがネット上にアップされている。英語だが聞いた範疇ではかなり自然な発音だ。TechCrunchによるとユーザーには文法知識がなくても使えるようだ。ただサンプルを聞くと句読点の位置は重要であるらしい

 スラドのコメントを読む | ITセクション | テクノロジー | Google | ソフトウェア

 関連ストーリー:
「スマートスピーカー」は「AIスピーカー」ではない 2017年11月16日
エフエム和歌山、Amazonのクラウドサービスをベースに独自の「AIアナウンサー」を開発・導入 2017年10月13日
ヤマハ、ボカロを演奏できるキーボードを発表 2017年09月04日
1分間の音声から声の特徴を収集してその人のしゃべり声を任意に合成できるという技術が登場 2017年05月12日

※この記事はスラドから提供を受けて配信しています。

関連キーワード

関連記事