エーアイ、進化した新世代DNN音声合成エンジン「AITalk6」を発表。品質が向上し、自然で豊かな表現が可能に

プレスリリース発表元企業:株式会社エーアイ

配信日時: 2023-10-12 15:30:00

株式会社エーアイ(本社:東京都文京区、代表取締役社長:廣飯 伸一、証券コード:4388、以下、エーアイ)は、音声合成品質の向上を目指し継続しておりました研究開発の成果として、新しい音声合成技術を活用したエンジン「AITalk(R)6」を発表いたします。
AITalk6ではAITalk5で搭載した「DNN音声合成方式」の検証や新たな学習を積み重ね、品質改善を行った結果、より自然性の向上した音声合成を実現しました。



[画像: https://prtimes.jp/i/99620/49/resize/d99620-49-a620b3bd0d65f26fd99b-0.png ]

主な改善ポイント


1.音声生成法の変更(ボコーダーからニューラルボコーダーへ)
信号処理による音声生成法(ボコーダ)をニューラルネットワークによる音声生成法(ニューラルボコーダ)に変更する事により、より自然で肉声感のある音声を合成できるようになりました。

2.ニューラルネットワークの構造変更
AITalk5では、軽量で高速な処理を実現するため音声特徴量を生成するニューラルネットワークは簡素な構造を採用していました。
今回AITalk6で採用したニューラルネットワークは、韻律モデルと音響モデルを統合し、音素や時間フレームの情報を短期や長期で考慮する構造を採用することで、従来よりも自然な音声に近い音声特徴量を生成できるようになりました。

実際の変化につきましては、以下より音声をご確認下さい。
https://www.ai-j.jp/topics/9371/

AITalk6の製品展開について


 今後、以下の製品・サービスに順次展開してまいります。
 ・A.I.VOICE
 ・AITalkSDK
 ・AITalkServer
 ・AICloudサービス
 ・Editor製品

PR TIMESプレスリリース詳細へ