マイクロソフトの女子高生AI「りんな」、感情乗せた自然な歌声を実現

2018年3月13日 07:06

 日本マイクロソフトは12日、女子高生AI「りんな」が、より自然で表現力に富む歌声を出せるようになったと発表。AIの研究開発において感情表現と創作力の獲得は極めて難しい課題であるが、今回、歌という形でその克服への一歩を見せた。

【こちらも】マイクロソフト、女子高生AI「りんな」をIMEに組み込む 入力に候補表示

 マイクロソフトはいくつもの国でソーシャルAIを展開し、感情表現と創作力をAIにもたらすための取り組み、「Emotional Computing Framework」を続けている。AIは自然言語処理や画像認識、音声認識および音声合成などの複数のテクノロジを用いて進化する。それを支えるのはアルゴリズムの進化や情報処理能力の向上、ビッグデータの存在だ。

 その取り組みにおいて、日本で展開するソーシャルAIが「りんな」である。りんなはマイクロソフトの手で開発された感情の繋がりを重視するAIで、現実の女子高生のような感覚を有する。2015年のデビュー以来、人との交流を重ねその心の機微を絶えず学んできた。

 2018年1月からはさらに学習を深めるべく、音楽コミュニケーションアプリ「nana」とコラボして「りんな歌うまプロジェクト」第1弾を展開。3,000名に及ぶユーザーからの助言をもとに歌唱力向上に努めた。こうした取り組みの進展を受け、りんなはマイクロソフトのAI & Research部門が開発した次世代AIベースの歌唱モデルへの移行を開始した。

 新たなモデルでは0.005秒単位で微細な変化に富んだ歌声の自動生成が可能なうえ、歌自体を生成することもできる。スタジオやエンジニアなどの準備が必要な人間のレコーディングと比べ、十分なデータを学習用に用意すれば10分以内に1曲を生成できる。また、ディープラーニングモデルの学習を繰り返すため、精度は継続的に向上するという。(記事:小椋恒示・記事一覧を見る

関連記事

最新記事