富士通研究所、音声だけで最新情報をスマホから取得できる技術を開発
2011年10月14日 11:02
富士通研究所は13日、スマートフォンの画面を見ることなしに、音声だけでさまざまな情報を取得できる音声インターフェース技術を開発したと発表した。
開発した音声インターフェース技術は、音声合成で読み上げられた最新のニュースの情報などに対し、その中でさらに知りたい情報をユーザーが発することで、詳細情報や関連情報を読み上げていくというもの。たとえば、システムが読み上げたニュースのヘッドラインから気になった言葉を発すると、さらにそれに関する詳細記事をシステムが読み上げる。
今回開発した技術では、これまで課題とされてきた、時事用語や同音異義語にも対応できる。
インターネット上から最新の時事用語に関して「表記(かな)」のパターンを自動抽出し、単語辞書に自動登録する技術を開発。これにより、最新の時事用語・新語を正しく聞き、正しく読み上げることが可能になった。
また、過去にシステムが提示した情報の履歴を解析し、話題にフォーカスした単語を抽出し、音声認識辞書を動的に作成する技術を開発。これにより、同音異義語など、曖昧性のある単語も正しくシステムが認識するため、ユーザーの意図に沿った応答をすることが可能になるという。
同技術を利用することで、運転中や作業中などのアイズフリー・ハンズフリーが求められるシーンにおいて、画面を見たりタッチすることなく、さまざまな情報サービスを受けることができるようになる。
今後、富士通研究所は、同技術をモバイル向けのクラウドサービスのユーザーインターフェース機能として2012年度中の実用化を目指し、今年度中に実証実験を行うとともに、さまざまな利用シーンへの適用を検討していく。
富士通研究所は、プロのナレーション品質に迫る業界最高クラスの音声合成技術や、周りの雑音を除去し、ユーザーの言葉だけを認識する音声認識技術などを実用化してきた。現在、センター型の音声認識・合成技術の開発を含め、新しい音声インターフェースの実現を目指している。