関連記事
Microsoftの音声認識技術、英語では人間並みのレベルに到達
記事提供元:スラド
headless 曰く、 Microsoftの音声認識技術が英語では人間並みのレベルに到達したそうだ(論文概要、Next at Microsoft、The Next Web、Register)。
論文ではNIST 2000テストのSwitchboardとCallHomeを用い、人間(文字起こし専門家)とMicrosoftのASR(Automatic Speech Recognition)システムでのエラー率(WER: word error rate)を比較している。
SwitchboardのWERは専門家・ASRともに5.9%。MicrosoftのASRシステムは9月に6.3%に到達していたが、1か月ほどで0.4%向上したことになる。一方、CallHomeでは専門家の11.3%に対しASRは11.1%となり、人間による認識能力を上回った。
人間並みの音声認識技術の実現は、5年前には想像もできなかったという大きなマイルストーンであり、幅広い製品の機能を大幅に拡張することが期待される。
スラドのコメントを読む | ITセクション | テクノロジー | マイクロソフト | ソフトウェア | 人工知能 | デベロッパー | IT
関連ストーリー:
Google、アプリに音声認識機能を追加できる「Cloud Speech API」を公開 2016年03月28日
Amazon、クラウド型自然言語処理サービスの開発者向けプレビューを開始 2015年08月05日
みずほ銀行がコールセンターにWatsonを導入へ 2014年11月06日
NTTドコモ、機械翻訳技術開発を行う「みらい翻訳」を設立 2014年09月29日
※この記事はスラドから提供を受けて配信しています。
スポンサードリンク