ニコニコ動画やYouTubeの音声をテキスト化する「PodCastle」

2011年10月15日 16:25

あるAnonymous Coward 曰く、　産総研は、インターネット上の動画音声データを対象とした音声全文検索・書き起こしサービス「PodCastle」を一般公開し、音声情報検索技術の実証実験を開始した(プレスリリース)。

音声認識技術によって動画音声データをテキスト化し、誤りをユーザーに訂正してもらうことで認識結果だけでなく認識精度も向上していくというもの。産総研では2008年から日本語のポッドキャストを対象とした音声全文検索サービスを公開し、ユーザーの協力により認識精度が向上することを実証していた。今回はポッドキャストに加えてニコニコ動画、YouTube、Ustreamに対応し、日本語と英語の音声認識および検索が可能となっている。

実際の認識例を見ると、報道系などについては比較的精度良くテキスト化できているが、トーク番組などのバラエティ系はあまり精度が高くないように見受けられる。ユーザーの訂正により、認識精度はどれぐらい向上するのだろうか。

　スラッシュドットのコメントを読む | テクノロジー | mainpage | インターネット | IT

　関連ストーリー：
産総研オープンラボ開催 2011年09月25日
クラウド型「人力OCR」、どう思う？ 2011年09月22日
Googleがテレビ番組検索提供開始 2005年01月27日
IBMが自社の音声認識ソフトウェアをオープンソース化 2004年09月14日

　

ニコニコ動画やYouTubeの音声をテキスト化する「PodCastle」

関連記事

最新記事