Google、画像からキャプションを作成する技術を開発

2014年11月25日 17:59

印刷

記事提供元:スラド

あるAnonymous Coward 曰く、 Googleの研究者が、写真から自動でその状況を説明するようなキャプションを生成するシステムの開発に成功したという(GIGAZINE)。

 人間は写真の内容からそれがどういった場面なのかを説明することができる。しかし、同じことをコンピュータにやらせるのは大変だ。開発された技術では、「深層畳み込みニューラルネットワーク(CNN)」を用いた画像認識アルゴリズムと機械学習の技術を採用。さらに、いくつものオープンデータベースの画像を大量に処理させることで、キャプションの質を向上させることにも成功したそうだ。

 GIGAZINEの記事では、泥道でオートバイに乗る人やフリスビーで遊ぶ若者の集団といった成功例が紹介されている。いっぽう、その内容を微妙に勘違いしていたり、明らかに解析に失敗した例も掲載されている。

 スラッシュドットのコメントを読む | ITセクション | テクノロジー | Google

 関連ストーリー:
ドバイ警察、Google Glassに独自の顔認識機能を実装へ 2014年10月08日
インターネットの情報から学習し判断できるロボット脳 2014年08月27日
Googleストリートビュー向けの画像認識アルゴリズムを使うと非常に高い精度でのCAPTCHAを解読できる 2014年04月21日

 

※この記事はスラドから提供を受けて配信しています。

関連記事