富士通、人工知能で中国語の手書き文字認識率96.7%を達成―人間の識別能力超える
2015年9月17日 14:50
富士通の子会社、富士通研究開発中心(FRDC)と富士通研究所は17日、人工知能技術を活用した手書き文字認識技術を開発したと発表した。認識率は、学会で提唱された人間の識別能力に相当する96.7%を超えるという。
両社はこれまで、業界トップレベルという認識率94.8%を達成していたが人間の認識能力相当の96.1%には到達していなかった。今回は、文字認識の過程で利用する階層モデルに関して、認識精度を支配する神経細胞間の結線数を拡大することで、認識の精度を高めた。文字の変形をきめ細かく学習できるように、結線数を従来技術の約280万から約1億5,000万まで増加させたという。
認識対象となる中国語の文字は約3,800種類あるため、各文字の実際の変形パターンを収集するのは困難である。そこで、既存の文字サンプルをランダムに変形して様々な学習文字サンプルを自動生成する技術を開発した。これにより、多種多様な変形文字パターンを階層的モデルに学習させることが可能になった。
また従来手法は、二次元の位置を変形していたため、背景部分と文字の部分(文字線)の明るさの変化や文字線の局所的な変化が困難だった。そこで、三次元のランダム変形に基づく文字サンプル生成技術を考案した。同技術によって文字パターン画像上のX座標、Y座標に加え、画素ごとの濃淡値をZ座標のパラメーターとして様々な変形パターンを生成することができる。
FRDCと富士通研究所は今後、文字認識技術のさらなる高精度化と画像や音声といった文字以外のメディア認識への適用拡大を進めながら、同技術の2015年度中の実用化を目指す方針。また、数字、アルファベット、日本語など多言語の文字認識への適用も併せて検討していくという。