NEC、必要な学習データを半減するディープラーニング技術開発
2019年8月21日 13:41
NEC(東京都港区)は19日、学習データ量が従来の半分程度であっても、高い精度で識別が可能なディープラーニング技術を開発したと発表した。ディープラーニング技術の適用には大量のデータを必要とするが、特徴量を変えることで識別が困難な学習データを人工的に生成し、データ量が不足していても識別精度を高めることができるという。
【こちらも】NEC、熟練者の意図を学習するAI開発 高度なスキル必要な意思決定が可能に
ディープラーニング技術は近年、画像認識や音声認識を中心に大きく成長しており、さまざまな分野で活用されている。
製造現場では、人材不足から熟練検査員が行っていた外観検査を、画像認識カメラで代替したいというニーズが高まっている。製品の外観検査にディープラーニングによる画像認識技術を使う場合、不良品データを学習させる必要があるが、発生する頻度が低い不良品は大量の学習データを収集するのが難しい。この問題を解決するためにこれまで行われてきたのが、「データ拡張」だ。
「データ拡張」は、データを加工したり変形したりしてデータ量を意図的に増やす手法のこと。画像の場合は、大きさや回転角度を変えることでデータを増やす。しかし、この方法では無駄なデータも生成されてしまうため、識別精度の向上に役立つデータを効率的に収集するためには有効とはいえない。また、的確なデータ生成方法を選択したり、学習に悪影響を与えるデータの発生を抑えるように調整する必要があるため、専門的な知識が求められる。
識別精度を高めるためには、識別が困難なデータを多く学習する必要がある。今回NECが開発した技術は、特徴量を変えることで識別が困難な学習データを人工的に生成する。同技術を、識別が難しいとされる手書き数字などのパブリックデータセットで評価したところ、従来の半分の学習データ量でもこれまでの技術と精度が変わらないことが確認されたという。
また自動的に学習データを生成するため、さまざまなデータに汎用的、効率的に適用することができる。
NECでは、少ないデータ量でも高い識別精度が得られる同技術により、外観検査のほかインフラ保全システムなどの開発期間の短縮が期待できるとしている。(記事:Kei_T・記事一覧を見る)