NEC、AIがデータの意味理解し高度なデータ統合を可能とする技術開発
2019年8月8日 12:06
NEC(東京都港区)は5日、異なる種類の多様なデータの意味をAI(人工知能)によって理解する「データ意味理解技術」を開発したと発表した。この技術により、分野や業種などが異なる複数の表データを統合するといった、複雑な作業が容易になるという。データサイエンティストなどデータ関連の専門人材が不足する中、AI導入に不可欠なデータ統合のコストや時間を大幅に削減できると期待される。
【こちらも】NEC、熟練者の意図を学習するAI開発 高度なスキル必要な意思決定が可能に
近年、企業間や業種間でデータを共有・統合して横断的な分析を行い、ビジネスに活用しようという動きが活発化している。しかし、成作者が異なるデータは、表名や列名が統一されておらず、そのままでは統合できない。データや表の各行・列の意味を分析・理解しなければならないが、ビッグデータともなると膨大な行や列をひとつひとつ精査していく必要があり、専門家でも多大な労力と時間がかかる。
NECが開発したデータ意味理解技術は、数値やテキストが混在しているデータであっても解析が可能になる。これまでもテキストだけ、あるいは数値だけのデータの意味を理解する技術はあったが、今回開発された技術により、解析の精度は大幅に向上するという。
また、データの相対的な類似性を判定するデータインテグレーションとも異なり、データそのものの意味を理解したうえで統合するという点で、画期的な技術といえる。
たとえば、「28」「29」「30」という3つの数値には、年齢、気温、年号などさまざまな意味が考えられるが、同じ表に「氏名」の項目があれば気温ではなく年齢であると推定する。単語を、ナレッジグラフと呼ばれる属性や関連性の高さに基づいて整理するデータベースを活用した、NEC独自の機械学習技術によって、こうした精度の高い意味推定が可能になったという。
データ解析の場合、企業からデータを預かってからデータを理解しそれを構造化するまで1~2週間、そこから顧客とのフィードバックを繰り返して精度を高めていくまでに通常は3~4週間はかかるが、それをたった1日で完了できるとしている。
同技術は、2019年1月、人工知能分野ではトップレベルの学会であるアメリカ人工知能学会 (AAAI)で発表された。(記事:Kei_T・記事一覧を見る)