東芝と統数研、欠損多いデータでも品質低下や歩留悪化の原因特定するアルゴリズム開発

2019年8月5日 15:50

　東芝は2日、情報・システム研究機構統計数理研究所（以下、統数研）と共同で、機械学習アルゴリズム「HMLasso」を開発したと発表した。今回両者が開発したアルゴリズムは、集めた製造データにエラーデータが多く含まれていたとしても、品質低下や歩留悪化の原因を高速かつ高精度で特定、従来のアルゴリズム「CoCoLasso」と比較し推定誤差を41％低減することに成功したという。工場やプラントなどで利用することで、製造現場での品質向上や生産性向上が期待できるとしている。

【こちらも】東芝、AIプロセッサの心臓部のIP化　DNNの覇権を目指すか

　工場やプラントなどの生産現場では、製品の品質データや製造過程での設備の稼働データが日々、大量に蓄積されている。これらのデータを活用し、品質のばらつきを示すことができる回帰モデルを作成できれば、品質や歩留悪化の要因の特定と改善につなげることが可能となる。

　だが現実には、測定ミスなどの要因で多くのエラーデータが生じていた。また抜き取り検査で品質を確認することが多いため、約1割のデータしか収集できないこともあるという。この場合、解析を行う前にエラーデータを補正する必要があるが、エラーデータが多いと莫大の計算が必要となるため、補正に多くの時間がかかっていた。

　東芝と統数研は、従来の「CoCoLasso（Convex Conditioned Lasso）」とは異なるアプローチで、機械学習アルゴリズム「HMLasso（Least absolute shrinkage and selection operator with High Missing rate）」を開発した。

　「CoCoLasso」はエラーデータが多い場合を考慮してしない設計のため、多くのエラーデータが含まれていると、解析の精度が低下する。「HMLasso」は、エラーデータが多い時の計算を考慮した設計となっているため、集めたデータにエラーが多く含まれている場合であっても、高い精度の回帰モデルを作成することができる。結果、「CoCoLasso」と比べて推定誤差を約41％低減した。

　東芝と統数研は、今後は「HMLasso」の汎用化と高速化に取り組むとともに、工場やプラントなどの生産現場での課題に対する検証を通じて、生産性や信頼性の向上につなげたい考えだ。（記事：まなたけ・記事一覧を見る）

東芝と統数研、欠損多いデータでも品質低下や歩留悪化の原因特定するアルゴリズム開発

関連記事

最新記事