東芝と統数研、欠損多いデータでも品質低下や歩留悪化の原因特定するアルゴリズム開発
2019年8月5日 15:50
東芝は2日、情報・システム研究機構 統計数理研究所(以下、統数研)と共同で、機械学習アルゴリズム「HMLasso」を開発したと発表した。今回両者が開発したアルゴリズムは、集めた製造データにエラーデータが多く含まれていたとしても、品質低下や歩留悪化の原因を高速かつ高精度で特定、従来のアルゴリズム「CoCoLasso」と比較し推定誤差を41%低減することに成功したという。工場やプラントなどで利用することで、製造現場での品質向上や生産性向上が期待できるとしている。
【こちらも】東芝、AIプロセッサの心臓部のIP化 DNNの覇権を目指すか
工場やプラントなどの生産現場では、製品の品質データや製造過程での設備の稼働データが日々、大量に蓄積されている。これらのデータを活用し、品質のばらつきを示すことができる回帰モデルを作成できれば、品質や歩留悪化の要因の特定と改善につなげることが可能となる。
だが現実には、測定ミスなどの要因で多くのエラーデータが生じていた。また抜き取り検査で品質を確認することが多いため、約1割のデータしか収集できないこともあるという。この場合、解析を行う前にエラーデータを補正する必要があるが、エラーデータが多いと莫大の計算が必要となるため、補正に多くの時間がかかっていた。
東芝と統数研は、従来の「CoCoLasso(Convex Conditioned Lasso)」とは異なるアプローチで、機械学習アルゴリズム「HMLasso(Least absolute shrinkage and selection operator with High Missing rate)」を開発した。
「CoCoLasso」はエラーデータが多い場合を考慮してしない設計のため、多くのエラーデータが含まれていると、解析の精度が低下する。「HMLasso」は、エラーデータが多い時の計算を考慮した設計となっているため、集めたデータにエラーが多く含まれている場合であっても、高い精度の回帰モデルを作成することができる。結果、「CoCoLasso」と比べて推定誤差を約41%低減した。
東芝と統数研は、今後は「HMLasso」の汎用化と高速化に取り組むとともに、工場やプラントなどの生産現場での課題に対する検証を通じて、生産性や信頼性の向上につなげたい考えだ。(記事:まなたけ・記事一覧を見る)