BackblazeがHDD故障の予測に使う5つのSMART情報

2014年11月16日 17:03

オンラインバックアップサービスのBackblazeがデータセンターで使用する約4万台のHDDについて、収集した全S.M.A.R.T.情報の集計を公開した。Backblazeでは、これまでにもデータセンターで使用するHDDの故障率に関するデータなどを公開している(SMART Drive and Failure RatesBackblaze Blogの記事Computerworldの記事本家/.)。

実際にどのSMART属性の値を見れば故障を予測できるのかが気になるところだが、Backblazeでは経験則からSMART 5、187、188、197、198の値を故障の予測に使用しているという。たとえばSMART 187はハードウェアECCにより修復できなかったエラーの数を示すが、生の値が0である限りはほぼ故障することはなく、0よりも大きな値を示すと急激に故障率が高くなる。そのため、この値が0よりも大きくなったらドライブの交換をスケジュールするとのこと。

この他の属性についても分析しているが、ベンダー独自の値を使用する属性については分析が困難だという。たとえば、SMART 1は読み取りエラーの発生率を示すものとされているが、ベンダー独自の値が使われているため、SeagateとWestern Digitalの値を比較してもあまり意味がない。そのため、ベンダーから各属性の具体的な内容に関する情報が提供されれば理想的だとしている。 スラッシュドットのコメントを読む | ハードウェアセクション | ハードウェア | 統計 | ストレージ

 関連ストーリー:
ftp.kddilabs.jpでディスク障害が発生、サービス停止中 2014年11月16日
オンラインストレージ運営会社によるHDDの信頼性調査、HGSTが高評価 2014年09月29日
コンシューマ向けHDDでも少なくとも3年間はエンタープライズ向けHDDと同レベルの信頼性がある 2013年12月06日
東芝、HDD故障を最大3カ月前に予知する技術を開発 2013年01月16日
Googleが大量に使用しているHDDの故障率の分析 2007年02月19日

 

関連記事

最新記事