新208.5日問題、LinuxカーネルのバグとXeonのバグの合わせで発生

2013年12月25日 19:43

印刷

記事提供元:スラド

 かつてLinuxカーネルで発見され修正されていた「起動後208.5日経過すると勝手に再起動する」不具合が、完全には直っていなかったことが明らかになったようだ(新208.5日問題 - Systems with Intel® Xeon® Processor E5 hung after upgrade of Red Hat Enterprise Linux 6M)。

 新たに発見された問題はXeon E5シリーズのCPUのみで発生するもので、「起動後208.5日経過すると勝手に再起動する」ではなく、「最後に電源停止を行ってから208.5日経過後に再起動を行うと再起動時にハングアップする」というもの。

 そもそもの問題(Red Hatのサポートページ)は、駆動クロックに応じてカウントアップされるCPUの「Time Slice Stamp Counter(TSC)」というカウンタに対する処理と、この値を使ったスケジューラのコードにおける処理が不適切だったことで発生していた(この問題を解説したokky氏のブログ;)。

 この問題は、スケジューラの処理を変更することで対処されたのだが、同様のコードがカーネルの起動時に使われており、かつXeon E5シリーズではwarm reset時にTSCのカウント値がリセットされない、という不具合が存在していたため、これらが重なってカーネルの起動時にハングアップするという問題が発症することとなったようだ。

 スラッシュドットのコメントを読む | Linuxセクション | Linux | バグ | IT

 関連ストーリー:
Linux、2003年にバックドアを仕掛けられそうになっていた 2013年10月12日
Linus Torvalds氏のSSDが故障、Linuxカーネルの開発作業に影響 2013年09月12日

 

※この記事はスラドから提供を受けて配信しています。

関連記事