GitHubの障害、完全復旧までに24時間かかる
2018年10月26日 21:57
headless曰く、 GitHubで日本時間22日7時52分に発生した障害は、完全復旧までに24時間を要する大事となった(GitHub Blog、GitHub Blogの続報、GitHub System Status、The Next Web、Register)。
GitHubのブログ記事ではネットワークパーティションの障害発生に続いてデータベースに障害が発生し、複数のサービスでWebサイトに表示される情報の不整合が発生したと説明しているが、GitHub System Statusによるとgithub.comへのアクセスにも障害が発生していたようだ。ただし、影響を受けたのはMySQLデータベースに格納されたメタデータのみで、Gitリポジトリは影響を受けておらず、障害発生中も利用可能な状態だったという。
GitHubでは8時9分から調査を開始し、9時5分にはデータストレージシステムのフェールオーバーを開始した。数時間後にはgithub.comへのアクセスは復旧したようだが、整合性チェックに時間がかかり、GitHub Pagesのビルド機能が再開されたのは翌23日1時51分。Webhookが再開されたのは3時26分で、すべてが正常に戻ったのは8時3分となっている。原因の分析結果等は数日中に発表するとのこと。
ちなみに、欧州委員会は19日、MicrosoftによるGitHubの買収は競争への影響がないと結論付け、買収を承認したことを発表している(プレスリリース)。