ブログサービス「Doblog」、1週間以上の障害 [運用管理]
NTTデータが運営するブログサービス「Doblog」で1週間以上投稿・閲覧できない障害が続いているとのこと。
原因はデータベースサーバとバックアップサーバのハードディスク障害。復旧時期はいまだ未定とのこと。
DBサーバとバックアップサーバのハードディスクが両方同時に壊れるということはなかなか考えられないので、ディスクは共有していた可能性が高いですね。そのディスクが壊れてしまった。ストレージそのものの二重化はしておらず、そしておそらく大きなストレージで簡単には入手できずに復旧が遅れている。想像の域を出ませんがそんなところではないでしょうか。
大きなストレージならば多くはRAID5などの構成になっていて、ディスク障害が発生しても部品交換ですぐに修復できる場合がほとんど。またI/Fの部分は二重化が可能になっていてできるだけ単一障害点にならないような仕組みになっているのが普通です。そういった構成でも対応できなかった障害ってなんだろう???
逆に安価なディスクをいくつも利用しているのであれば、Google File System(Hadoop)のようなクラウド・ストレージ構成をとりますよね。やはり単一障害点になる可能性は低いですし、ソフトウェアが原因という可能性はありますがどうもコメントはハードウェア障害っぽい。
大規模ストレージが原因の場合、顧客用のシステムでも同様の構成は数多くあるのではないでしょうか?できればこの業界の発展のために障害原因を公表して欲しいですね。
原因はデータベースサーバとバックアップサーバのハードディスク障害。復旧時期はいまだ未定とのこと。
DBサーバとバックアップサーバのハードディスクが両方同時に壊れるということはなかなか考えられないので、ディスクは共有していた可能性が高いですね。そのディスクが壊れてしまった。ストレージそのものの二重化はしておらず、そしておそらく大きなストレージで簡単には入手できずに復旧が遅れている。想像の域を出ませんがそんなところではないでしょうか。
大きなストレージならば多くはRAID5などの構成になっていて、ディスク障害が発生しても部品交換ですぐに修復できる場合がほとんど。またI/Fの部分は二重化が可能になっていてできるだけ単一障害点にならないような仕組みになっているのが普通です。そういった構成でも対応できなかった障害ってなんだろう???
逆に安価なディスクをいくつも利用しているのであれば、Google File System(Hadoop)のようなクラウド・ストレージ構成をとりますよね。やはり単一障害点になる可能性は低いですし、ソフトウェアが原因という可能性はありますがどうもコメントはハードウェア障害っぽい。
大規模ストレージが原因の場合、顧客用のシステムでも同様の構成は数多くあるのではないでしょうか?できればこの業界の発展のために障害原因を公表して欲しいですね。
コメント 0