Gmailの障害は新基盤ソフトとGmailのバグ [運用管理]
先日発生したGmailの障害について、原因をGoogleが公表しました。
原因は2つ
1つめは現在導入を進めている新基盤ソフトの障害対応機能の不具合。欧州データセンターの定期メンテナンス中に予期しない障害が発生。この際に新基盤ソフトの不具合が発生し、本来他のDCに引き継がれる処理が正常に機能せず他のDCが過負荷状態になってしまいました。
2つめはGmailの潜在的なバグ。上記過負荷状態で未知のバグが顕在化してGmailが停止してしまったようです。
Googleは今後の対策として
・ステムの自己修復・自己管理機能の開発の強化
・Google Appsステータスダッシュボードの設置
http://japan.cnet.com/news/tech/story/0,2000056025,20388938,00.htm
を挙げました。
システムの自己修復・自己管理機能の強化というのは運用管理を行う他のベンダーでも改善したい内容。Googleがどのようなことをやってくるのか、その成果は公開されるのかなど気になるところです。
なお、今回の障害に対してGoogleは有償ユーザに15日間の無償利用で補償。これはSLA以上のサービスとなっています。
今のユーザに対して最大限の補償をと考えたのでしょうけれど、今後同様なことが発生した場合に不公平感が生まれないかと心配してしまいます。サービスを継続していく上でSLAとその補償って難しいですね。
関連記事:
http://www.itmedia.co.jp/news/articles/0902/26/news024.html
原因は2つ
1つめは現在導入を進めている新基盤ソフトの障害対応機能の不具合。欧州データセンターの定期メンテナンス中に予期しない障害が発生。この際に新基盤ソフトの不具合が発生し、本来他のDCに引き継がれる処理が正常に機能せず他のDCが過負荷状態になってしまいました。
2つめはGmailの潜在的なバグ。上記過負荷状態で未知のバグが顕在化してGmailが停止してしまったようです。
Googleは今後の対策として
・ステムの自己修復・自己管理機能の開発の強化
・Google Appsステータスダッシュボードの設置
http://japan.cnet.com/news/tech/story/0,2000056025,20388938,00.htm
を挙げました。
システムの自己修復・自己管理機能の強化というのは運用管理を行う他のベンダーでも改善したい内容。Googleがどのようなことをやってくるのか、その成果は公開されるのかなど気になるところです。
なお、今回の障害に対してGoogleは有償ユーザに15日間の無償利用で補償。これはSLA以上のサービスとなっています。
今のユーザに対して最大限の補償をと考えたのでしょうけれど、今後同様なことが発生した場合に不公平感が生まれないかと心配してしまいます。サービスを継続していく上でSLAとその補償って難しいですね。
関連記事:
http://www.itmedia.co.jp/news/articles/0902/26/news024.html
有償版Google App Engineを4月から提供開始
Googleは有償版App Engineを4月から提供開始すると発表。
SLAについては現在検討中とのこと。
しかしそんな中Gmailで日本時間24日18時半から2時間半の障害が発生。すでに復旧はしているが、原因は不明とのこと。
App Engine提供開始の発表にあわせるように障害とは・・・・運がないというかなんというか。
しかし本当に原因はなんでしょうね。あれだけのシステムなので障害内容が知りたいところです。
民間向けITシステムのSLAガイドライン―導入・契約方法、改善点、最新事例を網羅
- 作者: 電子情報技術産業協会
- 出版社/メーカー: 日経BP社
- 発売日: 2006/09
- メディア: 大型本
コメント 0