14日に発生した全日空システム障害だが、原因と再発防止策が発表された。
1日2本と稀少な箱崎止り 画像と記事は関係無いっす |
掻い摘んで言うと、2005年に再構築した「able-D」のサーバーにおいて、暗号化認証機能の有効期限が2008年9月14日未明で切れてしまった為に、able-D端末が接続できなくなったという事だ。
これは「サーバー導入」と「機能の運用開始」に時間差が生じた事に起因するチェック漏れで、初期設定「3年」のまま放置されていたという経緯から、いわゆるサーバー証明書の期限切れだと思われる。
結果としての「証明書の期限切れ」というのは、Webサーバーなどを考えると非常にありがちな障害なので、ちょっと他人事じゃないね。
ただ、そんなんで6~7時間も航空会社の基幹と言ってもいいチェックインシステムが止まってしまうというのは驚きだ。いきなり接続エラーじゃなくちゃんと警告を出した上で接続できるようにするとか迂回路を用意しておけば原因究明やリカバリーも早かったと思うのだが、そうなってなかったのかな。
確かにネットワークが閉じてるようなイントラネットであれば「100年後など影響が及ぼさないように変えておくべきだった」という対処もあるが、じゃあ何の為に暗号化しているのかという事を考えるとそれはあまりに乱暴な気がするよ。
トラブル原因というのは得てして「そんな程度」のものである事が多いのだが、大きい事は必ずしもいい事ばかりじゃない。
【参照】
●ITpro http://itpro.nikkeibp.co.jp/
┣全日本空輸,脱メインフレームで70億円削減へ 2007年7月30日
┣〔速報〕全日空の国内空港システムで障害、復旧のメド立たず欠航便も 2008年9月14日
┣〔続報〕全日空の搭乗システムが暫定復旧、日付処理の問題が濃厚 2008年9月14日
┣国交省が全日空に指導、「5・27」の教訓を生かせたか 2008年9月17日
┣[速報]全日空が搭乗システム障害の原因特定、接続の有効期限を設定ミス 2008年9月18日
┗全日空のCIO、搭乗システム障害について会見、「担当者の会話が不十分だったためのごく初歩的なミス」と反省の弁 2008年9月18日
●スラッシュドット・ジャパン http://slashdot.jp/
┣名古屋市のサイト、証明書期限切れ 2008年2月25日
┗全日空のシステム障害は「有効期限切れ」が原因 2008年9月19日
●ANA 全日空 http://www.ana.co.jp/
┗9月14日 国内線搭乗手続き端末に発生した不具合の原因と再発防止について 2008年9月18日