YANO's digital garage

Copyright ©YANO All rights reserved. https://www.bravotouring.com/~yano/

Last-modified: 2024-04-10 (水)


[一語一絵/IT系]

ひかり電話の障害 / 2007-05-24 (木)

昨日23日の午前、また[External]ひかり電話の障害が発生。約3時間40分に渡ってNTT東西間で不通になったそうだ。

尾道水道の夕景
4/7 尾道水道の夕景@浄土寺山
本文と画像は今日も関係ありません

[External]14都道県に及んだ15日の大規模障害の記憶も覚めやらぬうちのトラブルに「またか!?」と思ったものの、今回はNTT東日本の子会社であるNTT-MEが提供する中継網に閉じた障害との事で、NTT東西を跨がない通話には問題が無かったそうだ。

障害の原因となったのは「中継系呼制御サーバの保守コマンドで誤ったパラメーターを入力した為に、HDD内のデータが破壊され、そのデータを参照した時に呼制御サーバが落ちた」という事だ。

もちろん、呼制御サーバは二重化されてスタンバイ系が待機していたはずだが、ソフトウェア障害なので系切替は行われなかった(系切替もソフトウェアが制御している為)というワケだ。

簡単に言うと、レア(稀少)ケースのバグ。保守コマンドのイレギュラーパラメーターのバグなんて開発側ではとっくに気付いて改修しているはずだが、実際には現場の実機への適用は見送られることが多い。

「保守者がその操作を誤る事象」と、「ソフト更新作業で不測の問題が発生する事象」を天秤にかけると、後者の方がハイリスクというのが業界の経験則だし、ベンダーとは言え運用中の実機に手を加えるというのは大義名分とか高度に政治的な戦術が絡むためだ。

が、今回はこのセオリーが裏目に出た格好で、誰かがババを引く事になるんだろうなぁ。

くわばら、くわばら…

【参照】
●NTT東日本 http://www.ntt-east.co.jp/
「ひかり電話」のNTT東西間接続装置の故障について(最終報) 2007年5月24日
●ITmedia http://www.itmedia.co.jp/
ルータ2000台が3秒でダウン 「フレッツ」「ひかり電話」大規模障害 2007年5月16日
ひかり電話でまた障害 NTT東西間が不通に 2007年5月23日
ひかり電話障害、人為ミスとソフトのバグが原因 2007年5月24日
●日経ITPro http://itpro.nikkeibp.co.jp/
【緊急解説】14都道県で障害発生,NTT東日本のフレッツ網にいったい何が 2007年5月18日
IP電話の大規模障害を食い止めよ 2007年5月23日
NTTのひかり電話障害はコマンド間違いが原因、待機系は稼働せず 2007年5月24日

[ ツッコミの受付は終了しています ]
1: Koji (05/24 23:19)
今週からSEもどきの仕事してます。
何をやるにも不安で・・・ コマンド打ち込んで作業するなんて事が有るとは思ってもいなかったし。
ド素人なのにサーバー扱ってます (..;)
「障害」を起こす原因が自分じゃ無いことを毎日祈ってます (^_^;)
2: YANO (05/25 00:54)
慣れるまではヒヤヒヤですね。でも慣れた頃が一番危ないのはクルマの運転と一緒です。
純正のセキュリティパッチとかにも「万が一」はありますので、
リハーサル環境で試してから本番機に適用するのがオススメです。