NTTフレッツ障害

通信キャリアにいる私としては、何とも言えない障害でしたな・・・。
友人まで公開じゃないととても書けん。

〜以下、専門用語が出るので注意〜
まず、私が行っている会社はIP-VPNも提供してるのですけど、
ユーザの足回り回線はNTTフレッツなので、
ユーザでLinkDown多発した時は何事かと思いましたね。
ウチの障害か?と。
その後、ウチ原因でもなく回線が復旧もしない、
ユーザが東日本でしか発生してないということから、
「こりゃあ、NTT東の原因で、もしかしたら大規模障害かも・・・。」
と思ったのですが、ビンゴでした。
通常はそんなに復旧に時間かからないから、長期化するとは思ってました。

んで、職場では今回の障害の話で色々な話をしますた。
○パケットのループが発生したんじゃないか(ブロードキャストストーム)
○障害機器が伝送装置と書いていたから、実はルータじゃなくて、
 L2レベルのATM装置じゃないか。もしくはスイッチ?
○MPLSとかルーティングの問題?

まあNTTの説明だと、ルートフラッビングらしいですが。
(実はウチの機器でも良・・・うわっつなにを!deindieode・・・)

ただ、パッケージ交換→機器組み込み作業は日常的に
やっていたはずで、なんでフラップしたのか、
そこが理解できない。
まあ、理論だけでは現実に起きている問題に対処できないのは
保守運用をやっている身として痛いほど分かっているので、
別にそこはいいんですけど。

まあ、会う人には良く言ってるんですけど、
少なくとも現在のIP網にアナログ時代の性能を
求めるのはムリがありますよ。
IP-PHONEがPSTN(固定電話)に変わりつつあるけど、
その辺の脆弱性を理解しないでIP-PHONEを導入することは
絶対にオススメしません。

あと、この障害について書いている日記もいくつか読みましたけど、
知ったかしてる人がチラホラ。
(まあ、私もエラそうなこと言えんけど)
IP網逝っても緊急通報は出来るようにしろとか、
(そんなん、固定電話網を併設して障害時に
切り替えできるようになってないとムリ。)
IP-PHONEと別のルーティングしろとか。
(いや、そんなんムリだって。そもそもソースIP一つでしょ?)

ただ、NTTのネットワーク設計に問題があったのは事実だろうなあ。
拡張に継ぐ拡張だろうからつぎはぎなネットワーク設計になってそう・・・。