ANAのシステム障害

先日発生したANAのシステム障害を調べてみました。ANAは米国ユニシスのAirCore(エアライン・パッケージソフトウェア)というものを使っているようです。

原因は冗長化してあるデータベースシステムの片側がフリーズし、その為正常稼働しているデータベースへの過負荷でシステムが停止したとあります。

AirCoreを調べると基盤はWindowsかLinuxでデータベースシステムはOracleなようです。WEBシステムはIBMのWebSpherewを使い、開発言語はJavaなようです。過去の資料なのでどのバージョンかは知りませんが、どこにでもある似たような組み合わせだと思います。

既に日本ユニシスはBIPROGYという社名になり、米国ユニシスとは資本関係はありません。メンテナンスはどうしているのか知りませんが、恐らくBIPROGYが行っていると思いますが、詳しい事はわかりません。

現象的にはOracleのバグなように思います。修正パッチが出ていたそうです。パッチは適用していなかったとあります。「パッチを適用して何か問題になったら誰が責任もつんだ」という感じだったのかもしれません。よくある事です。

どんなシステムでも障害は必ず起きると思います。発生した時にどのように対応するかあらかじめ検討しておくことが重要だと思います。このような大規模なシステムであれば尚更だと思います。

今後JRはSUICAの決済を今まで改札機(クライアント側)で行っていたものをセンター決済にするようです。改札機が高額なので、全国に設置するのが困難である事から改札機のコストダウンに対処する為と聞きました。センター決済方式にした場合、今のようレスポンスは可能なのでしょうか。。どう設計するのか興味があります。
JR側では障害時は改札を全て開放するとか・・実際になってみないとわかりませんが。。

342233222322222222322222222222222222