トラブルは突然に

一頃に比べると「何かプログラムが途中で止まったんですけど」とか、「システムがなんかおかしいんです」的な話はかなりめっきり少なくなった。まぁ新しいシステムの開発を一切行っていないのがイチバンの要因なんだけど、それ以外にも保守段階に入ってるシステムの多くが1年以上動いてる安定稼動状態なので、まぁ危険性そのものが少なくなってますよという感じで今日を迎えるわけだ。
今日はもうそういう前提条件をクリアした逸物のトラブルが俺に襲い掛かってきた。まず、選択したキー情報に付随するコードを出すCSVファイルを出力するプログラムがエラーで終了。運用にどういう状態でシステムが落っこちたか聞くと、「28000行選択したら落ちました」とのご返事。大体原因を把握する。
VBOracleの接続はoo4oというDLLを使ってるわけなんだが、そのoo4oにはSQL文の長さに限界値があって、それを超えるSQL文を発行して失敗してエラー・・・というのが原因で、とりあえず2ファイルに分けて出力をお願いいたしマンモスと平謝りで陳謝し、トラブルを収束させる荒業を使う。
ほっと一息、クリスタルガイザーを口に持っていくとメール。件名は「エラーが発生しました」となっているため、6分くらい見なかったフリしてたら電話かかってきて、なんかこんなエラー起こってるんでメール見てください的な運用からの電話が。
調査したところ、Oracleの共有メモリのサイズを最初の設計時に多めに見積もらなかったためにORA-04031エラーという「たくさんゴミデータあって共有メモリにデータが入れられないよう!」状態になり、ダメリーマンに電話がかかってきた運び。急いではないと言われたものの、こんなエラー出たの初めてな上に明らかにパフォーマンスチューニングの分野のため、調査したものの良く分からん的な状態に相成ったと。
今日は厄日。月に1回あったらいいほうのこの手のシステム不具合が1日2件も。しかも両方とも結局放置して、根本的な原因の解決に至っていない。さっさと自社会議にかこつけて逃げ帰ることに。月曜会社行くのヤダなぁー。