客先でのトラブルシューティング(かなり加筆しました)
YO茶でございます。
ここ数日一気に気温が上がりましたね。今日は朝5時半に起床、10km程のランニングに行ってきました。丁度起きた時刻に、埼玉の弟みたいな存在のTOMからメッセージが。それに即レスしたところ、たいそう驚いていました。
できる人間は朝が早いのだよ、ヌハハハ!(なんてね^^;)
さて、昨日、今私が担当しているお客様先に出張し、トラブルシューティングを行ってきました。
私たちが導入する新しいシステムと、現在お客様が使われているシステムとの相互接続を行ったのですが、いくつかの問題が発生していて、その問題を解消するためでした。
特に重たい問題は2つ。この2つが解決しないと、そもそも新システムの導入そのものが延期、最悪の場合中止という事態もありえる位、クリティカルなものでした。
一番大きな問題については、発生トリガーがまだわかっていません。そこで、まずは再現時の条件を見つけ出すことから始めます。これが実に難しく、前回の試験時にみつけられませんでした。
今回、プロジェクトチームのテックリードである後輩M君と一緒に確認したのですが、最初はわかりませんでした。しかし、M君が、過去に同様の事例がないか調べていた中で、ある事例をポロっと言ったことを私は聞き逃しませんでした。
それだ!
すぐさま検証します。通信の方向性と通信機器の種類の組み合わせから4パターンのテストを行います。
すると1パターンだけ問題が発生することが判明!
再現方法を発見したのでした。
これは非常に大きな前進です。なぜなら、再現方法がわかっていないとなんらかの対応を施したとしても、それが治ったかどうか確認できないからです。
少し遅れて一緒にトラブルシュートを行うため既存システムを構築した会社の方が来られました。彼らもいろいろ調べてきて来れていて、既存システムのある設定を変更することでうまくいく可能性があると言うことでした。
その設定変更を実施したらなんと!現象が発生しなくなりました!
よっしゃあーーーー!!!
時間の限られた中、お客様先でのトラブルシュートを解決できるのは、なんとも言えない快感ですね。
その後、2つ目の大きな問題解決に着手しましたが、こちらはなかなか糸口が見いだせない。システムの再起動や設定の入れ直しまでいろいろやってもだめ。
なにげなく後輩君がサービスの非活性化/活性化(分からない方は雰囲気だけ楽しんでくださいませ^^)を行ったら解決。。
サービスの再起動やサーバの再起動までやったので、そこは盲点でした。。
その後、これまで出てこなかった新たな問題が発生し、かなり痺れる瞬間もありましたが、なんとかそれも解消。大きな問題は解決することが出来ました。
ひとつだけ問題を積み残したのですが、現場でやれることはもうないため、これで退館。
客先を出たのは午後9時。ほぼ12時間、会議室にこもっていたんだなぁ。。
外の空気を吸った瞬間、草木のにおいがしました。
いやー、久々の現場でのトラブルシュート、痺れたなぁ。
プロジェクトマネージャになったことで、こういう現場に行く事は減っていたのですが、やはり、継続して現場でいろいろ経験することは大事ですね。
#日々感謝 m(_ _)m