運用監視オペレーターの仕事の実態について知りたいです!
暇と聞くけど、実際どうなんだろう?
こんなお悩みを現役インフラエンジニアが解決します。
☑本記事の内容
・そもそも運用監視とは?
・運用監視は暇なのか?
・暇な時間にやっておいた方が良いこと
☑本記事の信頼性
・運用監視歴約6年半
・運用監視の現場を2つ経験している
このように、運用監視歴が約6年半もあります。
良いことも悪いことも経験してきました。
また、2つの運用監視の現場を経験しておりまして、働いた現場は以下になります。
今まで経験した運用監視の現場
・POSシステムの運用監視業務
・映像配信システムの運用監視業務
このように運用監視の現場を2つも経験しているため、実態に関して詳しいです。
YouTubeでも運用監視についての動画を上げています。
今回は、運用監視経験者である僕が運用監視オペレーターの仕事が本当に暇なのか!?ということについて解説していきたいと思います。
では、本題に入っていきたいと思います。
そもそも運用監視とは?
運用監視業務とは、一言でいうと「24時間365日動いているシステムを止めないように見守る仕事」です。
ポイント
- サーバーやネットワーク機器に異常があった場合に対応する。
- 障害発生時に切り分け作業を実施し、必要に応じて担当者へ連絡する。
- サービスに異常がないか確認する。
こんな感じで、システムに何かあったら対応する仕事になります。
運用監視業務は、まさに「システム界の門番」のような形の仕事になります。
襲ってくる障害に対してシステムを全力で守ります。
運用監視は暇なのか?
結論、「ほぼ暇」という感じです。
※あくまでも現場に寄ります。2つの現場を経験した僕の体感になります。
なぜなら、
- アラート対応や作業がない時間は空き時間になる
- ルーティンワークが多い
からです。
運用監視の主な仕事はこちらになります。
運用監視の主な仕事
・アラート対応
・定常作業(決まった時間に実施する作業)
基本的にマニュアルに沿って対応する形になります。
そのため、ルーティンワーク化しやすいです。
僕が運用監視の現場で体感した「暇」と「忙しい」の割合はこちらになります。
「暇」と「忙しい」の割合
暇
80%
忙しい
20%
このように暇な時間の割合の方が多いです。
※こちらはあくまでも僕が経験した現場の話です。現場によっては忙しいかもしれません。。。
忙しい時ってどんな感じなんですか?
このような疑問を持つ方もいらっしゃると思います。
忙しい時は、本当に忙しいです。
電話対応やメール対応、アラート対応や切り分け作業等、やることが多いです。
1日中パトランプからアラートが鳴りやまないときもあります。
まとめると、
- 暇な時間の割合が忙しい時間より多い
- 忙しい時ははマジで忙しい
になります。
自分の勤務時間中に何のアラートが出るかわからないです。
そうです!まさに「ガチャ」です!
暇な時間にやっておいた方が良いこと
アラート対応や作業がない暇な時間にやっておいた方が良いことはこちらになります。
・業務改善
・障害対応のシミュレーション
・自己学習
では、掘り下げていきたいと思います。
業務改善
暇な時間を使って業務改善に取り組むのが一番ベターになります。
なぜなら、
- 今よりも業務が楽になる
- 運用監視業務での実績を残すことが出来る
- 技術力や調整スキルが上がる
からです。
僕も運用監視オペレーター時代に業務改善をやってきました。
業務改善でやってきたことについてご紹介します。
業務改善でやってきたこと(一部)
〇監視不具合アラートの削減(月300件→月100件)
担当者との調整や監視除外作業等
〇パトランプを押さなくてもPC上で止めれるツールの作成
→フォームを起動してボタン1発でパトランプを止めるツール
使用技術
WordVBA,TeraTermマクロ,VBA,bat
〇ログ確認簡略化
→マクロを1発起動するだけで、必要な確認ができるマクロを作成
使用技術
TeraTermマクロ
このように、調整~ツール作成迄いろいろ取り組んできました。
運用監視時代の経験が今の業務に活きていると感じます。
詳しくは、以下のブログでも解説しております。
運用監視からのキャリアアップについて気になる方は御覧頂ければ幸いです。
夜勤の4:00~7:00のめちゃくちゃ眠い時間帯はどうしていますか?
このような疑問を持つ人も中にはいると思います。
眠い時間帯は、すいませんが以下をやっていました。
・一緒に働いているメンバーと雑談
・ネットサーフィン
眠い時はそもそも業務改善に集中できないため、やりようがないです。
そのため、眠いときは無理せずに息抜きをするようにしていました。
まとめると、
- 暇な時間があれば業務改善に取り組むべし!
- 眠いときは息抜きをしよう!
になります。
暇なときは業務改善に取り組むようにしていましたが、どうしても人間なので眠いときは眠いです。
眠いときは、GoogleMap等を眺めながら一緒に働くメンバーと雑談をしていました。
障害対応のシミュレーション
障害対応のシミュレーションはやっておいた方が良いです。
なぜなら、
- いつ大規模故障を引くか予測できない
- もしものときに動けるようにする
という理由だからです。
僕が実際にやっていたことはこちらになります。
実際にやっていたシミュレーション等
・テスト用Linuxサーバでvi操作の練習
→障害発生時にLinuxの中のconfigファイルを編集する必要があるため
・対応マニュアル通りにできるところまでやってみる
→できないところはマニュアルを読むだけにする
・過去のインシデント対応について確認
→どのような対応をしているのか?をインプットしておく
このように何かあったときの対応について確認しておくことは、運用監視業務をやる上で大事です。
自分一人だけで完結しようとはせずに、メンバーを巻き込んで故障演習を企画するというのも一つの手です。
「故障演習を企画した」という実績にもなりますし、メンバーを巻き込んで何かやる力を身に着けることができます。
まとめると、
- 暇な時間は障害対応のシミュレーションもやっておいた方が良い
- メンバーを巻き込んでシミュレーションをやると自分の実績にもなる
ということになります。
暇な時間に障害対応のシミュレーションをしておくと、障害対応がスムーズになります。
必要に応じてマニュアルの分かりにくい箇所を修正しておくということも悪くないです!
自己学習
空き時間に自己学習をするという選択も悪くないです。
なぜなら、空き時間を有効活用できるからです。
僕も映像配信システムの運用監視に携わっていた際は、空き時間にLPIC Level1を勉強していました。
なぜなら、LPIC Level1の知識(特にLinuxコマンド)が業務に直結するからです。
上司にも取得するよう念を押されていました。
しかし、あくまでも空き時間での自己学習は優先度低めにした方が無難です。
空き時間の自己学習は優先度低めにした方がいい理由
・あくまでも仕事をするために現場にいる
・お客さん目線だと「仕事をしてほしい」と思う
※客先常駐の場合
そのため、業務に直結する資格の勉強等は問題ありません。
しかし、業務に直結しない自己学習については控えておいた方が無難です。
「業務改善」「障害対応のシミュレーション」を優先度高めに取り組んだ方が現場からの評価が良いです。
「自己学習」に関しては、業務に直結することであれば積極的に取り組みましょう!
まとめ : 運用監視は暇なときはマジで暇です!
今回は、運用監視の現場の実態についてお話をしました。
結論、「暇な時が多いが、忙しい時はマジで半端ない!」という感じです。
暇な時間をどのように使うかで将来のキャリアが大きく変わってきます。
ネットサーフィンやスマホゲームばかりやっているようだと、キャリアアップが難しいです。
「今何ができるか?」と自分で考えて行動していくことが、キャリアアップの道です!
アラート対応については、いつ何がでるかわからないので対策をしておいた方が良いです。
そのため、暇な時に「業務改善」や「障害対応のシミュレーション」に取り組むことが大事です!
ということで、現場からは以上です!
以下の媒体でインフラエンジニアに向けた情報発信等を行っております。
良かったらチェックしてくれると嬉しいです!
- YouTube