運用監視はルーティンワークが多くて、辞めたいなあ~。設計構築等の上流工程で知識や経験が活きるのかな?
運用監視→設計構築へキャリアアップした経験者の話を聞いてみたい!
こんなお悩みを解決します。
☑本記事の内容
・そもそも運用監視の仕事とは?
・運用監視経験が上流工程に活きる部分
・運用監視経験が活きる上流工程の仕事2点
・あなたが上流工程に進むためには?
☑本記事の信頼性
・運用監視保守経験6年以上
・2つの現場で運用監視保守を経験
・運用~構築へキャリアアップした経験有り
僕も運用監視をやっていた時代は、このように思っていました。
ルーティンワークばかりで技術が身に付きづらいけど、実際に設計構築等の上流工程へキャリアアップした際に経験が活きるのかな?
現在、運用監視業務に取り組んでいる方は同じことを思っているはずです。
大丈夫です!あなたの経験は上流工程で活きます!
実際に運用監視~設計構築へキャリアアップした僕が言っているので間違いはないです。
今回は、自分の経験も踏まえて、どの部分が上流工程に活きるのか解説していきたいと思います。
では、本題に入っていきたいと思います。
注意ポイント
本記事は、インフラエンジニアとしてのキャリアを目指す人向けの記事になります。
WEBエンジニア等、開発エンジニアを目指す方には参考にならない可能性があります。
そもそも運用監視の仕事とは?
運用監視の仕事は大まかにこのような形になります。
・アラート対応
・定常作業
・サービス確認
詳しくは、過去の記事でも解説しております。
本記事でも簡単に紹介します。
アラート対応
運用監視業務の中で「アラート対応」が一番メインの業務です。
仕事の流れ
①アラート検知
②パトランプ発砲
③マシン調査&手順書に従い一次対応実施
④一次対応NG(アラート検知時に即エスカレ)であれば、担当者へ電話(もしくはメール)にてエスカレーション
ちなみに、パトランプはこのような感じの品です。
DN-1500UX-3LCB 警子ちゃん4UX (3層LED灯・色付レンズ・ダークグレー・USB型)
アラートが検知したら、こちらのパトランプのスイッチを押して止める形になります。
アラートが多い場合は、パトランプが鳴りやまないので止めるのが大変でした。。。
定常作業
定常作業とは、決められた時間に行う作業です。
僕が経験してきた定常作業
・バッチ処理実行(手順書に従いながら)
・ファイル登録作業
・実機ランプ確認
・OSの起動状態確認(ハングアウトしていないかどうか?)
など
基本的にマニュアルが存在するので、マニュアルに従って作業を実施する形となります。
マニュアルがしっかりしているパターンが多いので、IT未経験者でもすぐに取り組める作業になります。
サービス確認
企業がリリースしているサービスが想定通り動作するのか確認します。
サービス確認は、アラート対応時に確認する以外にも定常作業の一環で確認します。
具体例
・POSシステムの動作確認
→会計処理やクレジットカード決済が想定通りに動作するのか?
・チャンネル等の映像確認
→映像に乱れがないか?ブラックアウトしていないか?等
このような形でサービス確認を実施します。
(具体例に上げたものは、今までに自分がやってきた業務内容になります。)
サービス確認がNGであれば、切り分け作業の実施や担当者へエスカレーションをする形になります。
たまたまサービス確認をしていて、エラーを見つけたときはよく「めんどくさいな~」と思うことが多かったです。
しかし、今ではそのエラー対応経験も良い経験になっています。
運用監視経験が上流工程に活きる部分
・「やっていいこと」と「やってはいけないこと」の判別がつく
・運用側の気持ちを考えながら仕事ができる
・プログラミングスキル
「やっていいこと」と「やってはいけないこと」の判別がつく
経験者目線だと、これが一番の活きる部分です。
なぜなら、「何をやればサービスに影響が出るのか?」という観点で業務に対して慎重に取り組むからです。
この点については、以前Twitterでもツイートしています。
https://twitter.com/satton6987/status/1271454550591823873
具体的には、
- OSシャットダウン等のクリティカルな作業をする場合には念入りに確認できる。
- 作業の意味を事前に確認できる。
- コマンドを叩くことによって、走る処理を事前に確認できる。
になります。
運用監視経験者の場合は、「やってはいけないこと」のレクチャーが不要です。
そのため、運用監視経験があると信頼されやすいです。
未経験者の場合は何も知らないので、OSシャットダウン等のクリティカルな処理を実行してしまいがちです。
運用監視経験者は、「間違うとどうなるのか」を知っているので作業に信頼性があります。
運用側の気持ちを考えながら仕事ができる
運用側の気持ちを考えながら仕事ができます。
ポイント
・監視している機器の作業を実施する際には、必ず一報を入れる。
・運用監視者に負荷がかからないような監視設定ができる。
・運用監視者の技術レベルを思い浮かべながら、引き継ぐ手順書を作成できる。
など
このように、運用監視側の気持ちを思い浮かべながら設計構築業務をすることができます。
ちなみに、運用監視者は下記の図の通り、アラートを検知すると「うるさい!」と思っています。
(アラートが鳴りすぎて、パトランプのボタンを強めに押す人もいるくらいです。)
この気持ちの部分を理解していると、上流工程に進む場合に強いです。
僕自身もアラートが鳴りやまなくて苦労した経験があります。
アラート対応時に思った感情や経験があると、「運用監視側に楽をさせたい」と思うようになりますよね~。
プログラミングスキル
これはインターネット検索ができる現場限定になりますが、プログラミングスキルを身に着けることが可能です。
(検索できない現場でも、外でスマホを用いて検索する等、うまくやればできる可能性があります。)
具体例
・TeraTermを用いたログ確認自動化ツール
・パトランプを押さなくてもPC上で止めることができるツール
・Excelのデータ自動入力ツール
・Excelのデータ抽出ツール
など
このように、運用監視の現場はプログラミングを通して改善できることが意外とあります。
プログラミング経験が上流工程に活きる例としては、
- Infrastructure as Code(Ansible/chef等)
- スクリプト(bash/PowerShell等)
- 構築準備で必要なデータを抽出するツール
などです。
実際の構築作業でも構築準備でもプログラミングスキルは活きます。
運用監視時代にVBAを使って改善活動に取り組んでいましたが、結果的に良い経験になりました。
実際の構築業務の現場でも、VBAを用いて改善をしております!
運用監視経験が活きる上流工程の仕事2点
①インフラ設計構築
②インフラ運用設計
①インフラ設計構築
冒頭から何度も言っておりますが、インフラ設計構築に運用監視経験を活かすことができます。
なぜなら、
- 運用監視者に配慮した設計にできる。(故障しづらい等)
- 監視の仕組みを理解した上で業務ができる。
- 信頼されやすい。
- トラブルシューティングが活きる。
- プログラミングスキルを活かすことができる。
からです。
特に一番構築業務をやっていて思うのは、「信頼されやすい」ということです。
僕もそうですが、運用監視経験者は慎重に作業を実施する傾向があります。
以前、他ベンダーで設計構築業務をやっている方と飲みにいきました。
そこで構築について会話をしましたが、やはり「運用経験がある人に来てほしい」と言っていました。
このように、設計構築業務も運用監視業務と同様に、「ミスなくこなす」ことが求められます。
僕自身も構築業務をやる際は、設定ミスがないか念入りに確認しながらやっています。
運用監視から上がった人は、僕と同じような方が多いのではないでしょうか??
②インフラ運用設計
僕自身は経験がありませんが、インフラ設計構築以上に活きる仕事だと思います。
なぜなら、運用監視の現場の気持ちを知っている状態で運用設計を実施することができるからです。
運用設計の仕事内容
・運用フローの作成
・エスカレーション先担当者との調整
・監視方法を考える
・オペレーターの切り分け手順を考える
など
下記、書籍に詳しく書いているので是非読んでみては?
(Kindle Unlimitedのメンバーシップに含まれています。)
このように、「監視オペレーターが実施する監視業務の流れ」を考える仕事です。
活かせないはずがないと思います。
運用側の目線として、運用監視からキャリアアップした人に運用監視の設計をやってほしいものです。
運用監視業務は、運用設計業務に活きます。
なぜなら、オペレーターが行う監視業務を設計する仕事だからです。
あなたが上流工程に進むためには?
①学習を怠らないこと
②社内(もしくは社外)に技術を発信すること
③業務改善に積極的に実施すること
※以前にも似たような内容で記事を投稿しています。
①学習を怠らないこと
「学習を怠らないこと」が一番大事です。
なぜなら、僕自身学習を続けた結果として設計構築業務に携わることができているからです。
学習方法
・現場での監視方法/しくみについて勉強をする。(Zabbix等)
・AWSやVirtualbox等、なんでもいいので実際にサーバーを立ててみる。
・資格の勉強をする。
など
僕はLPIC等の資格取得以外にもAzure上にZabbixを構築する等してアピールしました。
このように、常に学習し続けることが非常に大事です。
実際にやってみて、自分でサーバーを立ててみることが一番の勉強になったと感じます!
②社内(もしくは社外)に技術を発信すること
社内(もしくは社外)に技術を発信することも大事です。
なぜなら、「自分はここまでできる!」ということをアピールすることができるからです。
具体的には?
・社内にナレッジを掲載するプラットフォームがあれば、積極的に投稿する。
・定期的に営業や上司に勉強した内容をドキュメント等でアピールする。
・Qiitaやnoteに技術情報を発信する。
・YouTubeで技術解説動画を投稿する。
など
上げればキリがありませんが、方法はいくらでもあります。
僕自身も本ブログ以外にもQiitaやYouTubeにてアウトプットをしております。
※会社内のプラットフォームにもクラスターについてナレッジを投稿しています。
資格取得と同時並行でやっていくことが一番コスパがいいですね。
自分のやりたいことと勉強したことを定期的にアウトプットしていくことは、大事です!
③業務改善に積極的に実施すること
上でも申しあげている通り、業務改善(運用改善)は積極的に実施しましょう。
業務改善の例
・単純作業の自動化
・アラート削減のための調整
・作業手順書の簡略化/省略
運用監視のみならず、どの職場にも改善すべき点はあります。
(3~4案件渡り歩きましたが、完全な職場はありませんでした。)
職場のポリシー上、単純作業の自動化ができないんです。。。
このような方は、「アラート削減のための調整」や「作業手順書の簡略化/省略」等という部分で勝負するのも有りです。
調整スキルも設計構築業務では大いに活きます!
職場の課題は、洗い出せばいくらでも出てきますので、一歩一歩課題解決をしていきましょう!
運用監視業務での単純作業の自動化について、空き時間に取り組んでいましたが、やっていて楽しかったです。
まとめ:運用監視経験は上流工程に活かせる!
経験者視点で運用監視が上流工程に活きる部分について、ご紹介してきました。
単純作業ばかりで上流工程に経験を活かすことができるのか不安になる気持ちはわかります。
しかし、大丈夫です。あなたの運用監視の経験が活きます!
上流工程の仕事で、運用者の視点は重要です。
ただ、エンジニアとしてキャリアアップしたい方には長居禁物な職種ではあります。
そのため、自己学習や業務改善を継続しつつ、次のステップに進むための情報収集をしていくことは重要です。
本記事が、あなたのキャリアアップに一つでも参考になると嬉しいです。
今回は、以上です。
Twitterもやっております。
運用監視についての情報やインフラエンジニアのキャリアハックについて発信しております。