監視オペレーター

約6年半経験した運用監視オペレーター業務経験について話をします。

 

あなた

さっとんさんの運用監視オペレーターで具体的にやっていたことを知りたい!

 

こんなお悩みを運用監視オペレーター経験者のさっとんが解決します。

 

☑本記事の内容

・僕の簡単な経歴を紹介
・POSシステムの運用監視
・映像配信システムの運用監視

 

☑本記事の信頼性

・2つの現場で運用監視を6年半程経験
・現在はインフラエンジニアとして勤務

 

このような形で運用監視の現場を2つ経験し、現在はSIerでインフラエンジニアとして勤務しています。

僕の詳しい経歴が知りたい方は、以下のnoteの記事を読んでもらえればと思います。

私のインフラエンジニアとしての経歴を紹介します

 

本記事を読むメリット

・僕が運用監視オペレーター時代にどんな仕事をしていたのかわかる。
・現在、運用監視オペレーターとして働いている人の参考になる。(多分)

 

今回は、2つの運用監視の現場で経験したことについてご紹介していきたいと思います。

 

今回話すポイント

・プロジェクト概要
・仕事内容
・機器の台数
・技術
・勤務時間
・実績

 

「運用監視の現場を2つ経験している」という人をインターネット上であまり見たことがないので、貴重だと思います。
気になる方は、最後までご覧下さい。

 

本記事に関係する動画もUPしております。

 

 

動画よりも詳しい内容をこちらの記事に執筆していきたいと思います。

 

では、本題に入っていきたいと思います。

 

今までの簡単な経歴

 

IT業界歴は、10年程になります。

 

経験したフェーズや立ち回りは以下になります。

 

経験したフェーズや立ち回り

■経験したフェーズ
・運用監視
・運用保守
・設計構築
・運用設計
・要件定義
※要件定義フェーズは3ヶ月程経験

■立ち回り
・プロジェクトメンバー~プロジェクトリーダーを経験
・プロジェクトリーダーは、3ヶ月程経験
※一人リーダーやサブリーダー的な立ち回りも経験

 

このように上流工程~下流工程まで一通り経験しております。
特に運用監視経験が長いので、運用周りに強みを持っていると感じています。

 

経験した技術は、一部抜粋にはなりますが以下になります。

 

経験した技術

【クラウド】
■AWS
EC2/EBS/Lambda/CloudWatch/SNS

■Microsoft365/Azure
AzureADConnect/ExchangeOnline

【仮想化基盤】
■VMware
FC-SAN/IP-SAN/SAS/vSAN

■OpenStack
Juno/Mitaka

【OS】
■WindowsServer
WindowsServer(2003/2008/2012R2/2016/2019)

■Linux
RHEL/CentOS(6系/7系)

【ミドルウェア】
■クラスタソフト
LifeKeeper/RHCS

■Microsoft系
ExchangeServer

【コード系】
■構成管理(使用経験のみ)
Ansible/ServerSpec

■スクリプト
PowerShell/bash

■マクロ
ExcelVBA/WordVBA/TeraTermマクロ

【コード管理】
GitLab

 

スキルセット的にサーバーエンジニア寄りです。
特にLinuxを触ることや、PowerShell等でコーディングをすることが好きです。
L2スイッチも経験してきましたが、書くと長くなるので本記事では省きます。

 

このように様々な技術やフェーズを経験してきました。

 

運用監視経験が一番長いです。(約6年半)
今思えば、長くやりすぎたと後悔しております。

さっとん

 

POSシステムの運用監視

新卒の会社で3年4ヶ月経験したPOSシステムの運用監視の現場経験について話をします。

 

・プロジェクト概要
・仕事内容
・機器の台数
・技術
・勤務時間
・実績

 

それでは、紹介していきます。

 

プロジェクト概要

POSシステムを開発しているメーカーでPOSシステムの運用監視業務をやっておりました。

新卒のSIer企業で働いていた際に、最初に配属された現場になります。

 

もう7年以上前なので、懐かしいです。

さっとん

 

仕事内容

当時やっていた仕事内容としては、以下になります。

 

仕事内容

・アラート対応
・定常作業
・テープバックアップ作業
・帳票印刷
・サービス確認
・入館者アテンド対応

 

メインの業務としては、「アラート対応」「定常作業」になります。
覚えている範囲で仕事内容を紹介します。

 

アラート対応

①パトランプが発報するので止める
②マニュアルから該当するアラート対応手順を探す。
③マニュアル通りに対応する

 

図としては、このようになります。

7年以上前で記憶が曖昧ですが、当時は拠点のネットワーク系からのアラートが発報することが多かったです。
アラート発報毎に担当者に電話をする必要があったので、地味にしんどかったです。
しかし、電話やメールの対応に慣れることができたので良かったです。

 

定常作業としては、以下になります。

 

定常作業

①「Microsoft Access」というMicrosoftのデータベースソフトから時間毎のタスクを確認する。
②タスクを実施する時間になったら、マニュアルに従って確認&処理実行作業を実施する。
例)「22:00 ジョブ実行作業」というタスクがある場合、22:00になったらマニュアルに従ってWindowsServerを開いて対応する。

 

この定常作業でやっていた主なタスクは、

  • WindowsServerのハングアップ確認
  • WindowsServerの処理エラー確認
  • 日次ジョブ実行作業

になります。

 

他にもいろいろとタスクがありましたが、基本的にマニュアルに従って対応する作業ばかりでした。

 

3年4ヶ月やりましたが、技術力はほぼ身につかなかったです。
しかし、メールや電話等のビジネスマナーは身につきました。

さっとん

 

機器の台数

運用監視なので監視していた機器の台数は曖昧ですが、おおよそ以下の台数になります。

 

機器の台数

サーバ
100台〜150台

NW機器
100台程

 

サーバールームに何度も足を運んでいますが、台数までは把握できなかったです。。
把握できたのは、サーバールームの広さぐらいでした。

さっとん

 

技術

当時、使用していた技術は以下になります。

 

ポイント

・WindowsServer(2000/2003/2008)
・NWスイッチ(Yamaha)
・UNIX系OS
・JP1(ジョブ管理)

 

主にWindowsServerと日立のジョブ管理ソフト「JP1」を触ることが多かったです。
UNIX系OS(おそらくSolaris)やNWスイッチはほぼ触ることがなかったです。
※NWスイッチは、ポートのランプ確認ぐらい。

 

当時は、WindowsServer主流で運用監視業務を実施しておりました。

 

マニュアル通りにマウスポチポチで対応する仕事だったので、技術スキルは身につかなかったです。

さっとん

 

勤務時間

当時の勤務時間としては、以下になります。

 

勤務時間

シフト制2交代勤務

日勤
09:00-17:30

夜勤
17:15-09:30

※週休2日制で休暇が不定休になります。

 

日勤自体は一般企業によくある勤務時間ですが、夜勤が約16時間となかなかえげつなかったです。
また、職場に仮眠室もなければ仮眠時間もなかったので、今思えばよくやっていたなと思います。
夜勤明けで帰宅する頃には、変な汗がダラダラでした。

 

この動画でも当時の苦悩について語っているので、良かったらご覧下さい。

 

 

このように、夜勤が約16時間という長丁場で仮眠がない中、戦っていました。

 

夜勤16時間で仮眠がないのは、けっこうきついですね。。

さっとん

 

実績

当時は、今後のキャリアについて迷いに迷っていたので、残念ながら実績が上げられませんでした。

 

しかし、仕事を通して、以下について学ぶことができました。

 

仕事で学んだこと

・メール対応
・電話対応
・システムに対するお作法

 

また、この期間に「日商簿記検定3級」を取得しております。

 

日商簿記検定3級については、履歴書に書くと毎回突っ込まれます。
そのため、仕事で簿記の知識を必要とする場合以外は書かないと思います。

さっとん

 

映像配信システムの運用監視

 

次は、転職後の映像配信システムの運用監視の現場での経験について話をします。
こちらの現場でも3年4ヶ月勤務しておりました。

 

・プロジェクト概要
・仕事内容
・機器の台数
・技術
・勤務時間
・実績

 

それでは、紹介していきます。

 

プロジェクト概要

某通信系企業での映像配信システムの運用監視業務をやっておりました。

新卒の会社から転職してすぐ配属されたプロジェクトになります。

 

人生で2回目の運用監視の現場になります。

さっとん

 

仕事内容

当時やっていた仕事内容としては、以下になります。

 

仕事内容

・アラート対応
・サービス確認
・定常作業(朝と夕方)
・バックアップテープ交換
・自動化マクロ&便利ツール作成
・マニュアル作成&修正

 

メインの業務としては、「アラート対応」「サービス確認」になります。
覚えている範囲で仕事内容を紹介します。

 

アラート対応

①アラートの発報を止める。
②LinuxサーバにTeraTermでSSHログインして、確認コマンドを駆使して確認を実施する。
③インシデントに記録する。(何かあればエスカレーション)

 

こちらの現場では、Linuxの確認コマンドは必須知識でした。
そのため、現場に配属されてから2~3ヶ月程でLPIC Level1を取得しました。
結果、Linuxのコマンド操作に慣れて業務に適応することができました。

 

アラート対応についての流れは、POSシステムの運用監視の頃と同様になります。

 

 

 

この頃は、監視ソフトウェアから発報される監視不具合アラートに悩まされていた記憶があります。
(なかなか大変でした。。)

 

この時代に使用していたLinuxコマンドは、以下の動画でご紹介しております。
気になる方は、ご覧頂ければと思います。

 

 

 

 

 

サービス確認については、機器毎に送出している映像を確認し、どこかに異常が出てないか切り分け対応を実施する業務になります。

 

サービス確認

①モニターに該当の映像を映す
②音声が聞こえてなかったり、ブロックノイズが走っていないか確認する。
③ブロックノイズが走っていたら、機器ごとの映像を確認し、切り分け対応を実施する。
※場合によって、復旧対処やエスカレーションを実施する。

 

何か映像で異常が発生した場合にどこの機器が故障しているのか判別する必要がありました。
例えば、ライブ配信エンコーダーが故障している場合は、エンコーダーの切り替え対応等を実施する必要がありました。
「どのように映像が送出されているのか?」という観点では、非常に勉強になりました。

 

ライブ配信エンコーダーについては、以下のNECのサイトにて解説してあります。
気になる方がいれば、ご覧下さい。

 

 

映像配信システムの運用監視業務としては、以上のようになります。

 

この現場でLinuxを触ることの面白さを知りました。

さっとん

 

機器の台数

こちらも運用監視なので機器の台数は曖昧ですが、以下のようになります。

 

機器の台数

■サーバ
200台〜250台

■NW機器
100台程

 

運用監視業務では意識することはないですが、VMwareの仮想マシンも触っていました。
そのため、サーバの台数はさらに多くなると思います。

 

運用監視業務で機器の正式な台数は、正直分からないですね。

さっとん

 

技術

当時、使用していた技術は以下になります。

 

ポイント

・Linux(RHEL6系/CentOS6系)
・WindowsServer2012R2
・NWスイッチ(Cisco Catalyst等)

 

体感的にLinuxが80%程の現場になります。
Linux中心ではありますが、一部のシステムでWindowsServerを使っていた形になります。
NWスイッチもログイン後、「show interface」等の確認コマンドを駆使して確認作業を実施することが多かったです。

 

POSシステムの運用監視の頃よりは、幅広い技術に触ることができたと感じております。

 

LinuxコマンドやCiscoコマンドについての知識は、この現場で働かないと学べなかったですね。

さっとん

 

勤務時間

当時の勤務時間は、以下になります。

 

勤務時間

シフト制2交代勤務

日勤
09:30-18:00

夜勤
17:30-10:00

※週休2日制で休暇が不定休になります。

 

POSシステムの運用監視の頃と若干時間が違いますが、夜勤が16時間程あることが体力的にキツかったです。
しかし、夜勤の仮眠時間がしっかり2時間あったので、以前よりは働きやすかったです。
また、勤務時間終了後、スパッと帰宅する感じなのが良かったです。

 

このように、POSシステムの運用監視の頃と勤務時間に大差はないですが、比較的働きやすかった現場になります。

 

勤務時間が終了したら、スパッと帰宅できるのは非常に大事です。

さっとん

 

実績

映像配信システムの運用監視をやっていた頃に上げた実績は、以下になります。

 

実績

・監視不具合アラートの削減(月300件→月100件)
・パトランプを自席で停止できるツールの作成

 

特に監視不具合アラートの削減については、当時非常に頑張った記憶があります。
月に発生する監視不具合アラートを300件→100件に削減する対応を当時実施しました。

 

監視不具合アラート削減については、「毎日、監視不具合アラートの発生が多い」という背景がありました。

 

監視不具合アラート削減までのプロセスとしては、以下になります。

 

①毎日発生している監視不具合アラートの傾向を分析する。
②監視不具合アラートの監視除外or閾値変更についてシステム担当者と調整する。
③調整後にメンバーにタスクを振り分けて、もくもくと監視除外や閾値変更をこなす。

 

この業務改善で、

  • お客様(システム担当者)との調整
  • 自分が主導してタスクを振り分ける

といった経験をすることができました。

 

月300件→月100件までの削減がやっとでした。
なぜなら、頻繁にサービスがリリースされるため、新しくシステムの監視が登録されることが多かったからです。
「月0件」ということが理想ではありましたが、現実的に厳しかったです。

 

こちらの実績について全て書くと長くなってしまうため、また別の記事でご紹介したいと思います。

 

この現場では普段の業務と併せて、様々な業務改善にもトライさせてもらいました。
今思えば、なかなか良い経験ができたと思います。

さっとん

 

さいごに : 運用監視は現場によってやることが違う

 

今回は、僕が過去にやっていた以下の運用監視業務についてご紹介しました。

  • POSシステムの運用監視
  • 映像配信システムの運用監視

全て合計で約6年半程やりましたが、「正直長すぎた」ということは否めないかと思います。

 

しかし、この運用監視業務経験で学べたことがありました。

 

運用監視業務経験で学んだこと

・同じ運用監視でも現場によってやることが違う
・自ら動かなければ、キャリアを切り開いていくことは難しい
・自ら動いていけば、運用監視の現場でも実績を作ることは可能(自動化やアラート削減等)
・スキルが身につかないようであれば、「石の上にも三年」は鵜呑みにしない方がいい

 

本記事が今後IT業界でキャリアを歩む人に参考になれば嬉しいです。

 

今回は、以上です!

 

YouTubeもやっておりますので、良かったら視聴とチャンネル登録をお願いします。

 

 

-監視オペレーター
-, ,

Copyright© 元監視者のエンジニアブログ , 2021 All Rights Reserved Powered by AFFINGER5.