さっとんです。
早速ですが、こちらの記事にたどり着いた方はこのような悩みを持っていると思います。
アラート発生する度になんでパトランプが鳴るんだろう?
構築経験しかなくて運用監視のことがわからない!
そもそも監視の仕組みってどうなってるんだろう?
今回は、こちらの悩みについて答えていきたいと思います。
このような人は絶対に本記事の内容について勉強しておくべきだと思います。
サーバーやネットワーク等インフラの設計構築をしている方
何も考えずにただアラート対応しているだけの監視オペレーターの方
では、いきます。
監視のしくみとは?
サーバーやネットワーク機器でのアラート検知のしくみについては2つあります。
ポーリング
トラップ
こちらについて解説していきたいと思います。
ポーリング
ポーリングとは定期的にサーバーやネットワーク機器の監視を行うことです。
監視対象(サーバー/ネットワーク機器等)にエージェントが必要なもの/いらないものがあります。
今回は、こちらの2つについて紹介します。
監視対象にエージェントのインストールが必要なもの
ポーリング監視を実施するためにやるべきことはこちらになります。
監視マネージャー用のサーバーを構築・用意
監視対象のサーバーやネットワーク機器に監視エージェントをインストール
ポーリングの動作を手順にしてみます。
①監視マネージャーが監視対象に定期的にマシンのログやリソース状態について確認
②監視対象(監視エージェント)が監視マネージャーに結果を返す
③監視オペレーターへ通知
図にするとこのような形になります。
監視マネージャーが監視対象へ定期的に確認します。
エラーを検知した場合は、監視オペレーターへ通知します。
サーバー内のログやリソース状況等、詳細な箇所迄監視をしたい場合はこちらの方法にて監視となります。
監視対象にエージェントのインストールが不要なもの
「PING監視」の場合は監視対象にエージェントを用意する必要がありません。
用意するのは、「監視マネージャー」のみとなります。
定期的にサーバーやネットワーク機器に対してpingコマンドを実行する形の監視方法となります。
図にするとこのような形となります。(ping疎通不可の例)
Windowsを例に出すと、こちらのコマンドを定期的に流している形となります。
このように、定期的にping疎通を実施しNGの場合は監視オペレーターに通知するしくみになっています。
PING疎通監視のみ実施可能であるため、ログ状況等を監視したい場合には向いていない方法となります。
トラップ
監視エージェントをインストールした監視対象のサーバーが、
自発的に監視マネージャーへ情報を発信するしくみのことです。
監視のしくみの用途
私が運用現場にいた際の用途について書きます。
用途はこのような形となります。
ポーリング
サーバー(WindowsServer/Linux)やハイパーバイザー(VMware等)を監視する場合はこちらを利用しておりました。
主に実施していた監視としては、Log監視やリソース監視、プロセス監視等になります。
トラップ
主にネットワーク機器にて監視する場合に利用していた監視方式となります。
主に実施していた監視としては、スイッチのポートDOWN/UP等のネットワーク機器の状態監視となります。
監視のプロトコルとは?
監視のプロトコルについてはこちらになります。
SNMP
こちらのプロトコルにつきましては、インフラエンジニアの設計構築~運用監視迄の幅広いフェーズで使用されます。
そのため、覚えておいて損はないです。
SNMPとは?
SNMPは「Simple Network Management Protocol」の略称となります。
サーバーやスイッチ等の機器をネットワーク経由にて監視を行うためのプロトコルになります。
ポーリングやトラップにて監視する際は、こちらのSNMPというプロトコルを使用します。
SNMPにて監視できることとしては、こちらが例として挙げられます。
サーバー(WindowsServer/Linux)
・リソース状態(CPU/メモリ等)
・log
・プロセス起動状態
・ポート状態
・ping疎通
・トラフィック
ネットワーク機器(スイッチ等)
・ポートの状況(Down/Up)
・リソース(CPU/メモリ)
SNMPについては別の記事にて掘り下げたいと思います。
監視ソフトウェアの種類
私の知っているものを上げてみました。
Zabbix
世の中で一番ポピュラーな監視ソフトウェアではないでしょうか。
特徴としては、こちらになります。
・オープンソース(無料)にて使用可能
・監視対象にZabbixエージェントの導入が必要
・SNMPエージェント機能を持つ機器も監視可能(ネットワーク機器等)
・監視設定のテンプレートが豊富に用意されている
こちらについてはオープンソースのため個人にて構築することが可能です。
Patrol Clarice
Zabbixのようにエージェントを導入する必要がない監視ソフトウェアになります。
特徴としては、こちらになります。
・エージェントレスにて監視可能(ssh等)
・SNMP監視にも対応
・レポート機能に対応(値の状況を確認できる)
まとめ
・トラップは監視対象機器から一方的に通知を飛ばす方式
・SNMPは監視に必要なプロトコル
・エージェントレスの監視ソフトウェアもある
ここまで読んで頂き有難うございました。
よろしければ、別記事も読んでみて下さい。