リモートワークの導入が増え、企業のIT化は益々進んでいます。従来オンプレだったITインフラをクラウドに変更したり、アプリケーションや端末も増え、企業のIT部門やIT管理を任されている部門は日々の運用の稼働で手一杯の担当者も多いはずです。
今回は、そんな日々の運用の中でも大量のアラートメールから解放手段をお伝えします。
人の目だけではもう限界!
システムやネットワークが正常な動作をしているかを監視し、問題発生時に迅速な対応や復旧作業を行うことは事業継続を支えるIT部門やIT管理における運用担当者の責務です。監視サービスを使用し、そこから送られるアラートメールを参照すれば、何が起きているかは把握できます。
しかし、そのような監視サービスから日々送られてくるアラートメール全てに適切に対応するのは、簡単なことではありません。
ITシステムの規模が小さければ、そこまで多くのアラートが発生しないため都度メールを確認し手作業で処理することも難しくありません。しかし、システム規模が大きくなればなるほど監視項目が増え、毎日数百件単位のアラートメールが発生し続けることになります。
こなると、都度手作業で処理することは非常に困難です。
数百件のメールを1通ずつ開いて確認する手間は膨大です。検索による絞り込みにも限界があります。関連性を複数のメールから目視で把握するにも大変な労力を要します。運用担当者を増やすといった考えもありますが、コストは増えますし、手作業ではヒューマンエラーを防ぎきることはできません。
こういった手作業での処理が、対応の遅れや処理漏れ、優先対処事項の見極めの判断ができないなどといった問題を生み、運用品質の低下を招いています。
必要なメールだけみることはできるのか?
このような運用担当者の苦労や品質問題を解決するには、「監視の自動化」を導入です。
アラート対応の自動化ができる「OpsAid」では対応状況の可視化ができることはもちろん、大量メールの自動集約、自動対応(再起動、自動コールなど)ができます。またこの度、メール転送機能も追加いたしましたので、運用担当者には対応必要なメールだけ到着し、必要なアラートメールだけに対応することが実現できます。
例えば、最初のアラートメールが届いてから、そのアラートの処理が終わるまで同じメールが何件も届いていることがあります。アラート対応が終わった後に、またそのメールを見て
「これ、もう処理終わったやつだよ…」と思ったことはないでしょうか?
OpsAidでは、最初のアラートメールが届いてから例えば10分間の間に同じメールが来た場合、自動集約します。これで、処理が終わったアラートメールを再び確認することは不要となります。
Kommentare