システム運用・保守における障害とは? 監視強化と障害通知の活用方法(2/2)

運用管理

システム運用・保守における障害とは? 監視強化と障害通知の活用方法

もし、システム監視ツールを使わなければ人員を割いて常時サーバのログイン状況をはじめ、運用状況を目視で確認しなければなりません。24時間365日休みなく人がシステムを手動で確認することは、とてもではありませんが現実的な手段とは言えないでしょう。

また日本では、間接部門に位置づけられるシステム運用業務は毎年のようにコスト削減を要求され、リソースの確保もままならない状況が続いています。

さらに、高齢化、人口減少が続く日本では、政府の試算によると2020年には約31万人、2030年には約79万人もの人材が不足するといわれています。IT業界ではエンジニア不足で、競合企業と熾烈なエンジニアの取り合いが起こっているため、簡単にシステム運用に技術力のある人材を配置する決断は出来ない状況となっています。
そのような中で、近年働き方改革が叫ばれ、効率よく人員を配置し無理なく運用できる環境や体制を構築することが求められています。
この様に、相反する要求にこたえるにはどのようにすればよいのでしょう?

その一つの例として見られるのは、オープンソースをベースとしたシステム監視ツールの導入です。
市販のシステム運用監視ツールは、システム規模が増えるにつれて、ライセンスと保守の費用が増える為、コスト削減を死守しなければならない企業では、オープンソースをベースとしたシステム監視ツールを選択する運用部門が増えています。

また、システム監視ツールの役割は監視対象の状態変化を正確に収集する事なので、障害原因の解析やその障害に対してどのような対応をすべきかの判定をするには、人、場合によってはシステムを理解したシステムエンジニアなどが必要になります。

更に、監視ツールからのアラート処理判定や集約判定は、あらかじめ発報されるアラートを想定し、相対するルールを構築し維持管理していく必要があります。

近年、急速に、システム運用管理ツールからのアラートから、障害内容を解析し、対応する処理を自動判定するツールを導入することで、技術レベルの高い運用リソースの配置や、人手を介せずにアラート内容に該当する対応処理が行える、ルールベースで自動化出来るツールとの連携のニーズが増えています。

これらのツールは、ツールに判定や処理ルールを追加していくことにより、そのルールを適応したアラートは該当する処理が実行されます。 机上で運用を考えるだけではなく、具体的なルールを設定し、正誤の判定やルール適応の改善状況可視化が出来るので、導入切替の課題や運用改善の面においても大きなメリットとなります。

SHERPA-IRとは

障害が発生すれば一刻を争って障害対応を行わなければなりません。

システム運用現場では障害対応手順などの操作に関する改善は割と行われていますが、運用全体の改善までは手が回らないのが悩みとなります。

障害発生から復旧完了までの間には様々なステップがあり、多くの現場では人手に頼ったリソースありきの運用をしているのが実情です。
しかも、その作業が煩雑で数が多くなってくると、急激に時間がかりミスも多くなります。

この様な運用対応プロセス業務をSHERPA-IRで自動化すると、今までかかっていた時間と労力が大幅に簡略化され復旧作業を集中して行うことが出来ます。
また、同一障害のアラートが重複して出てしまう環境では、自動実行処理も重複して実行してしまう為、ジョブツールやRPAなどの自動処理ツールとの自動連携はできませんでした。

SHERPA-IRを使うと、同一アラートの集約処理後、処理実行の要不要判別をはじめ、発生時間帯やその他条件を考慮し、障害対応チケットを介して該当する自動化ツールと自動連携が可能となります。
こうしたオペレーションの自動化で、効率化・高品質化・コスト削減の3つを実現します。

システム監視ツールとSHERPA-IRとの連携による効率化

システム監視ツールとSHERPA-IRとの連携によってどのような効率化が実現されるのでしょうか。
SHERPA-IRは様々なシステム運用監視ツールやログシステムなどから通知されたアラートを解析し各種インシデント管理ツールやジョブ管理システムなどへのメール連携やコマンド実行連携機能として導入することが可能です。
また、アラート電文に該当する手順書等の情報を付加する事もできますので、今まで人員を割いていた業務をSHERPA-IRによって効率化できるだけでなく、漏れのない監視も実現することができます。

SHERPA SUITE導入のメリット

SHERPA SUITEはシステム運用・保守の現場や担当者が抱えている様々な問題を金額的な面からだけでなく、人的配置の面からも解決に導いて、働き方改革につなげます。

近年、特に安定的なスキルを持ったシステム担当者を採用・育成することは難しく、IT業界全体が抱えている大きな悩みとなっています。仮にいい人材がいたとしても、採用するために常に熾烈な競争が起こってしまい、結果的に思うような人材を採用できていない現場が大半となっています。人を確保できなければ、安定的にシステム運用を実現できるツールを導入して効率化を図ることを視野に入れることになります。こうした現場の悩みに応えられるのが、SHERPA SUITEです。

特に初期対応で起こりがちな煩雑な業務を自動・一元化して軽減できることは大きな魅力で、担当者にかかっていた大きな負担が軽減されます。負担軽減された時間と労力は、より重要な業務に振り分けることが可能となり、少ない人員でも効率よく業務に取り組める環境を実現します。

もちろん昨今の働き方改革にもマッチしており、担当者の労務環境への満足度と同時にクライアント・顧客からの信頼度向上へとつなげていきます。

システム運用・保守における障害とは? 監視強化と障害通知の活用方法の記事を読みなおす

SHERPA SUITE
監修 SHERPA SUITE運営事務局 オープンソース(OSS)を活用した運用管理ソリューションであるSHERPA SUITE(シェルパスイート)の運営事務局です。SHERPA SUITEは、SHERPA-IR(イベント制御)・SHERPA-SM(インシデント管理)・SHERPA-JB(ジョブ)ソリューション群の総称となり、システム運用におけるコスト削減及びサービス品質を向上します。SHERPA SUITEについてはこちら。

運用管理ソリューションソフトウェア

詳細の説明、見積もり依頼など
まずはお気軽にお問い合わせください。