システム運用・保守における課題点と解決策（1/2）

運用管理

システム運用や保守という言葉は、IT関連の仕事が広がるにつれて耳にする機会が多くなりました。
しかし、これらの業務についてしっかりと理解している人はIT業界にいる人でも案外少ないものです。業務をしっかり理解していないと、依頼する側も、業務を遂行する側も認識の相違でトラブルに繋がってしまうこともあります。

システム運用とは？

まずシステムの定義を説明します。システムとは集合体です。不特定の要素が集まった組織や体系をシステムと言います。会社で言うと社員が集まる場所は部署ですが、コンピュータに置き換えるとシステムとなります。このシステムの要素はサーバやネットワーク機器といった精密機械です。当然不具合が発生する場合もあり、状況によってはサーバ停止となることもあります。

こうしたトラブル（システム障害）を未然に防止するための役割が運用担当のシステムエンジニアです。エンジニアは障害を未然に防ぐために様々な知識や技術を駆使し運用に携わります。万が一に備えてバックアップを取るようなシステム構成を考えたりもします。システム運用は、システムを正常に保ち、状況に合わせた対応を取ることを意味します。

システムを24時間365日、正常にシステムを稼働させるためにシステム運用には、次のポイントが必要となります。

安定稼働させるための管理: システム障害が発生すると、大きなダメージが発生するためです。
障害が起こらないように運営する: ハードウェア・ソフトウェアそれぞれに対する信頼性が増していること、システム構成が拡大・複雑になっているため、もし障害が発生してしまうと後手に回ってしまうためです。

システム保守とは？

システム保守の役割はシステム改善とメンテナンスです。既存システムより良くするためにアップデートしたり、不具合を解消したりします。また、保守の仕事には定期的にメンテナンスをして正常に保つのもあります。システム保守は開発や運用と比較してサービス利用者に一番近いので利用者目線で取り組むことが大切になります。

どのサービスもシステムのメンテナンスのために定期的にサービス停止をします。主に深夜帯に行われますが、定期メンテナンスをすることは大切です。サービスの安定稼働を実現します。メンテナンスをしない期間が長期になればなるほど、システムトラブルが発生する確率は上がります。サービスの安定稼働にメンテナンスは重要なのです。

システム運用と保守の違い

実際によくわかりづらいと言われます。確かにそうかもしれません。システム運用はシステムが正常稼働のための主な担当は「監視」です。そして、システム保守は不具合への「改善」と定期的な「メンテナンス」です。自分の仕事がシステム運用保守の場合、平常時は運用業務を行い、何らかの不具合が発生すれば保守業務に携わるという形で業務を担当します。このようにシステム運用と保守を兼ねるケースが多いでしょう。

なお、システム監視とはシステムの稼働を確実にし安心して利用できるように確認することです。システム内で動作しているサーバ、アプリケーション、ネットワークなどの稼働が正常か否かを確認し、発生したシステム障害やシステムトラブルの察知、管理者への通知をおこないます。

このようにシステム運用はシステムトラブルが発生した時に突発的に対応し、システム保守は定期的な業務に分類されます。正常なシステム稼働には、運用・保守など全業務を駆使し、ITシステムの安定のためにインフラ環境の整備し安定稼動を実現します。

必要な資格、スキルについて

システム運用・保守に求められるスキルとして、次のようなスキルが挙げられます。

求められるスキル

担当システムを熟知していること: システムがきちんと稼働しているか判断するために、担当しているシステムを熟知している必要があります。誰よりも担当しているシステムの知識がなければなりません。
観察・分析力: システムを安定的に作動させるには、定型業務があります。
普段の定型業務の中で、全体の状態を把握する観察力、課題を発見・分析するスキルが必要です。
コミュニケーション能力: トラブルなどが発生すると、利用者からの問い合わせ対応を行なう場面も多くあります。
システムに詳しくない利用者が持っている疑問を正しく判断して聞き取る力が必要です。また、解決方法をわかりやすく伝える力も求められます。
もちろん、運用・保守を仲間と一緒に作業を行なうこともあります。部署の内外とのやりとりは非常に多いため、スムーズなコミュニケーション能力は必須です。

システム運用におすすめの資格

これといった必須の資格はありませんが、持っていると役立つ資格はあります。
そこで、システム運用の業務に携わる際におすすめの資格を紹介します。

基本情報技術者: 基礎知識から身に付けたい方におすすめです。国家資格のため、ITの基礎知識が身に付いている客観的な証明となります。また、将来的に色々な業務へ応用も可能です。
LPIC・LinuC: どちらもLinuxに関する資格です。
LPIC（Linux技術者認定試験）は Linuxに関する技術を証明する資格。Linuxは現在さまざまなシステムで使われているため活躍の幅が広がります。
LinuC（Linux技術者認定資格）はLinuxの認定試験を実施しているLPI-Japanによる認定試験です。クラウド、オープンソースのリテラシー、システムアーキテクチャの知見、の3つのスキルを証明できる内容となっています。
CCNA・CCNP: シスコシステムズが提供しているベンダー資格で、シスコシステムズ社の製品知識をはじめ、ネットワーク全般について問う内容となっています。ネットワークの運用・保守に関する技術があると証明するのに役立ちます。
AWS認定: システムのインフラにクラウドを使う場面も増えたため、知識を持っていると重宝されます。
クラウドを利用したシステムでは、監視や負荷に合わせサーバの追加削除をクラウド上でできます。例えばAWSなら、CloudWatchを使って監視や復旧が行なえますので、従来のシステムと変化してくる場合があります。
今後、システム運用の現場でもクラウド系の資格が重宝されると考えられるためです。

システム運用における課題

では、現状のシステム保守運用に関する課題としてどのようなことが挙げられるでしょうか。大きく制御・インシデント管理・ジョブ管理の点から考察してみました。

システム運用・保守における課題点と解決策の記事には続きがあります

システム運用・保守における課題点と解決策の記事の続きを読む

1 2

: 監修 SHERPA SUITE運営事務局オープンソース(OSS)を活用した運用管理ソリューションであるSHERPA SUITE（シェルパスイート）の運営事務局です。SHERPA SUITEは、SHERPA-IR（イベント制御）・SHERPA-SM（インシデント管理）・SHERPA-JB（ジョブ）ソリューション群の総称となり、システム運用におけるコスト削減及びサービス品質を向上します。SHERPA SUITEについてはこちら。