システム運用の自動化を目指す「NoOps」が現実のものとなりつつある。クラウドやサーバーレス、自動化ツールの活用によって、障害からの自己修復も実現可能になった。

 NoOpsは、「No Operations」の略。その名の通り「人間によるシステム運用作業の最小化」を目指す継続的な活動である。これまで長い間、システムの運用保守は、夜間の緊急連絡や休日出勤による担当者への負担、そしてシステム停止という形での利用者への負担を強いることが当然だと考えられてきた。

「壊れても回復できる」の発想へ転換

 HA(ハイアベイラビリティ)やDR(ディザスターリカバリー)といった冗長化の仕組みを導入してシステムの可用性を高めても、いざ障害が発生すると、元の正常な状態に復旧するために、初期対応から原因究明、不具合修正など、担当者総出の作業が必要だった。

 一方で、コンピューティング技術やネットワーク技術の進化と成熟により、システムに高い柔軟性や弾力性を持たせられるようになってきた。例えばクラウドサービスを使えば、必要なときに必要な数のサーバーを立ち上げて動かし、システム全体での処理性能を高めたり、障害が起こったサーバーの代わりに動作させたりすることができる。

 NoOpsでは、そうした技術を使って、「いかに壊れないシステムを作るか」という発想の堅牢性重視から、「いつどこが壊れても回復できる」という発想の回復性重視へ設計方針を転換する。

 障害が発生するとシステムがそれを検知し、回復処理を実行して正常稼働に戻す。その間サービスは無停止状態を維持し、人間による作業は最小化されている。この運用保守を目指した一連の活動のことをNoOpsと呼ぶ。

従来の運用保守とNoOpsで目指す運用保守
[画像のクリックで拡大表示]

この先は日経クロステック Active会員の登録が必要です

日経クロステック Activeは、IT/製造/建設各分野にかかわる企業向け製品・サービスについて、選択や導入を支援する情報サイトです。製品・サービス情報、導入事例などのコンテンツを多数掲載しています。初めてご覧になる際には、会員登録(無料)をお願いいたします。