複雑化するITシステム運用の改善に、AI(人工知能)を応用する動きが具体化している。システムのアプリケーションやインフラ、ネットワークなどから遠隔測定データ(テレメトリー)を収集し、分析して適切な行動につなげる「AIOps(エーアイオプス)」というものだ。例えば、クラウドサービスでネットワークトポロジーの変化を常に監視し、異常の検知や迅速な対処に役立てるといった用途で採用されている。
クラウド監視の用途でニーズが拡大中
AIOpsは、「AI for IT Operations」を略した言葉で、2016年頃からガートナーが使い始めた。ただし一部の企業ではその前から、AIOpsに準じる考え方やユースケースが存在していた。特に顧客のシステムにトラブルが発生したときに、迅速な対応が求められるサービスベンダーは、状況判断に必要なデータの収集を自動化する仕組みを採り入れていた。
ガートナーは2021年11月に発表した「日本におけるITオペレーションとDevOpsのハイプ・サイクル*1:2021年」で、「AIOpsプラットフォーム」を「黎明期」の後半にプロットした。今後2年ほどで過度な期待のピーク期を過ぎ、今後5~10年で成熟する(主流となる企業が採用する)と予測している。
AIOpsを実現するプラットフォームが普及する背景には、クラウドサービスの広がりがある。クラウドを提供するサービス事業者だけでなくユーザー企業も、発生する大量のデータから関係のない情報(ノイズ)を除いて、データを分析し対応する必要に迫られている。障害発生時などに、迅速にデータを集める作業は、もはや人間の能力では対応できないといえる。つまり、システム環境が固定的であればできたことが、クラウドネイティブな環境では異なってきているという意味だ。
ロードバランサ―の支配下に仮想マシンが複数連なって分散処理をしているクラウド上のシステムで、トランザクションの増減を監視する場合で考えてみよう。AIOpsプラットフォームを使えばトラフィックが一時的に急増したとしても、ダイナミックに変化するネットワークトポロジーを自動検出して、該当する箇所を監視対象に組み込むといった対応が可能である。オンプレミスのシステムで適用してきた、人手による作業やスクリプトなどによる監視手法では、迅速な対応は難しい。