資料の紹介
長年、マルチクラウド環境で多くのシステムやサービスを展開してきたNTTドコモ。だが、その開発/運用担当部門はかつて、コミュニケーション面の課題を抱えており、労力やコスト、時間の無駄が少なからず発生していた。特に大きな悩みは、「障害発生時の情報共有がスムーズにいかない」ことだった。
ログ監視などのメンバーは固定されており、障害発生時、対応に当たる他のメンバーとの情報共有に時間がかかっていた。この問題を解消すべく、同社はクラウド型の統合監視ソリューションを導入。さらに「開発チームが運用チームを巻き取る形」で組織の統合を進めた。運用業務が加わり業務量は2倍に増えたが、統合監視ソリューションを有効活用することで残業時間は減ったという。
本資料では、開発チームと運用チームのコミュニケーションと障害対応のプロセスを改革したNTTドコモの取り組みを紹介。同社のプロジェクト責任者が、統合監視ソリューションの機能を生かした「伝言ゲーム」防止策などについて、実際の進め方や成果を明かしている。現場から効率化のアイデアが次々に出てくるなど、開発/運用現場の「風土」も様変わりしたという。





