
(写真:123RF)
止まらないシステムの設計手法が変化している。パブリッククラウドの普及に伴い、ハードウエア部品の信頼性を高めるのではなく、複数サーバーを並べた分散システムで可用性を向上させられるようになったからだ。令和版の高可用性システムの設計術を学ぼう。
閉じる
止まらないシステムの設計手法が変化している。パブリッククラウドの普及に伴い、ハードウエア部品の信頼性を高めるのではなく、複数サーバーを並べた分散システムで可用性を向上させられるようになったからだ。令和版の高可用性システムの設計術を学ぼう。
障害発生時の対応をあらかじめ準備しておくことが大切だ。それにはイベントストーミングが活用できる。TISと楽天の事例を見てみよう。
分散システムでは様々な原因によって処理が遅延する。止まらないシステムに欠かせないのがAPIのボトルネックの解消だ。サーキットブレーカーは復旧まで処理を肩代わりできるが、注意点もある。
サービスを止めないためには素早い復旧作業が大切だ。それにはレジリエンシー(復元力や再起力)を高めることが重要である。事例から素早い復旧の仕組みを学ぼう。
小さなサービスとして機能を分割するマイクロサービスアーキテクチャーでは、分散したデータの整合性を保つのが難しい。回避法にはキーの付与や処理後のデータ突き合わせがある。NTTデータやTISの工夫を見よう。
パブリッククラウドを使ったシステム構築の普及に伴い、複数台を並べてシステム全体の可用性を高めるのが一般的になってきた。サーバー1つひとつの信頼性は低いが、システム全体として高可用性を実現しようとする考え方だ。