「ITインフラSummit 2018」のソリューション講演に、中国Alibabaグループとソフトバンクの合弁会社であり、クラウドサービス「Alibaba Cloud」を提供するSBクラウドから王志正氏が登壇。Alibaba Cloudがベンダーロックインから脱却した経緯と、Alibaba Cloudが提供するビッグデータ基盤の特徴とともに紹介した。

SBクラウド ソリューションアーキテクト 王 志正氏(撮影:海老名 進)

 中国Alibabaグループは、EC(電子商取引)サイトやモバイル決済サービス、パブリッククラウドサービスなど、様々な分野でサービスを展開しているクラウド事業者である。TwitterやYouTubeに該当するサービスも、エコシステムを通じて提供している。これらを支えるインフラ基盤がAlibaba Cloudである。

 Alibaba Cloudはこれまで、ベンダーロックインからの脱却をテーマにインフラ基盤を刷新してきた。以前はベンダー製のミニコンピュータや商用データベース、大手ベンダー製のストレージを使ってきたが、これをやめた。ECサイト「Taobao」の負荷が急増し、旧式の仕組みでは対応できなくなったからである。

 システム刷新では、サーバー機をミニコンピュータからPCサーバーに変更。データベースは、商用のデータベースをやめてオープンソースのMySQLと、Alibaba自社開発のOceanBaseに切り替えた。ストレージは、商用のハイエンドストレージから分散ストレージへと移行した。

 システム刷新によって、コストを大きく削減した。事業の成長に合わせてITリソースを自由にスケールアップ/アウトできるようになったことが大きい。「ベンダー製品を使わないことから、メーカーに問い合わせる必要がなく、自社ですべてをコントロールできるようになった」(王氏)。

 Hadoopも自社開発の「Apsara」に切り替えた。HDFSに該当するファイルシステム「Pangu」も自社で開発した。Hadoopエコシステムのソフトウエア群は、すべてApsaraでも利用できる。これに加え、Platform for AI(PAI)と呼ぶ機械学習用のプラットフォームも用意している。

ビッグデータの収集、保存、処理、可視化を支援

 Alibaba Cloudの特徴の1つとして王氏は、ビッグデータ分析の基盤として使いやすくしたことを挙げる。データの処理の流れに応じて、データの収集、保存、処理、可視化、の各機能を提供する。データソースとして、業務データ、ログデータなどの操作データ、生成され続けるIoT/マシンデータを扱える。

 データの保存先には、データベース(RDBMSやNoSQL)やストレージ(オブジェクトストレージ、NAS、ブロックストレージ)などを用意している。バッチ処理とリアルタイム処理のいずれも可能だ。

 データ分析用には、音声認識や画像認識(顔認識、画像検索、OCR)などの機能をAPIで提供。自分たちでAIアプリケーションを開発したいユーザー向けには、機械学習のプラットフォーム(PAI)も提供する。このほか、BIツール(レポート作成ツール)や可視化ツール(ビジュアルを駆使してきれいに見せるツール)も提供する。