DataRobot、SnowflakeのSnowparkで推論をよりスケーラブルに

さらなる連携強化により、データと機械学習モデルとの間にある「AI実運用化上の壁」を緩和

 本リリースは、6月9日に米国で発表したニュースリリース( https://clk.nxlk.jp/hDYkJiNL )の抄訳版です。

 エンタープライズAIのリーダーであるDataRobot, Inc.( https://clk.nxlk.jp/xvQcJ4hl )(本社:マサチューセッツ州ボストン、CEO:Dan Wright、以下DataRobot)は、本日、データクラウド企業Snowflake( https://clk.nxlk.jp/uhFWbgop )との新たな統合について発表しました。

 今回の新たな連携の目的は、Snowflakeの新しい開発者向けツール「Snowpark」の価値をDataRobotユーザーに提供することです。

 先日発表されたZepl社の買収( https://clk.nxlk.jp/qUrhrOwL )に続く今回の連携により、トップデータサイエンティストが必要とする新たな機能がDataRobotのプラットフォーム上でも利用可能になりました。Snowflake Summit 2021で紹介したように、DataRobotのプラットフォームの一部となったZeplの機能は、主にSnowparkを用いたモデル開発向けに、事前設定済みのフル機能環境を提供することで、DataRobotとSnowflakeのユーザーがモデルを迅速に開発、トレーニング、デプロイすることを可能にします。こうした重層的なインテグレーションは、あらゆる企業のAI活用を強力にサポートするために、両社が以前から取り組む戦略的パートナーシップや各種インテグレーションの上に成り立つものです。

 AIへの投資が増加( https://clk.nxlk.jp/zS2Nn8U5 )する一方、AIのプロダクション(本番環境)への移行に苦労する企業は後を絶ちません。その原因は、機械学習モデルとデータの間でコンピューティング環境が異なるところにあります。データの量、種類、発生頻度が増大し続けるなか、モデル開発に必要なデータを機械学習モデルのあるコンピューティング環境に移すのが、ますます困難になっているのです。

 この問題を解決するためにDataRobotが導入したのが、ポータブル予測サーバー( https://clk.nxlk.jp/ffRCTUZt )です。このサーバーを使えば、DataRobotのあらゆるモデルを自社のプロダクション用データに近づけたり、既存のデータパイプラインやアプリケーションに統合したりすることが可能になります。

 またSnowparkとJava UDF(ユーザー定義関数)機能の登場で、モデルをDataRobotからSnowflakeデータクラウドに直接移すというコンセプトを維持することができました。Java UDFとDataRobotのJavaスコアリングコードを連携させると、プロダクションモデルとデータの間で環境が異なるという問題が解消され、Snowflakeのデータクラウド内で、DataRobotモデルを使ったデータベース内のスコアリングが実行できるようになります。

 Snowparkの機能を活用すれば、データエンジニアやデータサイエンティスト、開発者は好みの言語でモデリングのコードを書くことが可能になります。さらにETL/ELT、データプレパレーション、特徴量エンジニアリングといったワークロードを、パフォーマンス、スケーラビリティ、並行処理などの面でホスティング型の外部サービスより優れたSnowflakeデータクラウド内で実行できます。Snowparkがもたらすこれらの新機能により、スコアリングコードに対応したデプロイを使用して、データベース内での大規模なモデルスコアリングを可能にするシームレスなパイプラインを作れるのです。

 ※参考画像は添付の関連資料を参照

 ※以下は添付リリースを参照

リリース本文中の「関連資料」は、こちらのURLからご覧ください。

参考画像

https://release.nikkei.co.jp/attach/612100/01_202106101049.png

添付リリース

https://release.nikkei.co.jp/attach/612100/02_202106101049.pdf