[画像のクリックで拡大表示]

Appenでは、専門家チームが可能な限り最高のデータアノテーションプラットフォームを提供できるよう支援しています。

フォーブステックカウンシルの寄稿者で、2020年7月にベンチャービートのAI in Mentorship賞を受賞した Appenの製品管理担当副社長であるMeeta Dashは、データラベルリング成功の鍵を以下の通り語っています。

1) 最も成功したAI開発チームは、ユースケース、ターゲッティング、ペルソナの設定、および成功指標の明確な定義から始まります。これは、トレーニングデータのニーズを特定し、さまざまなシナリオに対応できるようにし、多様なデータセットの不足による潜在的なバイアスを軽減するのに役立ちます。さらに、データのラベル付けのためにさまざまなクラウドワーカーのプールを組み込むことで、ラベル付けプロセス中に導入されるバイアスを回避できます。

2) データのドリフト(機械学習モデルをトレーニングした時のデータと、予測を行う時点でのデータがずれていく現象)は、一般的に考えられている以上に日常的に発生します。現実の世界では、モデルが見るデータは毎日変化し、1か月前にトレーニングしたモデルは期待どおりに機能しない可能性があります。そのため、新しい情報でモデルをトレーニングし続けるには、スケーラブルな自動トレーニングデータパイプラインを構築することが重要です。

3)セキュリティとプライバシーの考慮事項は、後付けではなく、正面から取り組む必要があります。可能な限り、最適なモデルのトレーニングに不要な機密データを編集します。機密データを含むデータラベリングプロジェクトで作業する場合は、安全でエンタープライズグレードのデータラベリングプラットフォームを使用し、機密データを処理するようにトレーニングされた安全なクラウドワーカーを選択してください。

■Appenが提供できること

Appenは大規模な機械学習を改善するためのデータラベリングサービスを提供しています。

Appenのお客様は、特定のAIプログラムのニーズに合わせて、画像、ビデオ、音声、音声、テキストなど、複数のデータタイプにまたがる大量の高品質データをAppenのプラットフォームを通じて安全且つ迅速に受け取ることで自社のAIをスピーディに強化しています。

高品質のデータラベリングが必要であれば是非ご相談ください。