1996年に設立されたAppenは、画像、ビデオ、オーディオ、テキストなどのデータ収集や各種データへのアノテーションを提供することで、AIシステムの構築や継続的な改善をサポートしているテクノロジー企業です。
今回はAI用音声データアノテーションについてご紹介いたします。
■音声データアノテーション
音声データアノテーションでは、言語、方言、および話者の識別とともに、特定の発音およびイントネーションを含む、音声データの書き起こしやタイムスタンプの付与を行います。
ユースケースはそれぞれ異なり、中にはお客様特有のアプローチを必要とするものもあります。
たとえば、セキュリティや緊急ホットラインのアプリケーションなどで活用される際は、攻撃的なスピーチインジケーターやガラスの割れるような発話以外の音声にもタグを付けます。
■事例:Dialpad社はTalkIQの精度を上げるために、Appenのデータアノテーションプラットフォームを音声データの文字起こしとカテゴリー分けに活用
Dialpad社は電話の音声データを収集し、社内の音声認識モデルでこれらの通話内容を書き起こし、自然言語処理アルゴリズムを通してあらゆる会話を理解するモデルを構築しました。
Dialpad社はこの1対1の会話を活用することで、コールセンターの担当者が顧客との通話においてスムーズに対応している場合とそうでない場合を識別できるようにし、顧客満足度向上をゴールとしてきました。
Dialpad社は、Appenの競合他社と6か月間検証をしてきましたが、データモデルがうまく機能するのに必要な精度に中々到達することができませんでした。
しかし、Appenはわずか2週間でデータモデルの要件を満たす書き起こしとNLPトレーニングデータを実現致しました。
■Appenが貴社に提供できること
Appenは、20年以上ものデータアノテーションの経験と実績があります。
人間の支援によるアプローチと機械学習の支援を組み合わせることで、必要としている高品質のトレーニングデータを提供します。Appenのテキストアノテーション、画像アノテーション、音声アノテーション、そしてビデオアノテーションはお客様の規模に合わせ、自信を持って人工知能や機械学習モデルを提供できるように支援いたします。
どのようなデータアノテーションのニーズであれ、Appenのプラットフォームとマネージドサービスチームは、AIプロジェクトと機械学習プロジェクトのデプロイとメンテナンスのいずれもご支援致します。