NTTテクノクロスの「tasokarena(タソカレナ)」は、企業が保有するパーソナルデータを匿名加工するソフトである。特定の個人を識別できないように匿名加工することによって、本人の同意なくデータを活用できるようになる。元のパーソナルデータと似た架空のパーソナルデータを生成する機能も備える。

「tasokarena」による合成データ生成のイメージ
「tasokarena」による合成データ生成のイメージ
(出所:NTTテクノクロス)
[画像のクリックで拡大表示]

特徴

 パーソナルデータを匿名加工する機能だけでなく、元のパーソナルデータと似た架空のパーソナルデータを生成する機能も備える。

提供形態

 採用している匿名化技術の特徴は、データの一部分を確率的に書き換えるランダム化の処理と、元の状態を推定する再構築という処理を採用したこと。これにより、理論的にk-匿名性を満たしつつ、元のデータの統計的性質をなるべく保つことができる。

 架空のパーソナルデータを生成する機能は、元のパーソナルデータと特徴量や統計量・分布などが類似するデータを生成する。匿名性を守りつつ、分析に必要な元データの性質を保持したデータを生成できる。少ないデータから大量の合成データを生成できるため、AIの学習や訓練に活用できる。

 背景には、特定の個人を識別できないようにパーソナルデータを加工した匿名加工情報の利活用が拡大している状況がある。一方で、匿名加工情報の作成にあたっては、元のパーソナルデータの数が少ない場合、データの匿名性と有用性のどちらかが低下する課題があった。緻密な分析を行いたい場合は、データの有用性の観点から匿名加工情報よりも実際のパーソナルデータを活用するのが現状である。

仕組み

 架空のパーソナルデータを生成する仕組みとして、NTT社会情報研究所の合成データ生成技術を活用した。各属性の平均など統計値が元データとほぼ等しい合成データを生成する技術などを独自に開発することで、分析に必要な複数の統計値を保持する多属性の合成データを生成できるようになった。

主な機能

パーソナルデータの匿名加工

 特定の個人を識別できないようにパーソナルデータを匿名加工する。本人の同意なくデータを活用できるようになる。

架空のパーソナルデータを生成する機能

 元のパーソナルデータと特徴量や統計量・分布などが類似するデータを生成する。匿名性を守りつつ、分析に必要な元データの性質を保持したデータを生成できる。

価格・料金(税別)

  • 「スタンダード版」(GUI版)は、年額60万円から
  • 「エンタープライズ版」(スタンダード版+自動実行/データ連携機能)は、年額180万円から

発表日

2021年10月26日

提供開始日

2021年11月17日