インサイトテクノロジーの「Insight Data Masking」は、個人情報などを含んだ本番データを加工してテスト用データや分析用のデータを生成できるデータマスキングソフトである。データのユニーク性や参照整合性などの論理的特性と、データの種類・分布などの統計的特性を維持したままデータを変換する。これにより、本番データと同等のマスキングデータを生成する。

データの整合性や分布などを維持した本番同等のデータを生成できる
(出所:インサイトテクノロジー)
[画像のクリックで拡大表示]

 マスクするデータに関しては、名前、住所、電話番号など日本に特有の項目に重点を置く。日本語、英字、数字、記号など文字の種別を自動で判別するアルゴリズムや、電話番号やクレジットカードなど特定の書式を識別するアルゴリズムを搭載している。

Insight Data Maskingがマスクするデータの種類とデータ変換アルゴリズム
(出所:インサイトテクノロジー)
[画像のクリックで拡大表示]

 動作形態や機能に応じて、4つのエディションを用意する。

 (1)「Basic Edition」は、CLIコマンドである。本番データをCSV(カンマ区切り形式)データの形式で読み込んで、マスクをかけられる。CLIコマンドであるため、対話型で使えるだけでなく、バッチスクリプトに組み込んで利用できる。外部ETL(抽出/変換/登録)ソフトの処理フローに組み込んで利用できる。

 (2)「Qlik Replicate Edition」は、異なるデータソース間でデータを複製するソフト「Qlik Replicate」(旧Attunity Replicate)にマスキング機能を追加するアドオンソフトである。Qlik Replicateの機能の一部として、データ複製時にマスキングをかけられる。

 (3)「Standard Edition」は、RDBMS上のデータにマスキングをかけるソフトである。外部ETLツールを使うことなく、単体でRDBMSに接続してデータを変換できる。RDBMSとして、まずはOracle Databaseに接続できる。

 (4)「Enterprise Edition」は、Standard Editionの機能・性能強化版である。

Insight Data Maskingの概要
用途と機能個人情報などを含んだ本番データを加工してテスト用データや分析用のデータを生成できるデータマスキングソフト
マスキングデータの性質データのユニーク性や参照整合性などの論理的特性と、データの種類・分布などの統計的特性を維持したまま、データを変換する。これにより、本番データと同等のマスキングデータを生成する
マスクするデータ名前、住所、電話番号など日本に特有の項目に重点を置く。日本語、英字、数字、記号など文字の種別を自動で判別するアルゴリズムや、電話番号やクレジットカードなど特定の書式を識別するアルゴリズムを搭載
エディション構成Basic EditionQlik Replicate EditionStandard EditionEnterprise Edition
エディションの概要CLIコマンドデータを複製ソフト「Qlik Replicate」のアドオンソフトRDBMSに接続してデータを変換するソフトRDBMSに接続してデータを変換するソフト
Standard Edition/Enterprise Editionの接続先RDBMSOracle Database
提供形態VMware ESXi上で動作する仮想アプライアンス
価格(税別)データ1Tバイトで年額100万円から
発表日2020年9月16日
提供開始日2020年9月16日(Basic Edition、Qlik Replicate Edition)
2020年12月(Standard Edition、Enterprise Edition)