パターンを使用したタスクのフィルタリング
プロファイリングエリアの[Pattern] (パターン)タブには、データを構成する文字のタイプと数がグラフィカルに表現されています。単語または文字の精度によってレコードがどう構造化されているかを視覚的に確認できます。
データにフィルターをすばやく簡単に適用する方法にもなります。
カラムのコンテンツを選択する時に、横棒グラフにはデータを構成する文字や単語のタイプと数を表すさまざまなパターンの配分が表示されます。
パターンを文字ベースと単語ベースの間で切り替えるには、[Pattern] (パターン)タブを使用します。ただし数値データは例外で、文字パターンのみ計算されます。
たとえばファーストネームとラストネームにおけるデータクオリティの問題を検出するのに、単語ベースのパターン分析は効率的な手法です。句読点や数字が含まれているなど、単語のみで構成されていない名前は、目立つのですぐに判明します。他方、文字ベースのパターンは、クライアントIDやアカウント番号などの構造化されたデータの場合により適しています。文字や数字の数が正しくない場合は、チャートでわかります。