メイン コンテンツをスキップする 補完的コンテンツへスキップ

都市への "or" 条件の作成

都市などの複数のテキスト値に条件やフィルターを同時に作成する場合は、[Chart] (チャート)パネルを使えば複数の値を選択できます。また、ナビゲーション矢印を使って最初の10件の結果を参照することもできます。ただし、グラフの統計が基にするのは10,000行のサンプルのみです。自動車販売店のデータセットのように、それを上回るデータセットの場合、このサンプルを超える潜在的レコードを見逃してしまうことがあります。そのため、自分のフィルターに一致する行が必ずすべて返されるようにするためには、処理方法を変える必要があります。選択したすべてのテキスト値に一致する正規表現を作成し、その正規表現に一致する行をフィルタリングし、[Fetch more] (さらに取得)ファンクションを使って、このフィルターに一致するその他の行をすべて取得します。

前にインポートした自動車販売店のデータセットを使って新しいプレパレーションとフィルターを作成し、フランス5大都市での売上を表示してみましょう。

都市に一致する正規表現の作成

関心があるすべての都市に一致する正規表現を作成します。ここでは、フランスの5大都市(Paris、Lyon、Marseille、Toulouse、Bordeaux)を例に取ります。

Procedure

  1. cityカラムのヘッダーをクリックし、その内容を選択します。
  2. 画面の右側にあるファンクションパネルにMatch patternと入力し、結果をクリックして関連ファンクションのオプションを開きます。
  3. [Pattern] (パターン)フィールドのドロップダウンリストで[Other] (その他)を選択します。
  4. [Manual pattern] (手動パターン)ドロップダウンリストでRegExを選択します。
  5. [Manual pattern] (手動パターン)フィールドに次の正規表現を入力します。
    ^Paris$|^Marseille$|^Lyon$|^Toulouse$|^Bordeaux$

    この表現式は、上記の5都市の全売上に一致します。

  6. [Submit] (送信)をクリックします。

Results

新しい列が作成され、正規表現に一致する行はtrueとして、一致しない行はfalseとしてそれぞれマークされます。
新しいカラムがプレパレーションに追加され、対応する値が式に一致するかどうかが示されている状態。

一致する値のフィルタリング

正規表現に一致する行を知る方法がわかったので、新しいカラムでフィルターを作成すれば、該当する行をすべて取得できるようになります。

Procedure

  1. city_matchingカラムのヘッダーをクリックし、その内容を選択します。
    画面右下のデータプロファイリングエリアに、カラム内のtrue値とfalse値の出現数を示す横棒グラフがあります。正確な出現数を表示するには、各バーの上にマウスを置きます。
    true値とfalse値の割合が示されている棒グラフ。
  2. フィルターを作成するには、trueバーをクリックします。
    フィルターバーを見ると、フィルターがデータセットに適用されたことがわかります。また、顧客データは正規表現で前に設定された条件に一致する場合のみ表示されます。

Results

いくつかの値に基づくこのフィルターによって、指定した都市の顧客に関係する売上を分離しました。ただし、探していた5つの値のうち検索されたのは4つだけで、データセットにはParisに関係する行がないようです。そこで、このフィルターが現在のサンプルよりも多くの行に一致する可能性があるかどうかこれから確認してみます。

該当する都市の値をさらに取得

前に作成されたフィルターでは自分の関心がある都市がすべて返されたわけではなかったので、サンプルを超えて潜在的に一致している行をさらに取得します。

Procedure

グリッドの右上にある[Fetch more] (さらに取得)をクリックします。
[Fetch more] (さらにフェッチ)ボタンはグリッドの右上に位置。
[Fetch additional rows] (行をさらにフェッチ)ダイアログボックスが開いたら、データの取得状況を確認できます。
行の検索の進行状況を表示するために開かれるモーダル。
結果が10,000件に達したりデータセットの最後になると、検索は自動的に停止します。また、ユーザーがプロセスを停止し、既に見つかった行を表示することもできます。この例では、都市として探していた最後の値であるParisをはじめとして、顧客情報の行がさらに取得されています。行IDを見れば、このような新しい行が最初のサンプルの最初の10,000行を超えて見つかったことがわかります。
最初の10,000行を超える一致行が検索された状態。

Results

フィルターに一致するすべての行をデータセット全体から取得したことで、指定した全5都市の売上を分離できました。今後はどのフィルターやファンクションもこのサンプルのみの適用となります。

フィルターに一致する行をエクスポート

顧客の限定リストの強調表示とプレパレーションができたので、ローカルファイルにエクスポートします。

Procedure

  1. [Export] (エクスポート)ボタンをクリックします。
  2. [All data] (すべてのデータ)ラジオボタンを選択し、[Apply filters] (フィルターを適用)スイッチが有効になっていることを確認します。
    これによって、行をさらに取得する操作と同じく、データセットがサンプルより大きい場合でもフィルターに一致する潜在的な行がエクスポートにすべて含まれるようになります。
  3. データのエクスポートで使用する形式を選択します。
    • [Local CSV file] (ローカルCSVファイル)を選択した場合は、使用するフィールド区切り、テキスト囲み文字、およびエスケープ文字を選択し、エクスポートするファイルの名前を入力します。
    • [Local XLSX file] (ローカルXLSXファイル)を選択する場合は、エクスポートするファイルの名前を入力します。
    • Amazon S3を選択する場合は、認証情報とその他の情報を入力して、ファイルをAmazon S3に保存します。

Results

プレパレーションを使ってクレンジングしたデータがローカルファイルにエクスポートされます。

このページは役に立ちましたか?

このページまたはコンテンツにタイポ、ステップの省略、技術的エラーなどの問題が見つかった場合はお知らせください。