メイン コンテンツをスキップする 補完的コンテンツへスキップ

マーケティングソリューションにアップロードする顧客データの準備

[Customer Contact Data] (顧客連絡先データ)データセットは、顧客の名前、会社、国といったさまざまな情報のリストが含まれるファイルを表します。

マーケティングソリューションにアップロードするには、このデータのプレパレーションとクリーニングを行います。

customer_contact_data.csvというファイルをダウンロードします。

Customer Contact Dataデータセットのプレパレーションの追加

プレパレーションを追加し、データの準備とクレンジングを開始します。

Talend Data Preparationで既に使用可能になっているデータセットまたはローカルファイルからプレパレーションを作成できます。対応するボタンでプレパレーションを追加すると、現在作業しているフォルダーにプレパレーションが作成されます。また、プレパレーションはプレパレーションリストに自動的に保存され、変更した内容もすべて自動的に保存されます。

Before you begin

前にダウンロードしたファイルを使い、Talend Cloud Data Preparationcustomer_contact_dataというデータセットを作成しました。

Procedure

  1. ホームページで[Preparations] (プレパレーション)をクリックし、プレパレーションのリストを開きます。
  2. [Add preparation] (プレパレーションを追加)ボタンをクリックします。
  3. [Datasets] (データセット)のリストでcustomer_contact_dataを選択し、ソースマテリアルとして使います。
    [Add a preparation] (プレパレーションを追加)ウィンドウに、プレパレーションの作成に利用可能なデータセット(customer_contact_dataを含む)のリストが表示されている状態。
    [Preparation name] (プレパレーション名)フィールドは自動で入力されますが、このプレパレーション名は変更することもできます。
  4. [Submit] (送信)をクリックします。

Results

レシピが空のデータセットが開くので、プレパレーションステップの追加を開始します。変更した内容はすべて自動的に保存されます。

顧客データから空白行と無効行を削除

データセットから空のエントリーと無効なエントリーをすべて一度に削除できます。

各カラムのクオリティバーを見ると、customer_contact_data.csvには、空のセルまたは無効なセルのいずれかを持つ行が複数存在します。ここでは、これらの行をすべて削除します。クオリティバーを使うと、特定のカラムの空のレコードと無効なレコードを簡単に削除できますが、この処理をデータセット全体に対して実行する必要があります。

クオリティバーがあるグリッドの一部のカラムに、無効セルまたは空のセルが表示されている状態。

Procedure

  1. グリッド左上のメニューアイコンをクリックします。
  2. [Display rows with invalid or empty values] (値が無効または空の行を表示)を選択します。
    データセット全体にある空白行と無効行のためのフィルタリングオプション。

    データにフィルターを適用したので、データセットの空の値と無効な値だけが表示されます。

  3. ファンクションパネルにDelete these filtered rowsと入力し、結果をクリックして関連ファンクションを実行します。

    [Apply changes to] (変更の適用先)フィールドの前の[Filtered Rows] (フィルター処理済みの行)ラジオボタンが選択されていることを確認します。

    空のエントリーまたは無効なエントリーを含んだ行がデータセットから削除されます。

  4. フィルターバーのごみ箱アイコンをクリックしてフィルターを消去し、再びデータセット全体を表示します。

Results

空のレコードを含んだすべての行がデータセットから削除され、各カラムのクオリティバーが完全に緑になります。

メールアドレスからローカル部分とドメイン部分を抽出

user@talend.comなど、メールアドレスは、@記号で区切られた2つの部分、つまりローカル部分(この例ではuser)とドメイン部分(この例ではtalend.com)で構成されています。

メールアドレスの2つの部分が抽出されて、2つの新しいカラムにコピーされます。

メールアドレスの2つの部分を抽出して、マーケティングソリューションにアップロードしやすくします。

Procedure

  1. emailカラムを選択します。
  2. ファンクションパネルに、Extract email partsと入力します。
    emailカラムを2つのエレメントに分割するExtract email partsファンクションのプレビュー。
  3. [Submit] (送信)をクリックして[Extract email parts] (メールのエレメントを抽出)ファンクションを実行します。

Results

メールアドレスからローカルパートとドメインパートが抽出されます。抽出されたデータが新しい2つのカラムに入力されます。

顧客名にある空白を削除

各セルからのコンテンツの前後に、スペースが存在することがあります。

このスペースが存在するのは、他の人物が手動で入力したデータ(名前や電話番号など)を含むカラムである場合がほとんどです。これらのスペースは灰色の正方形で表示されます。

first_nameカラムには、空白のエントリーがいくつかあります。

空白が含まれているデータ。

Procedure

  1. [first_name]カラムを選択します。
  2. ファンクションパネルで「Remove trailing and leading characters (末尾文字と先頭文字を削除)」と入力し、結果をクリックして関連ファンクションのオプションを開きます。
  3. [Padding character] (パディング文字)ドロップダウンリストで[Whitespace] (空白)を選択し、[Submit] (送信)をクリックします。

    このファンクションの結果を新しいカラムに出力するには、[Create new column] (新しいカラムを作成)チェックボックスをオンにします。

  4. 変更するすべてのカラムでこの操作を繰り返します。

Results

選択したカラムからスペースが削除されます。

クリーニング済みデータをエクスポート

プレパレーションが完成したら、クレンジングしたデータをエクスポートできます。

データセットから空の行と無効な行を消去し、不要な空白を削除し、顧客のメールアドレスに関する情報を抽出しました。準備したデータセットはご利用のマーケティングソリューションに適合しているので、エクスポートできます。

Procedure

  1. [Export] (エクスポート)ボタンをクリックします。
  2. データのエクスポートで使う形式を選択します:
    • [Local CSV file] (ローカルCSVファイル)を選択した場合は、使用するフィールド区切り、テキスト囲み文字、およびエスケープ文字を選択し、エクスポートするファイルの名前を入力します。
    • [Local XLSX file] (ローカルXLSXファイル)を選択する場合は、エクスポートするファイルの名前を入力します。
    • Amazon S3を選択する場合は、認証情報とその他の情報を入力して、ファイルをAmazon S3に保存します。

Results

プレパレーションを使ってクレンジングしたデータがローカルファイルにエクスポートされます。

このページは役に立ちましたか?

このページまたはコンテンツにタイポ、ステップの省略、技術的エラーなどの問題が見つかった場合はお知らせください。