Talend Cloud Data Preparationの例
このドキュメントのユースケースでは、Talend Cloud Data Preparationを使ってデータのフォーマットやクレンジング化を行う方法について説明します。
アプリケーションに組み込まれたガイド付きツアーからデモデータセットとその上に作成されたデモプレパレーションをインポートすれば、データ全体の品質向上につながるアイデアが得られます。
- Customersデータセットは、Standardizeプレパレーションのソースとして使われます。ここでは、州名の標準化、無効なレコードの削除、電話番号の統合、日付を含めた形式の変更、マスキングファンクションを使ったデータの保護について説明しています。スマート入力ファンクションは、日付を対応する曜日に変換するために使われます。
- Build_emailプレパレーションではMarketing LeadsデータセットとEmails Referenceデータセットを使い、それらを結合して顧客名、会社名、対応するドメインアドレスからメールアドレスを再作成します。
アプリケーション内で直接利用できるこれらのアプリケーションに加え、他のデータセットをダウンロードして使用すれば、次の例を完了させることができます。
- CRM_export.csv データセットに基づいてプレパレーションを構築し、顧客の携帯電話番号と固定電話番号をすべて新しいカラムに統合して、携帯でも固定でも有効な番号が少なくとも1つずつあるようにします。
CRMソリューションからの電話番号リストを統合をご覧ください。
- marketing_leads.zip データセットと emails_reference.zip データセットは、ルックアップ操作を介して同じプレパレーションで一緒に使うことによって、会社のドメインアドレスに関する情報を結合させてメールアドレス全体を再作成できます。
- HRMS_export.xlsx データセットでは、日付形式を変更し、任意のカラムから特定の文字列を抽出する方法が学べます。
人事管理システムのデータのクレンジングをご覧ください。
- customer_contact_data.csv データセットは、空の無効なデータセットをクリーニングし、テキストレコードの不要な空白スペースを削除すれば改良できます。
マーケティングソリューションにアップロードする顧客データの準備をご覧ください。
- video_customers.xlsx データセットでは、シナリオに従ってフィルターを組み合わせて"if"条件を作成し、特定の顧客グループのデータを分離します。
フィルターを使った、顧客データ上での"if"条件の作成をご覧ください。
- car_dealership.xlsx データセットは、通常のフィルターでは選択できないデータを、正規表現を使ってマッチングさせる方法を示すプレパレーションのベースとして使用されます。
正規表現とフィルターを使って顧客データに "or" 条件を作成をご覧ください。