人事管理システムのデータのクレンジング
[HRMS Export] (HRMSエクスポート)データセットはHRMS (American human resource management system)からエクスポートされたExcelファイルに対応しています。
会社創業以来の従業員の名前、役職、雇用日、退職日(該当する場合)、給与の振込口座の完全なリストが含まれます。このデータセットでは米国の日付形式になっていますが、フランスのソフトウェアソリューションで使用できるようフランスの日付形式に変換することも可能です。また、フランスの口座であればIBAN番号から銀行口座番号を抽出することもできます。
HRMS_export.xlsxファイルをダウンロードします。
HRMS exportデータセットのプレパレーションの追加
プレパレーションを追加し、データの準備とクレンジングを開始します。
Talend Cloud Data Preparationで既に使用可能になっているデータセットまたはローカルファイルからプレパレーションを作成できます。対応するボタンでプレパレーションを追加すると、現在作業しているフォルダーにプレパレーションが作成されます。また、プレパレーションはプレパレーションリストに自動的に保存され、変更した内容もすべて自動的に保存されます。
Before you begin
Procedure
Results
レシピが空のデータセットが開くので、プレパレーションステップの追加を開始します。変更した内容はすべて自動的に保存されます。
日付をフランス形式に変換
世界で使われている日付形式は同一ではないため、日付を含むカラムで使用する形式を変更しなければならない場合があります。
このデータセットで使用されている日付形式を米国形式からフランス形式に変更します。
Procedure
Results
選択したカラムで日付形式が変更されます。
銀行口座番号の抽出
セルに含まれているテキストの一部を取り出し、他の場所で再使用する場合は、そのテキストの部分を抽出できます。
HRMS Export (HRMSのエクスポート)プレパレーションには、フランスのIBAN (International Bank Account Numbers)が含まれています。IBANは、スペースを含めて33文字になるコードです。国コード、2つの検査数字、5桁の銀行ID、5桁の支店コード、11桁の口座番号、2つの最終検査番号からなります。
IBANから口座番号の部分を新しいカラムに抽出します。
Before you begin
手順を進める前に、テキストレコードから不要なスペースを削除し、セルの長さが同じどうか確認することをお勧めします。
Procedure
Results
選択したデータに相当するテキストが新しいカラムに抽出されます。カラムの名前は変更できます。
準備されたHRMSデータをエクスポート
プレパレーションが完成したら、クレンジングしたデータをエクスポートできます。
日付形式を変更し、IBANから口座番号を抽出するための、hrms_export.xlsx上のプレパレーションが完成したので、エクスポートできます。
Procedure
- [Export] (エクスポート)ボタンをクリックします。
-
データのエクスポートで使う形式を選択します:
- [Local CSV file] (ローカルCSVファイル)を選択した場合は、使用するフィールド区切り、テキスト囲み文字、およびエスケープ文字を選択し、エクスポートするファイルの名前を入力します。
- [Local XLSX file] (ローカルXLSXファイル)を選択する場合は、エクスポートするファイルの名前を入力します。
- Amazon S3を選択する場合は、認証情報とその他の情報を入力して、ファイルをAmazon S3に保存します。
Results
プレパレーションを使ってクレンジングしたデータがローカルファイルにエクスポートされます。