tMSSqlInvalidRowsの標準プロパティ
これらのプロパティは、標準ジョブのフレームワークで実行されているtMSSqlInvalidRowsを設定するために使われます。
標準のtMSSqlInvalidRowsコンポーネントは、データクオリティファミリーに属しています。
このコンポーネントは、Talend Data Management PlatformTalend Big Data Platform、Talend Real-Time Big Data PlatformTalend Data Services Platform、Talend MDM PlatformおよびTalend Data Fabricで使用できます。
基本設定
データベース |
目的のデータベースタイプをリストから選択し、[Apply] (適用)をクリックします。 |
[Validation type] (検証タイプ) | [DQ rule validation] (DQルールの検証): データベース内のデータをData Qualityルールに基づいて検証します。 |
[Property type] (プロパティタイプ) | [Built-in] (組み込み)と[Repository] (リポジトリー)のいずれかです。
|
[Use an existing connection] (既存の接続を使用) |
定義済みの接続の詳細を再利用する場合は、このチェックボックスを選択して、[Component List] (コンポーネントリスト)ドロップダウンリストから、目的の接続コンポーネントを選択します。 情報メモ注: ジョブに親ジョブと子ジョブが含まれている時は、親ジョブと子ジョブの間の既存の接続を共有したい場合(たとえば、親ジョブで作成した接続を子ジョブと共有するなど)には、次のように実行します。
ジョブレベル全体でデータベース接続を共有する方法の例は、データベース接続を共有をご覧ください。 |
[JDBC Provider] (JDBCプロバイダー) |
使うJDBCドライバーのプロバイダー、[Microsoft] (マイクロソフト) (デフォルト、推奨)または[Open source JTDS] (オープンソースJTDS)を選択します。 Microsoftを選択した場合は、SQL Server用Microsoft JDBCドライバーを[Microsoftダウンロードセンター]からダウンロードし、ダウンロードしたzipファイルを解凍し、解凍したフォルダーからお使いのJREバージョンに基づいてjarを選択し、jarの名前をmssql-jdbc.jarに変更し、手動でインストールする必要があります。jarの選択については、Microsoftダウンロードセンターでシステム要件情報をご覧ください。 このコンポーネントを Talend Runtimeでデータソースと併用する場合は、[Open source JTDS] (オープンソースJTDS)ドライバーを使用する必要があります。 |
ホスト | データベースサーバーのIPアドレスを入力します。 |
ポート | データベースサーバーのリスニングポート番号を入力します。 |
データベース | データベースの名前を入力します。 |
[MsSQL schema] (MsSQLスキーマ) | Microsoft SQL Serverスキーマの名前を入力します。 |
[Username] (ユーザー名)と[Password] (パスワード) | データベースのユーザー認証データを入力します。 パスワードを入力するためには、パスワードフィールドの横にある[...]ボタンをクリックし、ポップアップダイアログボックスにパスワードを二重引用符で囲んで入力して[OK]をクリックし、設定を保存します。 |
[Schema] (スキーマ)と[Edit schema] (スキーマを編集) |
スキーマとは行の説明のことです。処理して次のコンポーネントに渡すフィールド(カラム)数を定義します。Sparkジョブを作成する場合、フィールドの命名時は予約語のlineを避けます。 スキーマを変更するには[Edit schema] (スキーマを編集)をクリックします。現在のスキーマがリポジトリータイプの場合は、3つのオプションを利用できます。
[Built-in] (組み込み): そのコンポーネントに対してのみスキーマを作成し、ローカルに保管します。 [Repository] (リポジトリー): スキーマは作成済みで、リポジトリーに保管されています。さまざまなプロジェクトやジョブデザインで再利用できます。 |
[Table Name] (テーブル名) | 読み取るテーブルの名前を入力します。 |
[Where clause] (Where句) | WHERE句を入力して、テーブル内に行フィルターを定義します。 テーブル内の分析する行をフィルタリングするには、WHERE句を使用します。このWHERE句で、指定した条件に一致する有効なデータと無効なデータを取得できます。 |
[DQ rule list] (DQルールリスト) | データベースの行をチェックするルールをリストから選択します。 |
[Query type] (クエリータイプ) | [Built-in] (組み込み)または[Repository] (リポジトリー)のいずれかで次の設定を行います。
|
[Guess Query] (クエリーを推測) | [Guess Query] (クエリーを推測)ボタンをクリックして、[Query] (クエリー)フィールド内のテーブルスキーマに対応するクエリーを生成します。 |
[Guess Schema] (推測スキーマ) | [Guess Schema] (推測スキーマ)ボタンをクリックして、テーブルからスキーマを取得します。 |
クエリー | DBクエリーを入力します。フィールドの順序に気を付けて、スキーマ定義と一致するようにしてください。 |
詳細設定
[Additional JDBC Parameters] (追加のJDBCパラメーター) | 作成するデータベース接続の接続の追加プロパティを指定します。このオプションは、[Basic settings] (基本設定)の[Use an existing connection] (既存の接続を使用)チェックボックスがオンになっている場合は利用できません。 情報メモ注: 事前定義済みのグローバル変数のリストにアクセスするには、Ctrl + スペースを押します。
|
[Enable stream] (ストリームを有効化) | ストリーミングオーバーバッファリングを有効にする場合は、このチェックボックスを選択します。これで、大きなテーブルからの読み取りにも大量のメモリを消費せずに済むため、パフォーマンスが最適化されます。 |
[Trim all the String/char columns] (すべての文字列/文字カラムをトリミング) | すべてのStringカラム/Charカラムの先頭や末尾の空白を削除する場合は、このチェックボックスをオンにします。 |
[Trim column] (カラムをトリミング) | 定義されたカラムから先頭や末尾の空白を削除します。 情報メモ注: [Trim all the String/Char columns] (すべての文字列/文字カラムをトリミング)チェックボックスをオフにして、[Trim column] (カラムをトリミング)を有効にします。
|
[tStatCatcher Statistics] (tStatCatcher統計) |
このチェックボックスを選択すると、ジョブレベルおよび各コンポーネントレベルでジョブ処理メタデータが収集されます。 |
グローバル変数
グローバル変数 |
NB_LINE: 入力コンポーネントによって読み取られた行の数、または出力コンポーネントに転送された行の数。これはAfter変数で、整数を返します。 QUERY: 処理されているクエリーステートメント。これはFlow変数で、文字列を返します。 ERROR_MESSAGE: エラーが発生した時にコンポーネントによって生成されるエラーメッセージ。これはAfter変数で、文字列を返します。この変数はコンポーネントにこのチェックボックスが存在し、[Die on error] (エラー発生時に強制終了)がオフになっている場合のみ機能します。 Flow変数はのコンポーネントの実行中に機能し、After変数はコンポーネントの実行後に機能します。 フィールドまたは式に変数を入力する場合は、Ctrl + スペースを押して変数リストにアクセスし、使用する変数を選択します。 変数の詳細は、コンテキストと変数を使用をご覧ください。 |
使用方法
使用ルール |
このコンポーネントは、通常、ジョブまたはサブジョブの開始コンポーネントとして使い、常に出力リンクが必要です。 |
[Dynamic settings] (ダイナミック設定) |
[+]ボタンをクリックしてテーブルに行を追加し、[Code] (コード)フィールドにコンテキスト変数を入力して、ジョブ内で計画した複数の接続からデータベース接続をダイナミックに選択します。この機能は、データストラクチャーが同じでデータベースが異なるデータベーステーブルにアクセスする必要がある場合、特に、Talend Studioを介さずにジョブをデプロイおよび実行する必要がある時など、ジョブの設定を変更できない環境で作業している場合に役立ちます。 [Dynamic settings] (ダイナミック設定)テーブルは、[Basic settings] (基本設定)ビューで[Use an existing connection] (既存の接続を使用)チェックボックスがオンになっている場合のみ利用できます。ダイナミックパラメーターを定義すると、[Basic settings] (基本設定)ビューの[Component List] (コンポーネントリスト)ボックスは利用できなくなります。 ダイナミックパラメーターの定義法を示すユースケースについては、コンテキストベースのダイナミック接続によってデータベースからデータを読み取りと、ダイナミックにロードされた接続パラメーターを使って異なるMySQLデータベースからデータを読み取りをご覧ください。ダイナミック設定とコンテキスト変数の詳細は、ダイナミックスキーマとコンテキストグループを作成し、その中でコンテキスト変数を定義をご覧ください。 |