tMSSqlInvalidRowsの標準プロパティ
これらのプロパティは、標準ジョブのフレームワークで実行されているtMSSqlInvalidRowsを設定するために使われます。
標準のtMSSqlInvalidRowsコンポーネントは、データクオリティファミリーに属しています。
このコンポーネントは、Talend Data Management Platform、Talend Big Data Platform、Talend Real Time Big Data Platform、Talend Data Services Platform、Talend MDM PlatformおよびTalend Data Fabricで利用できます。
基本設定
[Database] (データベース) |
データベースのタイプをリストから選択し、[Apply] (適用)をクリックします。 |
[Validation type] (検証タイプ) |
[DQ rule validation] (DQルールの検証): データベース内のデータをData Qualityルールに基づいて検証します。 |
[Property type] (プロパティタイプ) |
[Built-in] (組み込み)と[Repository] (リポジトリー)のいずれかです。
|
[Use an existing connection] (既存の接続を使用) |
定義済みの接続の詳細を再利用する場合は、このチェックボックスをオンにして、[Component List] (コンポーネントリスト)ドロップダウンリストから、目的の接続コンポーネントを選択します。 情報メモ注: ジョブに親ジョブと子ジョブが含まれている時は、2つのレベルの間の既存の接続を共有する必要がな場合(たとえば、親ジョブで作成した接続を子ジョブと共有するなど)には、以下を実行する必要があります。
ジョブレベル全体でデータベース接続を共有する方法の例は、Talend Studioユーザーガイドをご覧ください。 |
[JDBC Provider] (JDBCプロバイダー) |
使うJDBCドライバーのプロバイダー、[Microsoft] (マイクロソフト) (デフォルト、推奨)または[Open source JTDS] (オープンソースJTDS)を選択します。 Microsoftを選択した場合は、SQL Server用Microsoft JDBCドライバーを[Microsoftダウンロードセンター] (英語のみ)からダウンロードし、ダウンロードしたzipファイルを解凍し、解凍したフォルダーからお使いのJREバージョンに基づいてjarを選択し、jarの名前をmssql-jdbc.jarに変更し、手動でインストールする必要があります。jarの選択については、Microsoftダウンロードセンター (英語のみ)でシステム要件情報をご覧ください。 このコンポーネントを Talend Runtimeでデータソースと併用する場合は、[Open source JTDS] (オープンソースJTDS)ドライバーを使用する必要があります。 情報メモ注: このオプションは、TalendのR2020-06以降のStudioマンスリーアップデートをインストール済みである場合のみMicrosoftにデフォルト設定されます。詳細は管理者にお問い合わせください。
|
[Host] (ホスト) |
データベースサーバーのIPアドレス。 |
[Port] (ポート) |
データベースサーバーのリスニングポート番号。 |
[Database] (データベース) |
データベースの名前。 |
[MsSQL schema] (MsSQLスキーマ) |
Microsoft SQL Serverスキーマの名前。 |
Username (ユーザー名)とPassword (パスワード) |
データベースユーザー認証データ。 パスワードを入力するには、パスワードフィールドの横にある[...]ボタンをクリックし、ポップアップダイアログボックスにパスワードを二重引用符の間に入力し、OKをクリックして設定を保存します。 |
[Schema] (スキーマ)と[Edit schema] (スキーマを編集) |
スキーマとは行の説明のことです。処理して次のコンポーネントに渡すフィールド(カラム)数を定義します。Sparkジョブを作成する場合、フィールドの命名時は予約語のlineを避けます。 スキーマを変更するには[Edit schema] (スキーマを編集)をクリックします。現在のスキーマがリポジトリータイプの場合は、3つのオプションを利用できます。
[Built-in] (組み込み): そのコンポーネントに対してのみスキーマを作成し、ローカルに保管します。 [Repository] (リポジトリー): スキーマは作成済みで、リポジトリーに保管されています。さまざまなプロジェクトやジョブデザインで再利用できます。 |
[Table Name] (テーブル名) |
読み取るテーブルの名前を入力します。 |
[Where clause] (Where句) |
WHERE句を入力して、テーブル内に行フィルターを定義します。 テーブル内の分析する行をフィルタリングするには、WHERE句を使用します。このWHERE句で、指定した条件に一致する有効なデータと無効なデータを取得できます。 |
[DQ rule list] (DQルールリスト) |
データベースの行をチェックするルールをリストから選択します。 |
[Query type] (クエリータイプ) |
[Built-in] (組み込み)または[Repository] (リポジトリー)のいずれかで次の設定を行います。
|
[Guess Query] (クエリーを推測) |
[Guess Query] (クエリーを推測)ボタンをクリックして、[Query] (クエリー)フィールド内のテーブルスキーマに対応するクエリーを生成します。 |
[Guess Schema] (推測スキーマ) |
[Guess Schema] (推測スキーマ)ボタンをクリックして、テーブルからスキーマを取得します。 |
クエリー |
DBクエリーを入力します。フィールドの順序に気を付けて、スキーマ定義と一致するようにしてください。 |
詳細設定
[Additional JDBC Parameters] (追加のJDBCパラメーター) |
作成するデータベース接続の接続の追加プロパティを指定します。このオプションは、[Basic settings] (基本設定)の[Use an existing connection] (既存の接続を使用)チェックボックスがオンになっている場合は利用できません。 情報メモ注:
事前定義済みのグローバル変数のリストにアクセスするには、Ctrl + スペースを押します。 |
[Enable stream] (ストリームを有効化) |
ストリーミングオーバーバッファリングを有効にする場合は、このチェックボックスを選択します。これで、大きなテーブルからの読み取りにも大量のメモリを消費せずに済むため、パフォーマンスが最適化されます。 |
[Trim all the String/char columns] (すべての文字列/文字カラムをトリミング) |
すべてのStringカラム/Charカラムの先頭や末尾の空白を削除する場合は、このチェックボックスをオンにします。 |
[Trim column] (カラムをトリミング) |
定義されたカラムから先頭や末尾の空白を削除します。 情報メモ注:
[Trim all the String/Char columns] (すべての文字列/文字カラムをトリミング)チェックボックスをオフにして、[Trim column] (カラムをトリミング)を有効にします。 |
[tStatCatcher Statistics] (tStatCatcher統計) |
このチェックボックスを選択すると、ジョブレベルおよび各コンポーネントレベルでジョブ処理メタデータが収集されます。 |
グローバル変数
グローバル変数 |
NB_LINE: 入力コンポーネントによって読み取られた行の数、または出力コンポーネントに転送された行の数。これはAfter変数で、整数を返します。 QUERY: 処理されているクエリーステートメント。これはFlow変数で、文字列を返します。 ERROR_MESSAGE: エラーが発生した時にコンポーネントによって生成されるエラーメッセージ。これはAfter変数で、文字列を返します。この変数はコンポーネントにこのチェックボックスが存在し、[Die on error] (エラー発生時に強制終了)がオフになっている場合のみ機能します。 Flow変数はのコンポーネントの実行中に機能し、After変数はコンポーネントの実行後に機能します。 フィールドまたは式に変数を入れるには、Ctrl + スペースを押して変数リストにアクセスし、リストから使用する変数を選択します。 変数の詳細は、Talend Studioユーザーガイドをご覧ください。 |
使用方法
使用ルール |
このコンポーネントは、通常、ジョブまたはサブジョブの開始コンポーネントとして使い、常に出力リンクが必要です。 |
[Dynamic settings] (ダイナミック設定) |
[+]ボタンをクリックしてテーブルに行を追加し、[Code] (コード)フィールドにコンテキスト変数を入力して、ジョブ内で計画した複数の接続からデータベース接続をダイナミックに選択します。この機能は、データストラクチャーが同じでデータベースが異なるデータベーステーブルにアクセスする必要がある場合、特に、Talend Studioを介さずにジョブをデプロイおよび実行する必要がある時など、ジョブの設定を変更できない環境で作業している場合に役立ちます。 [Dynamic settings] (ダイナミック設定)テーブルは、[Basic settings] (基本設定)ビューで[Use an existing connection] (既存の接続を使用)チェックボックスがオンになっている場合のみ利用できます。ダイナミックパラメーターを定義すると、[Basic settings] (基本設定)ビューの[Component List] (コンポーネントリスト)ボックスは利用できなくなります。 ダイナミックパラメーターの定義法を示すユースケースについては、コンテキストベースのダイナミック接続によってデータベースからデータを読み取りと、ダイナミックにロードされた接続パラメーターを使って異なるMySQLデータベースからデータを読み取りをご覧ください。[Dynamic settings] (ダイナミック設定)とコンテキスト変数については、Talend Studioユーザーガイドをご覧ください。 |