tDeltaLakeInputの標準プロパティ
これらのプロパティは、標準ジョブのフレームワークで実行されているtDeltaLakeInputを設定するために使われます。
標準のtDeltaLakeInputコンポーネントは、データベースファミリーに属しています。
このフレームワーク内のコンポーネントは、すべてのTalend製品で利用できます。
基本設定
[Database] (データベース) |
データベースのタイプをリストから選択し、[Apply] (適用)をクリックします。 |
[Property Type] (プロパティタイプ) |
接続の詳細を設定する方法を選択します。
[Connection Component] (接続コンポーネント)ドロップダウンリストから、他の接続コンポーネントを選択した場合、このプロパティは、利用できません。 |
|
このアイコンをクリックすると、データベース接続ウィザードが開き、コンポーネント[Basic settings] (基本設定)ビューに設定したデータベース接続パラメーターが保存されます。 データベース接続パラメーターの設定と保管の詳細は、Talend Studioユーザーガイドをご覧ください。 |
[Connection Component] (接続コンポーネント) |
このコンポーネントで再利用するデータベース接続を開くコンポーネントを選択します。 |
JDBC URL |
使用するDelta LakeデータベースのJDBC URL。先頭はjdbc:spark://です(既に表示されています)。関連情報は、JDBC and ODBC drivers and configuration parameters (英語のみ)でConfigure JDBC URLをご覧ください。 |
[Drivers] (ドライバー) |
必要なドライバーJARをロードするには、このテーブルに記入してください。これを行うには、テーブルの下の[+]ボタンをクリックして、必要に応じてドライバーJAR用行数を増やします。セルを選択し、セルの右側にある[...]ボタンをクリックして、[Module] (モジュール)ダイアログボックスを開くと使用するドライバーJARを選択できます。このコンポーネントにはドライバーjar SparkJDBC42-2.6.14.1018.jarが必要であり、デフォルトで追加されています。 詳細は、[Importing a database driver] (データベースドライバのインポート) (英語のみ)をご覧ください。 |
[Driver Class] (ドライバークラス) |
指定したドライバーのクラス名を二重引用符で囲んで入力します。SparkJDBC42-2.6.14.1018.jarドライバーの場合、入力する名前はcom.simba.spark.jdbc.Driverです(既に表示されています)。 |
[User Id] (ユーザーID)と[Password] (パスワード) |
データベースユーザー認証データ。関連情報は、JDBC and ODBC drivers and configuration parameters (英語のみ)でUsername and password authenticationをご覧ください。 パスワードを入力するには、パスワードフィールドの横にある[...]ボタンをクリックし、ポップアップダイアログボックスにパスワードを二重引用符の間に入力し、OKをクリックして設定を保存します。 |
[Schema] (スキーマ)と[Edit schema] (スキーマを編集) |
スキーマとは行の説明のことです。処理して次のコンポーネントに渡すフィールド(カラム)数を定義します。Sparkジョブを作成する場合、フィールドの命名時は予約語のlineを避けます。
スキーマを変更するには[Edit schema] (スキーマを編集)をクリックします。
情報メモ注: 変更を加えると、スキーマは自動的に組み込みになります。
このコンポーネントは、ダイナミックスキーマ機能の利点を備えているので、ソースファイルから不明なカラムを取得したり、各カラムを個別にマッピングしなくてもソースからカラムを一括してコピーしたりできます。ダイナミックスキーマの詳細は、Talend Studioユーザーガイドをご覧ください。 このダイナミックスキーマ機能は、テーブルの不明なカラムを取得する目的で設計されており、この目的に限り使用をお勧めします。テーブルの作成で使用することは勧められていません。 |
[Table Name] (テーブル名) |
データの取得元となるテーブルの名前。 |
[Query Type] (クエリータイプ)と[Query] (クエリー) |
スキーマ定義に対応する必要がある、フィールドの適切な順序に特に注意を払うデータベースクエリーステートメントを指定します。
ダイナミックスキーマ機能を使用する場合、SELECTクエリーには、選択したテーブルからすべてのカラムを取得するため*ワイルドカードを含める必要があります。 |
[Guess Query] (クエリーを推測) |
このボタンをクリックすると、定義されたテーブルとスキーマに基づいて[Query] (クエリー)フィールドにクエリーが生成されます。 |
[Guess Schema] (推測スキーマ) |
このボタンをクリックすると、[Query] (クエリー)フィールドで定義されたクエリーに基づいてスキーマカラムが生成されます。 |
[Specify a data source alias] (データソースエイリアスを指定) |
このチェックボックスをオンにして、[Data source alias] (データソースエイリアス)フィールドが表示されたら、データソース設定で定義した共有接続プールを使用するために、 Talend Runtime側で作成したデータソースのエイリアスを指定します。このオプションは、 Talend Runtime内にジョブをデプロイして実行する時にのみ機能します。 [Connection Component] (接続コンポーネント)ドロップダウンリストから、他の接続コンポーネントを選択した場合、このプロパティは、利用できません。 |
詳細設定
[Use cursor] (カーソルを使用) |
このチェックボックスを選択すると、いつでも作業する行数を指定できます。このオプションにより、パフォーマンスを最適化できます。 |
[Trim all the String/Char columns] (すべての文字列/文字カラムをトリミング) |
このチェックボックスを選択すると、先行ホワイトスペースおよび後続ホワイトスペースがすべての文字列/文字カラムから削除されます。 |
[Check column to trim] (トリムするカラムの確認) |
対応するカラムのチェックボックスをオンにすると、先行ホワイトスペースおよび後続ホワイトスペースが削除されます。 このプロパティは、[Trim all the String/Char columns] (すべての文字列/文字カラムをトリミング)チェックボックスがオンになっている場合は利用できません。 |
ダイナミック用にマッピングファイルの有効化 |
ダイナミックタイプのカラムからデータを読み取る時に指定のメタデータマッピングファイルを使うには、このチェックボックスをオンにします。このチェックボックスは、デフォルトでオフになっています。 このチェックボックスをオンにすると、[Mapping File] (マッピングファイル)ドロップダウンリストからデータベースのタイプを選択すれば、使うメタデータマッピングファイルを指定できます。 メタデータマッピングファイルの詳細は、Talend Studioユーザーガイドでタイプ変換に関するセクションをご覧ください。 |
[Use PreparedStatement] (PreparedStatementの使用) |
プレパレーション済みのステートメントを使用してデータベースをクエリーする場合は、このチェックボックスを選択します。表示される[Set PreparedStatement Parameters] (PreparedStatementパラメーターの設定) テーブルで、 [Query] (クエリー)フィールドで定義されたSQLステートメント内に疑問符?で表される各パラメーターの値を指定します。
このプロパティの関連ユースケースは、PreparedStatementオブジェクトを使ってデータをクエリーをご覧ください。 |
[Allow special character in Dynamic table name] (ダイナミックテーブル名に特殊文字を許可する) |
このオプションを選択すると、ダイナミックカラム内に入力テーブルの実際のカラム名を使用できます。このオプションを選択すると、入力テーブルのカラム名の特殊文字(例: $)がダイナミックカラム内で_に変換されることを防止できます。 このオプションはデフォルトで選択されています。 情報メモ注: このオプションは、TalendのR2020-06以降のStudioマンスリーアップデートをインストール済みである場合のみ利用できます。詳細は管理者にお問い合わせください。
|
[tStatCatcher Statistics] (tStatCatcher統計) |
このチェックボックスを選択すると、ジョブレベルおよび各コンポーネントレベルでジョブ処理メタデータが収集されます。 |
グローバル変数
ERROR_MESSAGE |
エラー発生時にコンポーネントによって生成されるエラーメッセージ。これはAfter変数で、文字列を返します。 |
NB_LINE |
処理された行数。これはAfter変数で、整数を返します。 |
QUERY |
処理されるクエリーステートメント。これはFlow変数で、文字列を返します。 |
使用方法
使用ルール |
このコンポーネントでは、DeltaLake接続を使うすべてのデータベースに対し、使用可能なすべてのSQLクエリーが網羅されています。 |
[Dynamic settings] (ダイナミック設定) |
[+]ボタンをクリックしてテーブルに行を追加し、[Code] (コード)フィールドにコンテキスト変数を入力して、ジョブ内で計画した複数の接続からデータベース接続をダイナミックに選択します。この機能は、データストラクチャーが同じでデータベースが異なるデータベーステーブルにアクセスする必要がある場合、特に、Talend Studioを介さずにジョブをデプロイおよび実行する必要がある時など、ジョブの設定を変更できない環境で作業している場合に役立ちます。 ダイナミックパラメーターの定義法を示すユースケースについては、コンテキストベースのダイナミック接続によってデータベースからデータを読み取りと、ダイナミックにロードされた接続パラメーターを使って異なるMySQLデータベースからデータを読み取りをご覧ください。[Dynamic settings] (ダイナミック設定)とコンテキスト変数については、Talend Studioユーザーガイドをご覧ください。 |