tRedshiftOutputBulkExecの標準プロパティ
これらのプロパティは、標準のジョブのフレームワークで実行されているtRedshiftOutputBulkExecを設定するために使われます。
標準のtRedshiftOutputBulkExecコンポーネントは、Cloudファミリーとデータベースファミリーに属しています。
このフレームワーク内のコンポーネントは、すべてのTalend製品で利用できます。
基本設定
[Database] (データベース) |
データベースのタイプをリストから選択し、[Apply] (適用)をクリックします。 |
[Property Type] (プロパティタイプ) |
[Built-in] (組み込み)と[Repository] (リポジトリー)のいずれかです。 |
|
[Built-In] (組み込み): 一元的に保存されるプロパティデータはありません。 |
|
[Repository] (リポジトリー): プロパティが保管されるリポジトリーファイルを選択します。続くデータベース接続フィールドは、取得されたデータを使用して自動的に入力されます。 |
[Use an existing connection] (既存の接続を使用) |
定義済みの接続の詳細を再利用する場合は、このチェックボックスをオンにして、[Component List] (コンポーネントリスト)ドロップダウンリストから、目的の接続コンポーネントを選択します。 |
[Host] (ホスト) |
データベースサーバーのIPアドレスまたはホスト名を入力します。 |
[Port] (ポート) |
データベースサーバーのリスニングポート番号を入力します。 |
[Database] (データベース) |
データベースの名前を入力します。 |
[Schema] (スキーマ) |
スキーマの名前を入力します。 |
[Username] (ユーザー名)と[Password] (パスワード) |
データベースユーザー認証データを入力します。 パスワードを入力するには、パスワードフィールドの横にある[...]ボタンをクリックし、ポップアップダイアログボックスにパスワードを二重引用符の間に入力し、OKをクリックして設定を保存します。 |
[Additional JDBC Parameters] (追加のJDBCパラメーター) |
作成する接続の追加のJDBCプロパティを指定します。プロパティはアンパサンド(&)で区切られ、各プロパティはキー-値ペアです。たとえば、ssl=true & sslfactory=com.amazon.redshift.ssl.NonValidatingFactoryになります。これは、SSLを使用して接続が作成されることを意味します。 |
[Table Name] (テーブル名) |
作成するテーブルの名前を指定します。一度に書き込みができるテーブルは1つだけです。 |
[Action on table] (テーブルでのアクション) |
定義済みのテーブルで、次のオペレーションの1つを実行できます。
|
[Schema] (スキーマ)と[Edit schema] (スキーマを編集) |
スキーマとは行の説明のことです。処理して次のコンポーネントに渡すフィールド(カラム)数を定義します。Sparkジョブを作成する場合、フィールドの命名時は予約語のlineを避けます。 |
|
[Built-in] (組み込み): そのコンポーネントに対してのみスキーマを作成し、ローカルに保管します。 |
|
[Repository] (リポジトリー): スキーマは作成済みで、リポジトリーに保管されています。さまざまなプロジェクトやジョブデザインで再利用できます。 |
|
スキーマを変更するには[Edit schema] (スキーマを編集)をクリックします。現在のスキーマがリポジトリータイプの場合は、3つのオプションを利用できます。
|
[Data file path at local] (ローカルデータファイルパス) |
生成するファイルへのローカルパスを指定します。 このファイルは、Studioがインストールされているか、またはこのコンポーネントを使っているジョブがデプロイされているのと同じマシンに生成されます。 |
[Append the local file] (ローカルファイルの追加) |
このチェックボックスをオンにすると、指定したローカルファイルが既に存在する場合は、上書きではなく、追加されます。 |
[Create directory if not exists] (ディレクトリーがない場合はディレクトリーを作成) |
[Data file path at local] (ローカルデータファイルパス)フィールドで指定したディレクトリーが存在しない場合は、このチェックボックスをオンにして、指定したディレクトリーを作成します。デフォルトでは、このチェックボックスはオンです。 |
[Use an existing S3 connection] (既存のS3接続を使用) |
定義済みの接続の詳細を再利用する場合は、このチェックボックスをオンにして、[Component List] (コンポーネントリスト)ドロップダウンリストから、目的の接続コンポーネントを選択します。 |
[Credential Provider] (認証情報プロバイダー) |
AWSセキュリティ認識情報を取得する方法(Static CredentialsまたはInherit credentials from AWS role)を指定します。
情報メモ注: このドロップダウンリストはTalendのR2021-07以降のStudioマンスリーアップデートをインストールした時のみ利用できます。詳細は管理者にお問い合わせください。
|
[Access Key] (アクセスキー) |
AWSアカウントを一意に識別するアクセスキーIDを指定します。アクセスキーとアクセスシークレットを取得する方法は、Getting Your AWS Access Keys (英語のみ)をご覧ください。 情報メモ注: このオプションは、[Credentials provider] (認証情報プロバイダー)ドロップダウンリストから、Use an existing S3 connectionまたはInherit credentials from AWS roleが選択されていない場合に利用できます。
|
[Secret Key] (シークレットキー) |
シークレットアクセスキーを指定します。シークレットアクセスキーは、アクセスキーと組み合わせてセキュリティ認証情報を構成します。 シークレットキーを入力するには、シークレットキーフィールドの横にある[...]ボタンをクリックし、ポップアップダイアログボックスにシークレットキーを二重引用符の間に入力し、OKをクリックして設定を保存します。 情報メモ注: このオプションは、[Credentials provider] (認証情報プロバイダー)ドロップダウンリストから、Use an existing S3 connectionまたはInherit credentials from AWS roleが選択されていない場合に利用できます。
|
[S3 Assume Role] (S3ロールを引き受け) |
AWS IAMロールに関連付けられており、自分のユーザーアカウントに付与されていないアクセス権限を一時的に必要とする場合は、このチェックボックスをオンにすればそのロールを引き受けることができます。その後、次のパラメーターの値を指定して、新しく引き受けたロールセッションを作成します。 このロールに関連付けられている信頼ポリシーによって、自分のユーザーアカウントにそのロールへのアクセスが付与されていることをご確認ください。不明であれば、そのロールの所有者かAWS管理者にお問い合わせください。 情報メモ注: このオプションは、[Use an existing S3 connection] (既存のS3接続を使用)が選択されていない場合に利用できます。
|
[Region] (リージョン) |
リストからリージョン名を選択するか、リスト内で二重引用符の間にリージョンを入力して("us-east-1"など)、AWSリージョンを指定します。AWSリージョンの詳細の詳細は、Regions and Endpoints (英語のみ)をご覧ください。 情報メモ注: このフィールドは、[Use an existing S3 connection] ( 既存のS3接続を使用)が選択されていない場合に利用できます。
|
[Bucket] (バケット) |
ファイルのアップロード先のAmazon S3バケットの名前、つまり最上位のフォルダーを入力します。 使用するバケットとRedshiftデータベースは、Amazon上の同じリージョンに存在している必要があります。これにより、Amazonで既知のS3ServiceExceptionエラーが回避できる可能性があります。これらのエラーについては、S3ServiceExceptionエラー (英語のみ)をご覧ください。 |
[Key] (キー) |
Amazon S3にアップロードされたファイルに割り当てるオブジェクトキーを入力します。 |
[Redshift Assume Role] (Redshiftロールを引き受け) |
このチェックボックスをオンにして、新たに引き受けたロールセッションの作成に使用する以下のパラメーターに値を指定します。
IAMロールARNチェーンの詳細は、[Authorizing Redshift service] (Redshiftサービスの承認) (英語のみ)をご覧ください。 |
詳細設定
[Fields terminated by] (フィールド区切り) |
フィールドを区切るための文字を入力します。 |
[Enclosed by] (引用符) |
フィールドが引用符で囲まれているペア内の文字を選択します。 |
[Compressed by] (圧縮方式) |
このチェックボックスをオンにして、表示されたリストから圧縮タイプを選択し、データファイルを圧縮します。 [Append the local file] (ローカルファイルの追加)チェックボックスをオンにすると、このフィールドは表示されなくなります。 |
[Encrypt] (暗号化) |
データファイルを生成し、クライアント側の暗号化を使ってAmazon S3にアップロードするには、このチェックボックスをオンにします。[Encryption key] (暗号化キー)フィールドが表示されたら、ファイルの暗号化に使用されている暗号化キーを指定します。base64でエンコードされたAES 128ビットまたはAES 256ビットのエンベロープキーのみサポートされています。詳細は、Loading Encrypted Data Files from Amazon S3 (英語のみ)をご覧ください。 デフォルトでは、このチェックボックスはオフになっており、データファイルはサーバー側の暗号化を使ってAmazon S3にアップロードされます。 クライアント側とサーバー側の暗号化については、暗号化を使用したデータの保護 (英語のみ)をご覧ください。 情報メモ注: このフィールドは、[Use an existing S3 connection] ( 既存のS3接続を使用)が選択されていない場合に利用できます。
|
[Encoding] (エンコーディング) |
生成するファイル内のデータのエンコーディングタイプを選択します。 |
[Delete local file after putting it to s3] (S3へ格納後にローカルファイルを削除) |
Amazon S3にアップロードされた後にローカルファイルを削除するには、このチェックボックスをオンにします。デフォルトでは、このチェックボックスはオンです。 |
[Date format] (日付形式) |
リストから次の項目を1つ選択し、ソースデータの日付形式を指定します。
|
[Time format] (時刻の形式) |
リストから次の項目を1つ選択し、ソースデータの時刻の形式を指定します。
|
[Settings] (設定) |
データをロードする際のパラメーターを増やすには、テーブルの下の[+]ボタンをクリックします。
パラメーターの詳細は、http://docs.aws.amazon.com/redshift/latest/dg/r_COPY.html (英語のみ)をご覧ください。 |
[Config client] (クライアント設定) |
このチェックボックスをオンにすると、Amazon S3のクライアントパラメーターを設定できます。表示されたテーブルの下の[+]ボタンをクリックして、必要な数の行をクライアントパラメーターとして追加し、各パラメーターに以下の属性を設定するために使われます。
S3クライアントパラメーターの詳細は、クライアント側の設定 (英語のみ)を参照してください。 |
[STS Endpoint] (STSエンドポイント) |
このチェックボックスをオンにして、表示されたフィールドで、セッション認証情報の取得先とするAWS Security Token Service(STS)のエンドポイントを指定します。たとえばsts.amazonaws.comと入力します。 このチェックボックスは、[S3 Assume Role] (S3ロールを引き受け)チェックボックスがオンの場合のみ利用できます。 |
[Signing region] (サインインリージョン) |
STSサービスのAWSリージョンを選択します。リストにリージョンがない場合は、リージョン名を二重引用付きで入力します。デフォルト値はus-east-1です。 このドロップダウンリストは、[S3 Assume Role] (S3ロールを引き受け)チェックボックスがオンの場合のみ利用できます。 |
[External Id] (外部ID) |
ロールの持ち主であるアカウントの管理者から外部IDを提供されている場合は、その値をここに入力します。[External Id] (外部ID)は、一定数のユーザーがロールを引き受けられるようにする一意の識別子です。 このフィールドは、[S3 Assume Role] (S3ロールを引き受け)チェックボックスがオンの場合のみ利用できます。 |
[Serial number] (シリアル番号) |
ロールを引き受けた場合、そのロールの信頼ポリシーで多エレメント認証(MFA)が必要になることがあります。その際は、ロールを引き受けるユーザーに関連付けられているハードウェアや仮想MFAデバイスの識別番号を指定する必要があります。 このフィールドは、[S3 Assume Role] (S3ロールを引き受け)チェックボックスがオンの場合のみ利用できます。 |
[Token code] (トークンコード) |
ロールを引き受けた場合、そのロールの信頼ポリシーで多エレメント認証(MFA)が必要になることがあります。その際は、トークンコードを指定する必要があります。このトークンコードは、MFAデバイスによって生成される時間ベースのワンタイムパスワードです。 このフィールドは、[S3 Assume Role] (S3ロールを引き受け)チェックボックスがオンの場合のみ利用できます。 |
[Tags] (タグ) |
キー-値ペアという形式でセッションタグをリスト表示します。ポリシーでこれらのセッションタグを使えば、リクエストへのアクセスを許可したり拒否したりできます。 [Transitive] (推移的): このチェックボックスを選択すると、タグがロールチェーンの次のロールまで存続することが示されます。 タグの詳細は、 AWS STSでのセッションタグの受け渡し (英語のみ)をご覧ください。 このフィールドは、[S3 Assume Role] (S3ロールを引き受け)チェックボックスがオンの場合のみ利用できます。 |
[IAM Policy ARNs] (IAMポリシーARN) |
マネージドセッションポリシーとして使うIAMマネージドポリシーのAmazon Resource Names(ARN)を入力します。マネージドセッションポリシーを使ってセッションの権限を制限します。このポリシーはロールと同じアカウントに存在することが必要です。結果として得られるセッションの権限は、そのロールのIDベースのポリシーとセッションポリシーの中間となります。 セッションポリシーの詳細は、ポリシーとアクセス許可 (英語のみ)で該当するセクションをご覧ください。 このフィールドは、[S3 Assume Role] (S3ロールを引き受け)チェックボックスがオンの場合のみ利用できます。 |
[Policy] (ポリシー) |
セッションポリシーとして使うIAMポリシーをJSON形式で入力します。セッションポリシーを使ってセッションの権限を制限します。結果として得られるセッションの権限は、そのロールのIDベースのポリシーとセッションポリシーの中間となります。 セッションポリシーの詳細は、ポリシーとアクセス許可 (英語のみ)で該当するセクションをご覧ください。 このフィールドは、[S3 Assume Role] (S3ロールを引き受け)チェックボックスがオンの場合のみ利用できます。 |
JDBC URL |
[JDBC URL]ドロップダウンリストから、Amazon Redshiftデーターベースへのアクセス方法を選択します。
|
[tStatCatcher Statistics] (tStatCatcher統計) |
このチェックボックスを選択すると、ジョブレベルおよび各コンポーネントレベルでジョブ処理メタデータが収集されます。 |
グローバル変数
グローバル変数 |
ERROR_MESSAGE: エラーが発生した時にコンポーネントによって生成されるエラーメッセージ。これはAfter変数で、文字列を返します。この変数はコンポーネントにこのチェックボックスが存在し、[Die on error] (エラー発生時に強制終了)がオフになっている場合のみ機能します。 Flow変数はのコンポーネントの実行中に機能し、After変数はコンポーネントの実行後に機能します。 フィールドまたは式に変数を入れるには、Ctrl + スペースを押して変数リストにアクセスし、リストから使用する変数を選択します。 変数の詳細は、Talend Studioユーザーガイドをご覧ください。 |
使用方法
使用ルール |
このコンポーネントは、Amazon Redshiftにロードするデータが特定の変換を必要としない場合に主に使います。 |
[Dynamic settings] (ダイナミック設定) |
[+]ボタンをクリックしてテーブルに行を追加し、[Code] (コード)フィールドにコンテキスト変数を入力して、ジョブ内で計画した複数の接続からデータベース接続をダイナミックに選択します。この機能は、データストラクチャーが同じでデータベースが異なるデータベーステーブルにアクセスする必要がある場合、特に、Talend Studioを介さずにジョブをデプロイおよび実行する必要がある時など、ジョブの設定を変更できない環境で作業している場合に役立ちます。 [Dynamic settings] (ダイナミック設定)テーブルは、[Basic settings] (基本設定)ビューで[Use an existing connection] (既存の接続を使用)チェックボックスがオンになっている場合のみ利用できます。ダイナミックパラメーターを定義すると、[Basic settings] (基本設定)ビューの[Component List] (コンポーネントリスト)ボックスは利用できなくなります。 ダイナミックパラメーターの定義法を示すユースケースについては、コンテキストベースのダイナミック接続によってデータベースからデータを読み取りと、ダイナミックにロードされた接続パラメーターを使って異なるMySQLデータベースからデータを読み取りをご覧ください。[Dynamic settings] (ダイナミック設定)とコンテキスト変数については、Talend Studioユーザーガイドをご覧ください。 |