tDBFSConnection
その他のDBFSのコンポーネントが、これによって作成される接続を再利用してこのDBFSと通信できるように、特定のDBFS (Databricksファイルシステム)システムに接続します。
DBFS (Databricks Filesystem)のコンポーネントは、Databricksによるデータ転送を迅速かつ明快に行うためのものです。パフォーマンスを最適化するために高度なシナリオで処理する必要がある場合は、SparkジョブをDatabricksで使用します。
デフォルトで、このコンポーネントはTalend Studioと共には出荷されていません。機能マネージャーを使ってインストールする必要があります。 詳細は、機能マネージャーを使って機能をインストールをご覧ください。
tDBFSConnectionの標準プロパティ
これらのプロパティは、標準ジョブのフレームワークで実行されているtDBFSConnectionを設定するために使われます。
標準のtDBFSConnectionコンポーネントは、ビッグデータファミリーとファイルファミリーに属しています。
このフレームワークのコンポーネントは、すべてのビッグデータ対応のTalend製品およびTalend Data Fabricで使用できます。
基本設定
[Property type] (プロパティタイプ) |
[Built-in] (組み込み)と[Repository] (リポジトリー)のいずれかです。 [Built-In] (組み込み): 一元的に保存されるプロパティデータはありません。 [Repository] (リポジトリー): プロパティが保存されているリポジトリーファイルを選択します。 |
[Endpoint] (エンドポイント) |
[Endpoint] (エンドポイント)フィールドに、Azure DatabricksワークスペースのURLアドレスを入力します。このURLは、AzureポータルのDatabricksワークスペースページの[Overview] (概要)のブレードにあります。このURLは、https://adb-$workspaceId.$random.azuredatabricks.netといった形式になります。 |
[Token] (トークン) |
[Token] (トークン)フィールドの横にある[...]ボタンをクリックして、Databricksユーザーアカウントに生成された認証トークンを入力します。このトークンは、Databricksワークスペースの[User settings] (ユーザー設定)ページで生成または検索できます。詳細は、公式AzureドキュメンテーションからのPersonal access tokens (パーソナルアクセストークン)をご覧ください。 |
詳細設定
[tStatCatcher Statistics] (tStatCatcher統計) |
このチェックボックスを選択すると、ジョブレベルおよび各コンポーネントレベルでジョブ処理メタデータが収集されます。 |
使用方法
使用ルール |
このコンポーネントは、通常、他のDBFSコンポーネントと共に使います。 |