Hive経由でADLS Databricksファイルをプロファイリング
Talend StudioのProfilingパースペクティブから、Hiveを介してADLS Databricksファイルでカラム分析を生成できます。
DatabricksでHiveに接続するには、JDBC接続が必要です。
- JDBCドライバーをダウンロードしてTalend Studioに追加します。
- ADLSクラスターにJDBC接続を作成します。
- テーブルとカラムに、単純なインジケーターを持つカラム分析を作成します。
続いて、必要に応じて分析の設定を変更し、他のインジケーターを追加できます。また、同じHiveテーブルを使い、このADLSファイルに別の分析を作成することもできます。
JDBCドライバーをダウンロードしてTalend Studioに追加
JDBCドライバーはjarファイルで、JDBC接続の作成に必要です。
Procedure
Results
ADLS Databricks Gen2ファイルに接続
ADLS Databricks Gen2ファイルをプロファイリングするためには、外部テーブルを作成して、パラメーターを設定する必要があります。
Before you begin
外部テーブルは、tAzureFSConfigurationとtJavaの両コンポーネントを使って作成することもできます。
About this task
Procedure
ADLS Databricksクラスターに接続を作成
Before you begin
- Profilingパースペクティブを選択済みであること。
- JDBCドライバーをダウンロードしてStudioに追加という手順を実行済みであること。
About this task
Procedure
Hive経由でADLS Databricksファイルにプロファイリング分析を作成
Hive経由でADLS Databricksクラスターに接続を作成した後は、特定のファイルでプロファイリング分析を作成できます。
Before you begin
- Profilingパースペクティブを選択済みであること。
- ADLS Databricksクラスターに接続を作成という手順に従っていること。
カラム分析の詳細は、カラム分析をご覧ください。