Clouderaでコンテキスト変数を使用
このシナリオでは、異なるClouderaオンプレミスランタイム(7.1.7 Spark 3.2.xと7.1.9 Spark 3.3.x)の間でSparkジョブを実行する場所を選択します。
これは、オンプレミス(7.1.x)とクラウド(7.2.x)のClouderaディストリビューションが混在している場合も該当します。
この機能は、Talend Studioコンテキスト変数機能とQlik Spark Universal 3.3.xディストリビューションモード(Clouderaディストリビューションの最新モード)で有効になります。
始める前に
- お使いのターゲットディストリビューションがSpark 2、Spark 3、またはその両方と同時に互換性を持つかどうかについては、Clouderaのドキュメンテーションでご確認ください。
- Cloudera Managerから、使用する各Hadoopサービス(HDFS、Hive、HBaseなど)のクライアント設定をダウンロードします。詳細は、ClouderaのドキュメンテーションでDownloading Client Configuration Filesをご覧ください。
Hadoopクラスターへのメタデータ接続を作成
手順
Hadoop設定をインポート
手順
メタデータ接続をコンテキスト依存化
コンテキスト値を使えば、1つのクラスターを異なるパラメーターで使用できます。