メイン コンテンツをスキップする 補完的コンテンツへスキップ

新しいデータベースタイプの追加

Talend Data Preparation では、さまざまなタイプのデータベースに直接接続でき、それらをソースとして新しいデータセットを作成できます。

データのインポート元として使用するデータベースタイプを追加できます。

データセットの作成に利用できるデータベースタイプは、<components_catalog_path>/.m2フォルダーに保存したJDBCドライバーに依存します。

たとえば、Oracleデータベースに顧客データが保存されていて、クレンジング操作を行うためにTalend Data Preparation にインポートするとします。この場合、Oracleデータベースに固有のJDBCドライバーの.jarファイルをComponents Catalogのフォルダー構造に追加して、この新しいデータソースをTalend Data Preparationインターフェイスに加えます。

ビッグデータのコンテキストでは、Oracleデータベースからインポートしたデータで作成したプレパレーションを実行するには、Hadoopクラスター上で、同じドライバーをSpark Job Serverのフォルダー構造に追加する必要があります。

サービスを停止または再起動しなくても、次の手順を完了できます。

手順

  1. MVN Repositoryのウェブサイト (英語のみ)から、ojdbc8-19.19.0.0.jarという最新版のOracle JDBCドライバーをダウンロードします。
  2. <components_catalog_path>/.m2/com/oracle/database/jdbc/ojdbc8/19.19.0.0/フォルダーを作成します。
  3. 新しく作成したフォルダーにojdbc8-19.19.0.0.jarをコピーします。
  4. 以下の行を追加して、<components_catalog_path>/config/jdbc_config.jsonファイルを更新します:
    {
    		"id" : "ORACLE",
    		"class" : "oracle.jdbc.OracleDriver",
    		"url" : "jdbc:oracle:thin:@//<server ip>:<server port>/<database>",
    		"paths" :
    		[
    			{"path" : "mvn:com.oracle.database.jdbc/ojdbc8/19.19.0.0"}
    		]
    
    	}

    説明:

    • idTalend Data Preparationは、[Database type] (データベースタイプ)のインターフェイスにとして表示される値です。
    • classは、データベースとの通信に使用されるドライバークラスです。
    • urlは、データベースにアクセスするためのURLテンプレートです。
    • pathはデータベースのパスで、ステップ2で説明したパスと同じものです。
  5. 新しいデータセットタイプについてHadoopクラスターへのエクスポートを有効にするためには、ojdbc8-19.19.0.0.jarファイルを<spark_job_server_path>/datastreams-deps/フォルダーにコピーします。
  6. <components_catalog_path>/config/jdbc_config.jsonファイルに加えられた変更をコピーして、それらを<spark_job_server_path>/jdbc_config.jsonファイルに貼り付けます。

タスクの結果

これで、Oracleデータベースがインポートフォーム内の[database type] (データベースタイプ)ドロップダウンリストに表示されます。

Oracleデータベースに保存されているデータで作成したプレパレーションをエクスポートする時に、データの処理をTalend Data Preparationサーバーで行うか、ビッグデータを使用している場合はHadoopクラスターで行うよう選択できます。

このページは役に立ちましたか?

このページまたはコンテンツにタイポ、ステップの省略、技術的エラーなどの問題が見つかった場合はお知らせください。