JavaエンジンまたはSQLエンジンの使用
分析エディターで分析パラメーターを設定したら、JavaエンジンまたはSQLエンジンを使用して、分析を実行できます。
選択するエンジンによって、分析結果に多少の違いが出る場合があります。たとえば、DB2データベースでプロファイリングを行うために、集計統計インジケーターを選択した場合、その可能性があります。これはデータベースの種類によってインジケーターの計算方法が異なるためです。また、 Talend ではJavaの使用に際して特別なファンクションを使用します。
SQLエンジン
SQLエンジンを使ってカラム分析を実行する場合
- カラム分析で使われるインジケーターごとにSQLクエリーが生成され、分析では複数のインジケーターが並列して実行され、分析が進行中でもチャート内の結果は更新されます。
- DBMSでデータの監視と処理が行われます。
- 統計結果のみがローカルで取得されます。
このエンジンを使用すると、システムのパフォーマンスは確実に向上します。データエクスプローラーでは有効なデータにも無効なデータにもアクセスできます。
Javaエンジン
Javaエンジンを使ってカラム分析を実行する場合
- カラム分析で使用されるすべてのインジケーターに対し、クエリーが1つだけ生成されます。
- 監視されたすべてのデータがローカルで取得および分析されます。
- パラメーターを設定して、分析されたデータにアクセスするかどうか、1つのインジケーターあたりいくつのデータ行を表示するかを決定できます。分析されたデータをすべて保管することはできないため、これによりメモリ制限の問題を回避できます。
Javaエンジンを使用してカラム分析を実行する場合は、各データベースに固有の異なるクエリーテンプレートは必要ありません。ただし、SQLエンジンに比べて、システムパフォーマンスが大幅に低下します。Javaエンジンを使用して分析を実行すると、すべてのデータが取得され、ローカルに保存された時にディスク容量が使用されます。空き容量を作成する場合は、Talend-Studio>workspace>project_name>Work_MapDBのメインのTalend Studioディレクトリー内に保存されているデータを削除できます。
Javaエンジンを使って、パラメーターを設定し、分析されたデータにアクセスするには、以下のようにします:
- カラム分析エディターの[Analysis Parameters] (分析パラメーター)セクションで、[Execution engine] (実行エンジン)としてJavaを選択します。
- 現在の分析によって分析されるデータをローカルに格納する場合は、[Allow drill down] (ドリルダウンを許可)チェックボックスをオンにします。このチェックボックスは通常デフォルトで選択されています。
- [Max number kept per indicator] (インジケーターごとに維持する最大行数)フィールドに、アクセス可能にするデータ行数を入力します。このフィールドはデフォルトで50に設定されています。
- 設定したパラメーターに従って分析を実行し、分析されたデータにアクセスします。
Oracleデータ型に関する既知の制限事項
使用しているエンジンによっては、サポートされていないデータ型もあります。詳細は、Oracleデータ型をご覧ください。