セマンティック認識分析を使用するステップ
Talend Studioでセマンティック認識分析を使用して、次のことが行えます。
- 分析を行うデータでセマンティックカテゴリーを検討し、複雑なセマンティックリレーションシップをクエリーします。
- データに最適なインジケーターとパターンで事前設定済みテーブル分析を作成します。
- セマンティックカテゴリーと分析結果を使って、Elasticsearchサーバーでオントロジーリポジトリーをインデックス化およびエンリッチ化します。
セマンティックを認識したアプローチを用いて、構成済みのテーブル分析を作成するステップは、以下のとおりです。
- Talend Studioでデータソース(データベース、区切り付きファイル、Hiveなど)への接続を行います。
詳細は、データソースへの接続を作成をご覧ください。
- オントロジーインデックスが保存されているElasticsearchサーバーを起動する。
詳細は、サーバーの起動と環境設定をご覧ください。
- データソースでテーブルを選択するか、データベース接続でビューを選択し、データカラムのセマンティックカテゴリーを検討する。
テーブル内のカラムセットを対象にセマンティック認識分析を開始するというオプションもあります。詳細は、データカラムのセマンティックカテゴリーを検討をご覧ください。
- カラムメタデータとセマンティックカテゴリーをオントロジーリポジトリーからのコンセプトに一致させ、一致結果を出力して、最も関連するコンセプトを示す。
詳細は、カラムのメタデータおよびセマンティックカテゴリーとオントロジーリポジトリー内のコンセプトとの一致をご覧ください。
- カラムの属性(セマンティック)を定義し、カラムメタデータとセマンティックカテゴリーでオントロジーリポジトリーをエンリッチ化する。
詳細は、オントロジーリポジトリーのエンリッチ化をご覧ください。
- 推奨されるテーブル分析を実行し、分析結果、および分析済みカラムに使用したインジケーターとパターンで、オントロジーリポジトリーをエンリッチ化する。
詳細は、推奨されるテーブル分析を定義をご覧ください。