メイン コンテンツをスキップする 補完的コンテンツへスキップ

データセット詳細ビュー

データセットリストからデータセットをクリックすれば、その詳細ビューにアクセスできます。

情報メモ注: この機能は、Talend Cloud Data Inventoryがアカウントで有効になった時にTalend Cloud Pipeline DesignerTalend Cloud Data Preparationのユーザーが利用できるようになります。
詳細ビューでは、ソーシャルやコラボレーション機能に加え、データセットとそのコンテンツ、メタデータ、クオリティ、その他のプロパティを明確に把握できます。詳細ビューからは、特定のデータセットの次のパネルにアクセスできます。
  • データセットの概要
    データセットの概要

    リストからデータセットをクリックすると、このパネルが最初に開きます。データセットメタデータやシンプルなクオリティインジケーターといった情報を一目で把握できます。

  • データセットのサンプル
    データセットのサンプル

    ここではデータをさまざまな形式で直接視覚化したり、そのクオリティを確認したり、カラムのセマンティックカテゴリーを変更したりできます。

  • データAPIの管理
    API

    このメニューでAPIを有効にすることで、データセットの内容を目的のコンシューマーと簡単に共有できるようになります。

  • データセットのプロパティ
    データセットのプロパティ

    このページでは、データセットのプロパティを表示または編集したり、新しい構成に基づいて新しいサンプルを生成したりできます。

データセットの概要

リストでデータセットを選択すると、データセットの概要パネルが開き、さまざまな情報やメタデータが表示されます。

情報メモNote: この機能は、Talend Cloud Data Inventoryがアカウントで有効になった時にTalend Cloud Pipeline DesignerTalend Cloud Data Preparationのユーザーが利用できるようになります。
一目で検索できる情報はタイル形式で構造化されています。
  • Talend Trust Score: データセットのTalend Trust Scoreが5つのメトリクス軸で可視化されているので、全体的な信頼性を向上させる方法がわかります。
  • [Data quality] (データクオリティ): データセット全体にある空白値、無効値、有効値の配分が表示される専用の棒グラフでデータのクオリティが一目でわかります。
  • [Data quality rules] (データクオリティルール): このデータセットに適用されているルールのリスト。各コンプライアンスバーで、無効値、非適用値、有効値の配分を確認できます。
  • [Schema] (スキーマ): データセットのストラクチャーを構成するカラムのリスト、および各カラムのセマンティックタイプとクオリティをご覧ください。
  • [Preparations] (プレパレーション): このデータセットをソースとして使用しするプレパレーションのリストと、このデータセットと互換性があり直接適用できるプレパレーションのリストです。
  • [Pipelines] (パイプライン): このデータセットをソースまたはデスティネーションとして使用するパイプラインをリストです。
  • [Rating] (評価): このタイルから、個別の評価を適用または編集したり、データセットのグローバル評価にアクセスしたりできます。
  • [Description] (説明): データセットの作成中にオプションで入力した説明はここで見つかります。また、この説明を編集し、データセットについて共有したい他のコンテキスト情報を含めることもできます。
  • [Custom attributes] (カスタム属性): テナントについて作成されたカスタム属性の定義はすべてこのタイルにグルーピングされています。ここから値をいずれかのカテゴリーに適用したり、既存の値を編集したりして、データセットメタデータを完了させることができます。
  • [Tags] (タグ): 適用が簡単なタグによって、データセットのドキュメント化と検索性が向上します。
  • [API]: このタイルは互換性があるデータセットに対して表示されます。これにより、コンシューマーがデータセット情報を取得したり、そのアクティビティを監視したりできるよう、APIを有効化できます。
  • [Details] (詳細): このタイルによって、データセット作成者、作成日、最終変更日、変更者に関する基本情報がグルーピングされます。
データセットの概要パネル
Talend Trust Scoreの情報、データクオリティ、データクオリティルール、データセットのスキーマを表示する概要パネル。

データセットのサンプル

データセットを作成すると、サンプル表示を使ってコンテンツを視覚化して把握できます。

情報メモNote: この機能は、Talend Cloud Data Inventoryがアカウントで有効になった時にTalend Cloud Pipeline DesignerTalend Cloud Data Preparationのユーザーが利用できるようになります。

Talend Cloud Data Inventoryでは、データセットの10,000レコードのサンプルを表示できます。これにはデータセットレベルとカラムレベルのデータセットクオリティが含まれています。また、データが明確に定義されるようにカラムのセマンティックタイプを変更することもできます。

デフォルトでは[Head sample] (ヘッドサンプル)が選択されており、データセットの最初の10,000レコードが表示されます。データセットサンプルのうち、特に代表的なもので作業する必要がある場合は、[Head sample] (ヘッドサンプル)の横にある矢印をクリックして[Random sample] (ランダムサンプル)を選択すると、ランダムに選択された10,000レコードが表示されます。
航空会社データセットのサンプル
アーティファクトデータセットのサンプル。カーソルをドロップダウンリストに置くと、[ヘッドサンプル]と[ランダムサンプル]のいずれかを選択できます。

データセットのプロパティ

データセットの定義とプロパティはデータセットのプロパティパネルでいつでもチェックできます。

情報メモNote: この機能は、Talend Cloud Data Inventoryがアカウントで有効になった時にTalend Cloud Pipeline DesignerTalend Cloud Data Preparationのユーザーが利用できるようになります。

データセットのプロパティには、以下の場所からアクセスできます。

  • データセットリストから:
    データセットリストに選択済みのデータセットが示され、[このデータセットを編集]オプションが強調表示されている状態。
  • データセット詳細ビューから:
    「アーティファクト」データセットのプロパティ。

このページでは、データセットの作成中に入力されてアップデートを必要としているフィールドを直接チェックしたり、変更したりできます。

フォームで使用できるプロパティはデータセットのタイプによって異なり、たとえば次のようなものが含まれることがあります。

  • データセットの名前
  • テストデータセットの入力
  • レコードとフィールド区切り、囲み文字およびエスケープ文字、CSVファイルのエンコーディング
  • データベースデータセットのテーブルとクエリー
  • Salesforceのモジュール、カラム、条件
  • HDFS URL

[View sample] (サンプルの表示)ボタンをクリックすれば、サンプルを検証して生成する前に新しいサンプルのレコードをいくつかプレビューできます。

このページは役に立ちましたか?

このページまたはコンテンツにタイポ、ステップの省略、技術的エラーなどの問題が見つかった場合はお知らせください。