データセットに評価スコアを適用する
movies_gsgデータセットのコンテンツを分析し、その品質を評価できるようになったので、データセットの評価を行う立場にあります。
データセットの品質をどう評価したかを単純な方法で表現するために、Talend Cloud Data Inventoryではパーセンテージで表記された評価スコアが使えます。いくつかのカラムのセマンティックタイプを調整した後に、データセットがほとんど、有効かつ関連性のあるレコードで構成されており、フォーマットや設定上の大きなエラーがないとの結論を下すことができます。空の値と無効な値がわずかに残っているだけです。その結果、データセットに個別の評価スコアとして90%を適用して、クオリティが良好であることを表します。