Talend Trust Scoreの概要
Talend Trust Scoreによって、「自分のデータセットの信頼度は?」といった質問に回答しやすくなります。このグローバルクオリティインジケーターは複数のメトリクスを0~5によるスコアにわかりやすく集約したもので、選択した期間における推移を、ポジティブなら緑のフラグ、ネガティブなら赤のフラグで表します。
データセットのTalend Trust Scoreの増減に影響する諸要因は、主に次の5つの軸に分類できます。
- [Validity] (妥当性): データセットサンプル全体における有効値と無効値の数、セマンティックタイプの使用などと共にデータセット自体のクオリティを考慮します。
- [Completeness] (完全性): サンプル内にある空のレコードの数に依存します。
- [Popularity] (人気度)概要では、ユーザーの評価や認証レベルによってデータセットの信頼度を把握できます。
- [Discoverability] (検索性)概要: 適切なメタデータ(説明、タグ、カスタム属性など)の使用とAPIの存在によって、データセットがどの程度ドキュメント化されているかを反映します。ドキュメント化されたデータセットほど見つけやすくなります。
- [Usage] (使用状況)概要: データセットがパイプラインやプレパレーションのソースとしてどの程度使われているかがわかります。
レーダーチャートの右側には、次の3本の線で構成されるグラフが表示されます。
- 青の線は、選択した期間におけるTalend Trust Scoreの推移です。
- 黄色の線は、選択した期間における選択した軸のスコアの推移です。
- 黄色の点線は、その軸のしきい値です。このしきい値は、軸スコアに要求される最小のクオリティを表します。グラフの上にある
アイコンをクリックすれば、さまざまな軸のしきい値を設定できます。