tMahoutClustering (非推奨)
ラベル付けされていない数値データをグルーピングしてクラスターにすると、興味深いパターンが明らかになったり、データセット内の異常なデータアイテムを識別したりできます。
tMahoutClusteringは、いくつかの類似点に基づいてデータをグルーピングしてクラスターにします。このコンポーネントは、さまざまなクラスタリングアルゴリズムで使えるいくつかの類似性メソッドを提供します。
tMahoutClusteringは、Mahoutライブラリーのクラスタリングアルゴリズムを使います。すべてのプロセスは、特定の分散ファイルシステムで実行されます。
情報メモ注:
現在、StudioはMahout 0.9をサポートしています。
Talendでサポートされているテクノロジーの詳細は、Talendコンポーネントを参照してください。