tStem
このデータを照合する前に、カラムのデータを標準化できるようにします。
tStemでは、言語の正規化、つまり単語の変種を一般的な形式に集約するプロセスを通じて、カラムのデータを標準化します。
デフォルトで、このコンポーネントはTalend Studioと共には出荷されていません。機能マネージャーを使ってインストールする必要があります。 詳細は、機能マネージャーを使って機能をインストールをご覧ください。
tStemの標準プロパティ
これらのプロパティは、標準ジョブのフレームワークで実行されているtStemを設定するために使われます。
標準のtStemコンポーネントは、データクオリティファミリーに属しています。
このコンポーネントは、Talend Data Management Platform、Talend Big Data Platform、Talend Real-Time Big Data Platform、Talend Data Services Platform、Talend Data Fabricで利用できます。
基本設定
| プロパティ | 説明 |
|---|---|
|
[Schema] (スキーマ)と[Edit schema] (スキーマを編集) |
|
|
[Select Algorithm] (アルゴリズムの選択) |
[string] (文字列)タイプの分析済みカラムごとにステミングアルゴリズムを設定するために使われます。 [Column] (カラム): 分析済みカラムのリスト。 [Algorithm] (アルゴリズム): カラムデータの照合に使用するアルゴリズム言語をリストから選択します。 |
詳細設定
| プロパティ | 説明 |
|---|---|
|
[tStatCatcher Statistics] (tStatCatcher統計) |
このチェックボックスを選択すると、コンポーネントレベルでログデータを収集できます。 |
グローバル変数
| 変数 | 説明 |
|---|---|
|
グローバル変数 |
ERROR_MESSAGE: エラーが発生した時にコンポーネントによって生成されるエラーメッセージ。これはAfter変数で、文字列を返します。この変数はコンポーネントにこのチェックボックスが存在し、[Die on error] (エラー発生時に強制終了)がオフになっている場合のみ機能します。 Flow変数はのコンポーネントの実行中に機能し、After変数はコンポーネントの実行後に機能します。 フィールドまたは式に変数を入力する場合は、Ctrl + スペースを押して変数リストにアクセスし、使用する変数を選択します。 変数の詳細は、コンテキストと変数を使用をご覧ください。 |
使用方法
| 使用方法のガイダンス | 説明 |
|---|---|
|
使用ルール |
このコンポーネントは、中間ステップです。入力フロート出力フローが必要になります。 |