Apache Spark BatchのtJapaneseTransliterateプロパティ
これらのプロパティは、Spark Batchジョブのフレームワークで実行されているtJapaneseTransliterateを設定するために使われます。
Spark BatchのtJapaneseTransliterateコンポーネントは、データクオリティファミリーに属しています。
このフレームワーク内のコンポーネントは、Talend Data Management PlatformTalend Big Data Platform、Talend Real-Time Big Data PlatformTalend Data Services Platform、Talend Data Fabricで利用できます。
基本設定
| プロパティ | 説明 |
|---|---|
|
[Schema] (スキーマ)と[Edit Schema] (スキーマを編集) |
|
|
[Transliteration] (翻字) |
出力スキーマからのカラムは、[Transliteration] (翻字)テーブルの[Column] (カラム)カラムに追加されます。 別のシステムに翻字する日本語テキストを含む各スキーマカラムについて、[Transliterate] (翻字)カラムで対応するチェックボックスをオンにします。 すべてのスキーマカラムを選択するには、ヘッダー行内のチェックボックスをオンにします。 [Transliterate] (翻字)チェックボックスをオンにしたら、[Way to transliterate] (翻字の方法)リストから翻字システムを選択します。
|
詳細設定
| プロパティ | 説明 |
|---|---|
|
[tStatCatcher Statistics] (tStatCatcher統計) |
このチェックボックスを選択すると、ジョブレベルおよび各コンポーネントレベルでジョブ処理メタデータが収集されます。 |
使用方法
| 使用方法のガイダンス | 説明 |
|---|---|
|
使用ルール |
このコンポーネントは、通常、中間コンポーネントとして使用されます。入力コンポーネントと出力コンポーネントが必要です。 |
|
[Spark Connection] (Spark接続) |
[Run] (実行)ビューの[Spark configuration] (Spark設定)タブで、ジョブ全体でのSparkクラスターへの接続を定義します。また、ジョブでは、依存jarファイルを実行することを想定しているため、Sparkがこれらのjarファイルにアクセスできるように、これらのファイルの転送先にするファイルシステム内のディレクトリーを指定する必要があります。
この接続は、ジョブごとに有効になります。 |