メイン コンテンツをスキップする
補完的コンテンツへスキップ
Qlik.com
Community
Learning
日本語 (変更)
Deutsch
English
Français
日本語
中文(中国)
閉じる
ドキュメント
Qlik Talend ドキュメンテーション
リリース ノート
インストールとアップグレード
データ統合
管理と実行
データ品質とガバナンス
アプリケーションと API 統合
追加のリソース
API ドキュメンテーション ポータル
セキュリティ ポータル
Talend アーカイブ
Qlik ヘルプ
Getting Started
Getting started with Talend cloud
Talend Cloud
Talend Cloud API Designer
Talend Cloud Data Inventory
Talend Cloud Data Preparation
Talend Cloud Data Stewardship
Talend Cloud Pipeline Designer
Talend Cloud API Services Platform
Getting started with Talend on premises
Talend Data Fabric
Talend Data Preparation
Talend Data Stewardship
Qlik ヘルプに移動
日本語 (変更)
Deutsch
English
Français
日本語
中文(中国)
検索
ヘルプを検索
メニュー
閉じる
ヘルプを検索
こちらにフィードバックをお寄せください
Talend Components
Natural Language Processing
Natural Language Processingのシナリオ
モデルの学習に使用するテキストサンプルのプレパレーション
入力コンポーネントを設定
このページ上
手順
tFileInputXML
コンポーネントは、処理するテキストをロードするために使用します。
手順
tFileInputXML
コンポーネントをダブルクリックして
[Basic settings] (基本設定)
ビューを開き、そのプロパティを定義します。
[Edit schema] (スキーマを編集)
の横にある
[...]
ボタンをクリックして、入力データの保存に必要なカラムを追加します。
[File name] (ファイル名)
フィールドで、処理するファイルのパスを指定します。
[Element to extract] (抽出するエレメント)
に
"row"
と入力します。
[Loop XPath query] (ループXPathクエリー)
フィールドに、二重引用符で囲んだXPathクエリー式を入力して、ループの基になるノードを指定します。
Mapping
テーブルの
[XPath query] (XPathクエリー)
カラムで、クエリーするフィールドを二重引用符で囲んで指定します。
データ処理中に問題が発生した場合は、コンポーネントの
[Advanced settings]
(詳細設定)ビューで
[Custom encoding] (カスタムエンコーディング)
チェックボックスをオンにします。
[Encoding] (エンコーディング)
リストで、使用するエンコーディングを選択します(この例では
UTF-8
)。
このページは役に立ちましたか?
このページまたはコンテンツにタイポ、ステップの省略、技術的エラーなどの問題が見つかった場合はお知らせください。
こちらにフィードバックをお寄せください
前のトピック
Sparkが使用するファイルシステムに接続を設定
次のトピック
トークン化されたテキストをCoNLL形式に変換する