メイン コンテンツをスキップする
補完的コンテンツへスキップ
Qlik.com
Community
Learning
日本語 (変更)
Deutsch
English
Français
日本語
中文(中国)
閉じる
ドキュメント
Qlik Talend ドキュメンテーション
リリース ノート
インストールとアップグレード
データ統合
管理と実行
データ品質とガバナンス
アプリケーションと API 統合
追加のリソース
API ドキュメンテーション ポータル
セキュリティ ポータル
Talend アーカイブ
Qlik ヘルプ
Getting Started
Getting started with Talend cloud
Talend Cloud
Talend Cloud API Designer
Talend Cloud Data Inventory
Talend Cloud Data Preparation
Talend Cloud Data Stewardship
Talend Cloud Pipeline Designer
Talend Cloud API Services Platform
Getting started with Talend on premises
Talend Data Fabric
Talend Data Preparation
Talend Data Stewardship
Qlik ヘルプに移動
日本語 (変更)
Deutsch
English
Français
日本語
中文(中国)
検索
ヘルプを検索
メニュー
閉じる
ヘルプを検索
こちらにフィードバックをお寄せください
Talend Components
Machine Learning
Machine Learningのシナリオ
都市内の事故が発生しやすい地域をモデリングする
サンプルデータを読み取ってキャッシュ
このページ上
手順
手順
最初の
tFileInputInput
コンポーネントをダブルクリックし、
[Component] (コンポーネント)
ビューを開きます。
[Edit schema] (スキーマを編集)
の横にある
[...]
ボタンをクリックし、ポップアップスキーマダイアログボックスで、倍数型の2つのカラム
latitude
と
longitude
を追加してスキーマを定義します。
[OK]
をクリックしてこれらの変更を確認し、ポップアップ表示されるダイアログボックスで求められるプロパゲーションを承認します。
[Define a storage configuration component] (ストレージ設定コンポーネントを定義)
チェックボックスをオンにし、使う
tHDFSConfiguration
コンポーネントを選択します。
tFileInputDelimited
はこの設定を使い、トレーニングセットとして使われるサンプルデータにアクセスします。
[Folder/File] (フォルダー/ファイル)
フィールドで、トレーニングセットが保管されているディレクトリーを入力します。
tReplicate
コンポーネントをダブルクリックし、
[Component] (コンポーネント)
ビューを開きます。
[Cache replicated RDD] (複製されたRDDをキャッシュする)
チェックボックスをオンにし、
[Storage level] (ストレージレベル)
ドロップダウンリストから
[Memory only] (メモリのみ)
を選択します。このようにして、このサンプルデータは複製され、テストセットとして使うためにメモリに保存されます。
このページは役に立ちましたか?
このページまたはコンテンツにタイポ、ステップの省略、技術的エラーなどの問題が見つかった場合はお知らせください。
こちらにフィードバックをお寄せください
前のトピック
Sparkが使用するファイルシステムに接続を設定
次のトピック
K-Meansの機能を準備する