ドライバーに関するデータセットから固定サイズのサンプルを抽出

始める前に
-
ソースデータを保管するシステムへの接続が作成済みであること。
ここでは、テスト接続を使用します。
-
ソースデータを保管するデータセットが追加済みであること。
sampling-drivers.zipファイルをダウンロードして抽出します。問題ある運転者に関するデータ(速度、アルコール、注意散漫による死亡衝突事故に関わった運転者の割合や自動車保険の情報など)を持つデータセットが含まれています。
-
接続および処理済みデータを保管する関連データセットも作成済みであること。
また、出力フォルダーはFTPサーバーに保存されています。
手順
タスクの結果
パイプラインは実行中となり、指定したレコード数に基づいてデータのサブセットが作成され、指定したFTPフォルダーに出力が送られます。これらのデータのサブセットはデータサイエンティストが予測分析に使用します。