SparkでHDFS接続からデータを読み取る
事前定義済みHDFSメタデータを使えば、SparkのHDFSファイルシステムからデータを読み取ることができます。
始める前に
- このチュートリアルではHadoopクラスターを活用します。Hadoopクラスターが利用可能であることが必要です。
- また、HDFSメタデータが設定されていることも必要です(Hadoop クラスターメタデータ定義の作成とHadoop クラスターメタデータ定義のインポートをご覧ください)。
- SparkでHDFS接続を設定していること(Sparkで実行するHDFS接続を設定をご覧ください)。