将现有的 Spark Batch 作业转换为 Spark Streaming 作业。
步骤
-
在 Repository (存储库) 树视图中,展开 Job Designs (作业设计) 节点、Big Data Batch (大数据批处理) 节点,然后展开 getting_started 文件夹和 spark 文件夹。
-
右键单击 aggregate_movie_director_spark 作业,然后从上下文菜单中选择 Duplicate (复制)。
复制 (Duplicate) 窗口即会打开。
-
在 Input new name (输入新名称) 字段中,将此副本命名为 aggregate_movie_director_spark_streaming。
-
从 Job Type (作业类型) 下拉列表中,选中 Big Data Streaming (大数据流式处理)。
-
从 Framework (框架) 列表中,选中 Spark Streaming 并单击 OK (确定) 确认更改。
aggregate_movie_director_spark_streaming 作业将显示在 Repository (存储库) 的 Big Data Streaming (大数据流式处理) 节点下方。
-
右键单击该节点并从上下文菜单中选择 Create folder (创建文件夹)。
-
在 New Folder (新建文件夹) 向导中,将新文件夹命名为 streaming_movies 并单击 Finish (完成) 创建文件夹。
-
将 aggregate_movie_director_spark_streaming 作业拖放到此 streaming_movies 文件夹。
结果
这个新的 Spark Streaming 作业现在即可进行进一步编辑。