转换作业

将现有的 Spark Batch 作业转换为 Spark Streaming 作业。

开始之前

您已启动 Talend Studio 并打开集成透视图。
您已创建了使用 Apache Spark Batch 作业连接影片和导演信息中所述的 aggregate_movie_director_spark Spark Batch 作业并成功运行。

在 Repository (存储库) 树视图中，展开 Job Designs (作业设计) 节点、Big Data Batch (大数据批处理) 节点，然后展开 getting_started 文件夹和 spark 文件夹。
右键单击 aggregate_movie_director_spark 作业，然后从上下文菜单中选择 Duplicate (复制)。

复制 (Duplicate) 窗口即会打开。
在 Input new name (输入新名称) 字段中，将此副本命名为 aggregate_movie_director_spark_streaming。
从 Job Type (作业类型) 下拉列表中，选中 Big Data Streaming (大数据流式处理)。
从 Framework (框架) 列表中，选中 Spark Streaming 并单击 OK (确定) 确认更改。

aggregate_movie_director_spark_streaming 作业将显示在 Repository (存储库) 的 Big Data Streaming (大数据流式处理) 节点下方。
右键单击该节点并从上下文菜单中选择 Create folder (创建文件夹)。
在 New Folder (新建文件夹) 向导中，将新文件夹命名为 streaming_movies 并单击 Finish (完成) 创建文件夹。
将 aggregate_movie_director_spark_streaming 作业拖放到此 streaming_movies 文件夹。

这个新的 Spark Streaming 作业现在即可进行进一步编辑。

如果您发现此页面或其内容有任何问题 – 打字错误、遗漏步骤或技术错误 – 请告诉我们！