跳到主要内容 跳到补充内容

手动安装 Talend Data Preparation

此过程包含在计算机上手动安装 Talend Data Preparation 的步骤。

开始之前

  • Talend Administration Center 已安装并运行。
  • Talend Identity and Access Management 已安装并运行。
  • 一个 Talend Data Preparation 用户已在 Talend Administration Center 中存在。有关更多信息,请参阅《Talend Administration Center 用户指南》。
  • 您的计算机上没有安装其他 MongoDB 实例。
  • 要将 Talend Data Preparation 与 Big Data 一起使用,请使用某个受支持的 Hadoop 发行版。有关更多信息,请参阅带大数据的支持 Talend Data Preparation 的 Hadoop 发行版
  • 在安装 Talend Data Preparation 之前,确保您满足硬件和软件要求。有关更多信息,请参阅本地部署的安装前提条件

步骤

  1. https://www.mongodb.com/download-center (仅提供英文版本) 下载 MongoDB 实例并安装它。
    有关受支持的 MongoDB 数据库的更多信息,请参阅兼容的数据库
    有关如何安装它的更多信息,请参阅 MongoDB 文档 (仅提供英文版本)
    如果您想要使用 SSL 保护与 MongoDB 的连接,必须在您的计算机上手动安装 MongoDB Enterprise Server。有关更多信息,请参阅 https://docs.mongodb.com/v4.0/security/ (仅提供英文版本)
  2. Talend-DataPreparation-Server-VA.B.C.zip 文件解压到想要安装 Talend Data Preparation 的位置。
  3. <Data_Preparation_Path>/services/components-api-service-rest-all-components-VA.B.C.zip 文件解压到想要安装 Components Catalog 的位置。
  4. 要在 Big Data 环境中使用 Talend Data Preparation,您需要安装两个附加工具,Streams RunnerSpark Job Server
    请注意,Streams RunnerSpark Job Server 必须安装在 Linux 计算机上。
    1. <Data_Preparation_Path>/services/data-streams-streamsrunner-svc-A.B.C.tgz 文件解压到想要安装 Streams Runner 的位置。
    2. <Data_Preparation_Path>/services/spark-jobserver-A.B.C.tar.gz 文件解压到想要安装 Spark Job Server 的位置。此文件包含 Spark Job Server 以及所有必需的依赖关系。
      此外,您必须已经安装 curl,这是一个通过 URL 来传输数据的命令行工具和库。如果需要,您可以从 https://curl.haxx.se/ (仅提供英文版本) 下载它。
  5. mongo 添加到 PATH 环境变量。
  6. 使用以下命令在 MongoDB 中创建 dataprep 数据库:use dataprep
  7. 在 MongoDB 中为 dataprep 数据库创建以下用户:
    • 用户名:dataprep-user
    • 密码:duser
    为此,您可以使用以下命令:
    db.createUser( { user: "dataprep-user", pwd: "duser", roles: [{ role: "readWrite", db: "dataprep"}]})
    可以通过执行 <Data_Preparation_Path>/create_mongo_user.sh 文件来自动创建用户名和密码。

本页面有帮助吗?

如果您发现此页面或其内容有任何问题 – 打字错误、遗漏步骤或技术错误 – 请告诉我们!