跳到主要内容 跳到补充内容

配置数据质量数据集市

关于此任务

  • 使用 Talend Installer 是连接到 Talend Data Quality 数据集市的建议方法,但是您可以根据需要执行手动配置。
    信息注释Deprecated:Talend Studio 8.0 R2024-05 以后,不再支持使用 Talend Installer 来安装 Talend Data Quality 数据集市。

    您仍然可在 Talend Studio 中配置数据集市。有关更多信息,请参阅管理报告数据库部分。

  • 通过此程序,您可以定义一个数据集市作为所有报告的默认数据集市。您可以更改特定报告的数据集市,而不影响此通用设置。更多信息,请参阅 Setting up a database for an individual report

步骤

  1. 打开 Talend Studio
  2. 在菜单栏上,单击 Window > Preferences (首选项)
  3. Preferences (首选项) 窗口中,执行下面的操作之一:
    • 开始键入 reporting,并选择 Reporting (报告)
    • 展开Talend > 剖析 ,并选择报告
      首选项列表中报告的位置。
  4. 如果 Reporting (报告) 窗口中的字段已填充,则单击 Apply (应用)Talend Data Quality 数据集市可能已安装并已配置。
  5. 如果数据集市不存在,则执行下面的步骤。
  6. DB Type (数据库类型) 列表中,选择您要用于存储当前报告结果的数据库。
    默认情况下,Talend Studio 将报告和分析结果存储在嵌入式 HSQL 数据库中。当报告和分析结果存储在 HSQL 数据库中时,您无法进行分享。
  7. 在单个连接字段中或在 Url 字段中定义连接参数。修改 Url 字段中的任何参数时,自动修改单个字段中的参数,反之亦然。
    数据库 详细信息
    MySQL DB Name (数据库名称) 字段中,您可以:
    • 输入新数据库名称 (目录)。随后将会创建目录,并将生成存储分析和报告必需的表。
    • 使用默认数据库名称 (talend_dq)。在此数据库中,您有权访问生成的报告的所有分析和结果。
    • 输入数据库中已存在的数据库名称。

      如果此数据库中没有数据集市结构,则将创建。

      如果数据集市结构已存在,但比当前的版本低,则将更新数据集市结构。

      如果数据集市结构已存在,但比当前的版本高,则您不能使用此数据集市结构。
      信息注释切记: 允许 MySQL 数据库名称中包含点 (".")。
      您可以连接到 Azure Database for MySQL。
    使用 SID 的 Oracle

    使用服务名称的 Oracle

    Oracle OCI

    • 使用现有数据库的名称填充 SIDService Name (服务名称) 字段。
    • 使用 User (用户) 字段中的指定用户有权访问的 Oracle schema 填充 Schema 字段,或者将其留空。如果将此字段留空,您的报告将被写入到定义用户的默认 schema。
    信息注释重要: schema 的排序规则必须区分大小写。否则,可能不会分析列,并且报告中将会缺少这些列。有关更多信息,请参阅 Oracle 文档
    PostgreSQL
    • 填写数据库的连接信息。
      信息注释切记: 允许数据库名称中包含点 (".") 或连字符 ("-")。
    • 您可以连接到 Azure Database for PostgreSQL 或 Azure SQL 数据库。连接到 Azure Database for PostgreSQL 数据库时,在 User (用户) 字段中使用 username@hostname 语法,而将 Additional parameters (附加参数) 字段留空。
    • 在 PostgreSQL 上创建数据集市时,只能使用它的默认 schema。
    Microsoft SQL Server
    • 填写数据库的连接信息。
      信息注释切记: 允许数据库名称中包含点 (".") 或连字符 ("-")。

      为了启用将报告写入所定义数据库的功能,请确保指定的用户拥有足够的系统权限。

    • 在 Microsoft SQL Server 上创建数据集市时,只能使用它的默认 schema。
    • 如果您要使用 Windows 身份验证进行连接,请将 User (用户)Password (密码) 字段留空。

      创建与 Microsoft SQL Server 数据库的连接以存储报告和分析结果时,MicrosoftOpen source JTDS (开源 JTDS) 驱动程序均可受支持。

    • Microsoft SQL Server 数据库所用的排序规则必须区分大小写,否则可能无法成功地生成报告。您可能会遇到下面的错误:java.sql.SQLException: Invalid column name 'rep_runtime'。如需有关排序规则的更多信息,请参阅 Microsoft 文档 (仅提供英文版本)
    • 如需有关设置与 Microsoft SQL Server 数据库的连接的更多信息,请参阅关于某些数据库,您需要了解的内容
  8. 如果您未从 DB Type (数据库类型) 列表中选择 HSQL,则在 Additional parameters (附加参数) 字段中指定附加连接属性。
    连接到 MySQL 8 数据库时,配置 useSSLrequireSSLserverTimezone 属性。例如,输入 useSSL=false&requireSSL=false&serverTimezone=UTC
    连接到 Azure SQL 数据库时,输入 ssl=require
  9. 在相应的字段中输入数据库的登录信息。
  10. 可选: 要将数据集市连接和报告文件夹路径以及图标导出为上下文,请单击 Export as context (导出为上下文) 并执行下面的步骤。
    有关更多信息,请参阅使用上下文变量连接到报告数据库
    您可以单击 Revert Context (恢复上下文) 以将连接切换回其初始状态。
  11. 单击应用
  12. 如果提示要求您下载并安装某些缺失的模块,请单击 Download and install all modules available (下载并安装所有可用的模块)。此操作可能需要几分钟。
    安装模块之后,Confirm (确认) 弹出窗口会通知您数据集市不存在。
  13. 单击 OK (确定) 以确认更改并关闭 Preferences (首选项) 窗口。

结果

配置数据集市后就可以使用了。

本页面有帮助吗?

如果您发现此页面或其内容有任何问题 – 打字错误、遗漏步骤或技术错误 – 请告诉我们!