导出模型训练数据
您可以在实验的比较和分析选项卡中导出模型分析数据。导出数据会将其导出到专用空间中的 Qlik Cloud 平台,您可以在 Qlik Sense 应用程序中进一步分析它。
导出数据后,您可以通过以下方式将其导入 Qlik Sense 应用程序:
-
使用 数据管理器 和数据目录接口将数据集加载到应用程序中。
-
在应用程序中通过 数据加载编辑器 使用脚本加载数据。
-
创建脚本和数据流以进一步将数据转换并存储到新文件中,这些文件可以加载到 Qlik Sense 应用程序中。
可用格式
模型训练数据可以用下列格式导出:
-
Parquet(默认)
-
CSV
-
QVD
导出整个实验的分析数据
可提供以下内容:
-
模型指标:导出实验中训练的所有模型的性能指标。性能指标是通过将训练好的模型与自动保持数据进行比较来生成的。该数据集还包括通过根据训练数据本身测试训练模型而生成的性能指标。
-
超参数:导出训练模型时使用的超参数的数据。
执行以下操作:
-
打开 ML 实验中的比较选项卡。
-
单击嵌入式分析上方的导出数据到目录。
-
根据需要使用复选框选择或清除选项。
-
根据需要编辑默认数据集路径,包括文件夹和文件名。用 / 字符分隔文件夹。
有关文件夹引用的详细信息,请参阅路径中的文件夹引用提示。
比较选项卡的导出对话框显示了包含文件夹的文件路径。
-
选择数据的输出格式。
-
选择一个存储导出数据的空间。
-
单击按钮导出数据集。
导出单个模型的分析数据
可提供以下内容:
- 预测数据:导出模型在自动保持数据上创建的预测的预测数据。对于分类模型,每个类别的概率都包括在内。
-
SHAP 和测试数据:导出将通过模型在自动保持数据上计算的 SHAP 数据。自动保持数据的实际特性值也包含在数据集中。
-
特性元数据:导出一个数据集,其中包含用于训练模型的每个特性的日期类型和特性类型。
执行以下操作:
-
在 ML 实验的分析选项卡中,选择一个特定的模型,或单击另一个视图中模型旁边的分析。
-
单击嵌入式分析上方的导出数据到目录。
-
根据需要使用复选框选择或清除选项。
-
根据需要编辑默认数据集路径,包括文件夹和文件名。用 / 字符分隔文件夹。
有关文件夹引用的详细信息,请参阅路径中的文件夹引用提示。
分析选项卡的导出对话框显示了包含文件夹的文件路径。
-
选择数据的输出格式。
-
选择一个存储导出数据的空间。
-
单击按钮导出数据集。
路径中的文件夹引用提示
-
如果路径中指定的任何文件夹尚不存在,则会在生成数据集时在空间中自动创建这些文件夹。
-
如果文件夹包含不兼容的语法,则不会创建文件夹。有关更多信息,请参阅有效空间文件夹路径的规则。
-
为每个数据集指定的文件夹结构将嵌套在空间下选择的空间中。例如,在加载脚本中引用数据集时,数据集的完整位置将包括空间。有关更多信息,请参阅空间中的文件夹结构和在应用程序和脚本开发中引用空间文件夹结构。
示例:
-
具有以下名称和位置的模型指标数据集:Model Performance/MyExperiment。这可以将数据集 MyExperiment 存储到空间内的文件夹 ModelPerformance 中。
-
具有以下名称和位置的特性元数据数据集:Model Performance/Candidate Models/v01_LOGC_00_00。这可以将数据集 v01_LOGC_00_00 存储到空间内的文件夹结构 Model Performance/Candidate Models 中。
查看世系和影响分析
使用 Qlik Cloud 中的世系和影响分析工具,您可以分析:
-
哪些数据集是从 ML 实验中导出的。
-
这些数据集被用于其他分析内容。