在加载脚本和图表表达式中使用正则表达式
通过在数据加载脚本和图表表达式中使用正则表达式(regex),增强您的分析和数据准备能力。正则表达式为查找和替换基于文本的数据提供了先进、灵活和强大的选项。要在 Qlik Sense 和 脚本 界面中使用正则表达式,请使用可用的脚本和图表功能。
如何使用正则表达式
正则表达式(regex)为高级模式匹配提供了大量选项。编写一个正则表达式,指定您要识别的特定文本模式。例如,您可能希望在较大量的自然语言中找出电子邮件地址或网络 URL。
正则表达式有多种不同的书写格式,每种格式都有自己的语法规则。可用的正则表达式函数使用 Perl正则表达式语法。
要在 Qlik Sense 和 脚本 界面中使用正则表达式,请使用可用的正则表达式脚本和图表功能。使用这些函数的前提是您对正则表达式的工作原理有基本的了解。有关更多信息,包括示例,请参阅可用功能和示例。
用例
正则表达式可用于:
-
从包含多个不同成分的文本中提取和分离信息。例如,电子邮件地址、电话号码、网页 URL 等。
-
数据格式标准化。
-
搜索和/或替换文本。
利用可用的正则表达式函数,您可以在加载脚本中进行以下操作:
-
转换数据并加载数据以用于分析。
-
验证数据,确保数据符合格式和其他合规标准。
-
识别、屏蔽或更改个人身份信息 (PII),将其转换为适合分析内容的使用者的形式。
-
根据数据是否与特定文本模式匹配,有选择性地将数据加载到应用程序中。
图表表达式中正则表达式函数的用例与加载脚本类似。在图表表达式中使用函数还可以:
-
根据用户需求和互动情况,有条件地或静态地即时转换数据。
-
使用这些功能可以定义标签、颜色设置和其他图表的特定属性。
性能注意事项
加载脚本和图表表达式中提供的正则表达式函数最好用于要求灵活性的高级字符串转换。与非正则表达式的替代方法相比,使用正则表达式函数更耗费资源。对于更简单的数据转换,可考虑使用其他可用的脚本和图表函数,包括字符串函数。有关可用字符串函数的列表,请参见字符串函数 。
在处理大数据量时,搜索匹配大值或负 n 值的正则表达式操作可能会导致性能下降。在可用的正则表达式函数中,n 值对应于函数参数,如 occurrence、count 和 field_no。