Работа с регулярными выражениями в скриптах загрузки и выражениях диаграммы
Расширьте возможности аналитики и подготовки данных, используя регулярные выражения (regex) в скриптах загрузки данных и в выражениях диаграмм. Регулярные выражения предоставляют расширенные, гибкие и мощные возможности для поиска и замены текстовых данных. Чтобы работать с регулярными выражениями в Qlik Sense и интерфейсе Скрипт, используйте доступные функции скриптов и диаграмм.
Как работать с регулярными выражениями
Регулярные выражения (regex) предоставляют широкий выбор возможностей для усовершенствованного сопоставления с шаблонами. Напишите регулярное выражение, чтобы задать определенный текстовый шаблон, который требуется распознавать. Например, может потребоваться найти вхождения адресов электронной почты или URL веб-страниц в больших массивах текста на естественном языке.
Существует множество различных форматов, в которых могут быть записаны регулярные выражения, и каждый из них имеет свои собственные правила синтаксиса. Доступные функции регулярных выражений используют синтаксис регулярных выражений Perl.
Чтобы работать с регулярными выражениями в Qlik Sense и интерфейсе Скрипт, используйте доступные функции скриптов и диаграмм для регулярных выражений. Использование этих функций предполагает наличие у пользователя базового представления о том, как работают регулярные выражения. Для получения дополнительной информации и примеров см. раздел Доступные функции и примеры.
Сценарии применения
Регулярные выражения можно использовать для выполнения следующих задач:
-
Извлечение и разделение информации из текста, содержащего множество отдельных компонентов. Например, адреса электронной почты, номера телефонов, URL-адреса веб-сайтов и многое другое.
-
Стандартизация форматирования данных.
-
Поиск и (или) замена текста.
С помощью доступных функций регулярных выражений можно выполнять следующие действия в скриптах загрузки:
-
Преобразование данных и их загрузка для использования в аналитике.
-
Проверка данных на соблюдение правил форматирования и других стандартов.
-
Идентификация, маскирование или изменение персональной идентифицирующей информации (PII) в форме, которая подходит для потребителей аналитического содержимого.
-
Выборочная загрузка данных в приложения в зависимости от того, соответствуют они определенным текстовым шаблонам или нет.
Случаи использования функций regex в выражениях диаграмм аналогичны их использованию для скриптов загрузки. Использование функций в выражениях диаграммы также позволяет выполнять следующие задачи:
-
Динамическое преобразование данных, условно или статически, в зависимости от потребностей пользователя и взаимодействия с ним.
-
Используйте эти функции для определения меток, настроек цвета и других специфических свойств диаграммы.
Вопросы производительности
Функции регулярных выражений, доступные в скриптах загрузки и выражениях диаграммы, лучше всего использовать для расширенных преобразований строк, где обязательным условием является гибкость. Использование функций регулярных выражений требует больше ресурсов, чем альтернативные варианты без регулярных выражений. Для более простых преобразований данных используйте другие доступные функции скриптов и диаграмм, включая строковые функции. Для ознакомления со списком доступных строковых функций см. раздел Строковые функции.
При работе с большими объемами данных операции с регулярными выражениями для поиска совпадений с большими или отрицательными значениями n могут привести к снижению производительности. В контексте доступных функций регулярных выражений значение n соответствует таким аргументам функции, как occurrence, count и field_no.