Работа с регулярными выражениями в скриптах загрузки и выражениях диаграммы
Расширьте возможности аналитики и подготовки данных, используя регулярные выражения (regex) в скриптах загрузки данных и в выражениях диаграммы. Регулярные выражения предлагают расширенные, гибкие и мощные возможности для поиска и замены текстовых данных. Для работы с регулярными выражениями в Qlik Sense и интерфейсе Скрипт используйте доступные функции скрипта и диаграммы.
Как работать с регулярными выражениями
Регулярные выражения (regex) предлагают широкие возможности для расширенного сопоставления с шаблоном. Напишите регулярное выражение, чтобы указать конкретный текстовый шаблон, который вы хотите идентифицировать. Например, вам может понадобиться найти вхождения адресов электронной почты или веб-адресов (URL) в больших объемах текста на естественном языке.
Существует множество различных форматов написания регулярных выражений, каждый из которых имеет свои синтаксические правила. Доступные функции регулярных выражений используют синтаксис регулярных выражений Perl.
Для работы с регулярными выражениями в Qlik Sense и интерфейсе Скрипт используйте доступные функции скрипта и диаграммы для регулярных выражений. Использование этих функций предполагает наличие базового понимания того, как работают регулярные выражения. Для получения дополнительной информации, включая примеры, см. Доступные функции и примеры.
Варианты использования
Вы можете использовать регулярные выражения для:
-
Извлечения и разделения информации из текста, содержащего несколько различных компонентов. Например, адресов электронной почты, номеров телефонов, веб-адресов (URL) и многого другого.
-
Стандартизации форматирования данных.
-
Поиска и/или замены текста.
С помощью доступных функций регулярных выражений в скриптах загрузки можно выполнять следующие действия:
-
Преобразовывать данные и загружать их для использования в аналитике.
-
Проверять данные, чтобы убедиться, что они соответствуют стандартам форматирования и другим требованиям.
-
Идентифицировать, маскировать или изменять персональные данные (PII) в форму, подходящую для потребителей вашего аналитического контента.
-
Выборочно загружать данные в приложения в зависимости от того, соответствуют ли они определенным текстовым шаблонам.
Варианты использования функций регулярных выражений в выражениях диаграммы аналогичны вариантам для скриптов загрузки. Использование функций в выражениях диаграммы также позволяет:
-
Преобразовывать данные на лету, условно или статически, в зависимости от потребностей пользователя и его взаимодействий.
-
Использовать функции для определения меток, настроек цвета и других свойств, специфичных для диаграммы.
Рекомендации по производительности
Функции регулярных выражений, доступные в скриптах загрузки и выражениях диаграммы, лучше всего использовать для сложных преобразований строк, где требуется гибкость. Использование функций регулярных выражений требует больше ресурсов, чем альтернативные варианты без их использования. Для более простых преобразований данных рассмотрите возможность использования других доступных функций скрипта и диаграммы, включая строковые функции. Список доступных строковых функций см. в разделе Строковые функции.
При работе с большими объемами данных операции регулярных выражений для поиска совпадений больших или отрицательных значений n могут привести к снижению производительности. В контексте доступных функций регулярных выражений значение n соответствует таким аргументам функции, как occurrence, count и field_no.