Trabalhando com expressões regulares em scripts de carregamento e expressões de gráfico
Aumente sua análise e preparação de dados usando expressões regulares (regex) em scripts de carregamento de dados e em expressões de gráfico. Expressões regulares oferecem opções avançadas, flexíveis e poderosas para localizar e substituir dados baseados em texto. Para trabalhar com expressões regulares no Qlik Sense e na interface do Script, use as funções de script e de gráfico disponíveis.
Como trabalhar com expressões regulares
Expressões regulares (regex) oferecem opções abrangentes para correspondência avançada de padrões. Escreva uma expressão regular para especificar um padrão de texto específico que você deseja identificar. Por exemplo, você pode querer encontrar ocorrências de endereços de e-mail ou URLs da Web em corpos maiores de linguagem natural.
Há muitos formatos diferentes nos quais as expressões regulares podem ser escritas, cada um com suas próprias regras de sintaxe. As funções de expressão regular disponíveis usam a sintaxe de expressão regular Perl.
Para trabalhar com expressões regulares no Qlik Sense e na interface de Script, use o script regex e as funções de gráfico disponíveis. O uso dessas funções pressupõe que você tenha um conhecimento básico de como as expressões regulares funcionam. Para obter mais informações, incluindo exemplos, consulte Funções e exemplos disponíveis.
Casos de uso
Você pode usar expressões regulares para:
-
Extrair e separar informações de texto contendo múltiplos componentes distintos. Por exemplo, endereços de e-mail, números de telefone, URLs da Web e muito mais.
-
Padronizando a formatação dos dados.
-
Pesquisando e/ou substituindo texto.
Com as funções regex disponíveis, você pode fazer o seguinte em scripts de carregamento:
-
Transformar dados e carregá-los para uso em análises.
-
Valide os dados para garantir que eles sigam a formatação e outros padrões de conformidade.
-
Identifique, mascare ou altere informações de identificação pessoal (PII) em um formato apropriado para os consumidores do seu conteúdo analítico.
-
Carregue seletivamente os dados nos aplicativos de acordo com a correspondência ou não com padrões de texto específicos.
Os casos de uso de funções regex em expressões de gráfico são semelhantes aos de scripts de carregamento. O uso das funções em expressões de gráfico também permite:
-
Transforme dados durante o processo, condicionalmente ou estaticamente, dependendo das necessidades e interações do usuário.
-
Use as funções para definir rótulos, configurações de cores e outras propriedades específicas do gráfico.
Considerações de desempenho:
As funções de expressão regular disponíveis em scripts de carga e expressões de gráfico são mais bem utilizadas para transformações de strings avançadas, onde a flexibilidade é um requisito. O uso de funções regex consome mais recursos do que alternativas sem regex. Para transformações de dados mais simples, considere usar outras funções de script e gráfico disponíveis, incluindo funções de string. Para obter uma lista das funções de string disponíveis, consulte Funções de string.
Ao trabalhar com grandes volumes de dados, as operações de regex para pesquisar correspondências de valores n grandes ou negativos podem causar queda no desempenho. No contexto das funções regex disponíveis, o valor n corresponde a argumentos de funções como occurrence, count e field_no.