在載入指令碼和圖表運算式中使用規則運算式
透過在資料載入指令碼和圖表運算式中使用規則運算式 (regex) 來增強您的分析和資料準備。規則運算式為尋找和取代基於文字的資料提供了進階、靈活且強大的選項。若要在 Qlik Sense 和 指令碼 介面中使用規則運算式,請使用提供的指令碼和圖表函數。
如何使用規則運算式
規則運算式 (regex) 為進階模式比對提供了廣泛的選項。編寫規則運算式來指定您想要識別的特定文字模式。例如,您可能想要在較大的自然語言內文中尋找電子郵件地址或網址的出現。
可以用多種不同的格式來編寫規則運算式,每種格式都有自己的語法規則。提供的規則運算式函數使用 Perl 規則運算式語法。
若要在 Qlik Sense 和 指令碼 介面中使用規則運算式,請使用提供的指令碼和圖表函數。提供這些函數時,假定您對規則運算式的工作原理有基本的瞭解。如需更多資訊和範例,請參閱 可用函數和範例。
使用案例
您可以將規則運算式用於:
-
從包含多個不同組成部分的文字中擷取和分離資訊。例如,電子郵件地址、電話號碼、網址等。
-
標準化資料格式。
-
搜尋和/或取代文字。
使用提供的 Regex 函數,您可以在載入指令碼中執行以下操作:
-
轉換資料並將其載入以用於分析。
-
驗證資料以確保其遵循格式和其他合規標準。
-
識別、遮罩個人識別資訊 (PII) 或將其更改為適合分析內容取用者的形式。
-
根據資料是否符合特定文字模式,選擇性地將資料載入到應用程式中。
圖表運算式中 Regex 函數的使用案例與載入指令碼的使用案例類似。還可利用圖表運算式:
-
根據使用者需求和互動,有條件或靜態地即時轉換資料。
-
使用這些函數來定義標籤、色彩設定和其他圖表特定屬性。
效能考慮事項
載入指令碼和圖表運算式中提供的規則運算式函數最適合用於需要靈活性的進階字串轉換。使用 Regex 函數比非 Regex 替代選項更耗費資源。對於更簡單的資料轉換,請考慮使用其他可用的指令碼和圖表函數,包括字串函數。有關可用字串函數的清單,請參閱 字串函數。
處理大量資料時,搜尋較大或負 n 值之相符項的 Regex 操作可能會導致效能下降。 在提供的 Regex 函數背景中,n 值對應於函數引數,例如 occurrence、count 和 field_no。