使用關鍵驅動因素分析發現資料背後的關鍵影響因素
透過關鍵驅動因素分析,您可以識別並比較資料中特定趨勢的來源。關鍵驅動因素分析可協助您視覺化並排名一組已定義因素對特定目標欄位之目前資料的影響力。使用您發現的深入資訊,以改善並提升組織的分析和決策流程。
關鍵驅動因素分析可用於 Qlik Sense 應用程式。在分析模式下於工作表檢視中執行關鍵驅動因素分析。
關鍵驅動因素分析無法用於 Qlik Sense Business、Qlik Cloud 分析標準版 或 Qlik Anonymous Access。
什麼是關鍵驅動因素分析?
關鍵驅動因素分析是統計資料探索形式,可讓您識別各種因素對單一目標指標結果的影響程度。會為量化和質化資料執行分析。關鍵驅動因素分析背後的意圖是找出造成資料中特定趨勢的確切內容,並使用這些深入資訊採取直接動作或改善組織意識。
在商業智慧中,您想要評估影響因素的常見目標是欄位,例如銷售、客戶滿意度、利潤、已流失和銷售成本。因素 (關鍵驅動因素) 的範例包括產品、位置、商店數量和經理。
在關鍵驅動因素分析中評估的指標因每個組織和使用案例而有不同。目標指標和影響結果的各種因素取決於您尋求解決的問題、可用資料和其他因素。
為什麼使用關鍵驅動因素分析?
關鍵驅動因素分析在商業智慧方面很實用,因為這可透過許多方式套用,以改善關鍵績效指標。您可以使用關鍵驅動因素分析解決問題,並取得關於產品投資的深入資訊、收入擴展、成本降低、客戶滿意度和許多其他內容。
在 Qlik Sense 中,關鍵驅動因素分析已整合到應用程式取用者體驗。使用 Qlik Sense 原生的即時資料分析功能,您可以在每次應用程式資料變更時執行新的關鍵驅動因素分析。這可讓您針對變更持續監控資料,並快速發現新興趨勢,以便在需要時採取迅速且有效的動作。
運作方式
關鍵驅動因素分析是圍繞著對於影響力的想法而來。在 Qlik Sense 中,關鍵驅動因素分析會評估特定欄位 (特徵或關鍵驅動因素) 對感興趣之特定欄位 (目標) 的影響力。
用於分析的資料
關鍵驅動因素分析是對於資料子集的具體檢驗。建立分析時,您會選取特定欄位作為分析元件。
您需要為每項分析選擇下列建置區塊:
-
目標
-
多個特徵
選取這些元件後,會使用目標和特徵從資料模型建立特定資料集。關鍵驅動因素分析使用此資料集,而非整個資料模型,來判定特徵對目標的影響力。不會分析您沒有在設定中納入的欄位。
更多關於每個元件的資訊在下文提供。
計算影響力
在 Qlik Sense 中,會計算分析之資料子集中每個特徵資料值的 SHAP 值,以執行關鍵驅動因素分析。這些 SHAP 值從 Qlik AutoML 訓練的模型產生。模型使用隨機森林演算法產生 SHAP 值。
SHAP 值針對從關鍵驅動因素分析設定特別建立的資料集中的其他特徵,計算了資料值對於相應目標值的影響程度。檢視關鍵驅動因素分析的結果時,您會在資料集的所有或部分記錄檢視 SHAP 值彙總。
如需更多關於 Qlik AutoML 中 SHAP 重要性的資訊,請參閱 理解實驗訓練中的 SHAP 重要性。
目標
目標是您想要對此分析關鍵驅動因素的欄位。例如,您可能會想要比較特定因素如何影響銷售額。在此情況下,您會選取銷售量值作為目標。
選取目標時,資料可用性時間很重要,尤其是與您選擇在分析中納入的特徵有關時。如需更多關於目標和特徵之適當資料集合時間範圍的資訊,請參閱 特徵。
目標中的唯一值數量和資料類型會決定分析將解決的問題類型。這會反過來影響資料必須符合的要求。如需詳細資訊,請參閱資料要求。
關鍵驅動因素分析支援下列問題類型:
-
迴歸
-
二元分類
迴歸分析
若目標包含大量唯一數值,會使用迴歸分析。若您使用數值計算 (量值) 作為目標,關鍵驅動因素分析可能會將設定解譯為迴歸問題。
若選擇量值作為目標,您可以將基本彙總直接套用至設定內的欄位,或者若您想要使用更複雜的運算式,可選取現有的主項目。
二元分類分析
若目標僅包括兩個唯一值 (例如是或否),關鍵驅動因素分析會將設定解譯為二元分類問題。二元分類分析的建立方式是選取二元維度作為目標。
一個常見的例子是,若您在應用程式中有已流失欄位,以追蹤哪些客戶已取消特定服務,則您可選取已流失欄位作為目標,以發現哪些因素驅動了這些客戶決定。
特徵
特徵是關鍵驅動因素。這些欄位包含關於什麼內容影響資料中趨勢的可擷取資訊。例如,若您建立關鍵驅動因素分析,以識別銷售額背後的影響因素,您可能會選取位置、產品類型、商店數量和銷售代表等維度作為特徵。計算的量值也能作為特徵使用。
您只能納入包含收集目標資料的時間點之前可記錄和可收集之資料的特徵。若您納入的特徵包含只有在為目標收集資料時才會知道的資料,分析將會不準確,且不會提供分析值。
例如,若目標為銷售,您不應納入包含從中直接衍生之資料的特徵。同樣地,若目標是具有二元結果 (是或否) 的已流失欄位,您不應納入包含客戶流失日期的特徵。
如需更多關於如何識別無效分析結果的資訊,請參閱 識別無效結果。
會向特徵指派以下兩個類型之一:
-
類別特徵:這包含根據相異、週期性類別的資料值。類別特徵的例子可以是洲欄位,其中只有一些可能的值,且不可解譯為原始數值資料,而應解譯為文字。 數字可作為類別使用。
-
數值特徵:這包含純粹是數值資料且不屬於類別的資料值。
會專門分析所有納入的特徵,以決定每個特徵對目標中目前資料的影響程度。
如需更多關於目標和納入特徵要求的資訊,請參閱 資料要求。
應用程式選取
您在應用程式中進行的選取會用於關鍵驅動因素分析。例如,您可能會想要探索銷售的關鍵驅動因素,但若納入商店數量維度作為特徵,您可能只想分析組織中五個特定商店的影響力。為了這麼做,您可以在應用程式中選取值,然後設定關鍵驅動因素分析。
因為選項基本上是套用至資料模型的篩選條件,所以重要的是,應注意到在一個欄位中進行選取會影響可用於分析的可用資料。
租用戶訂閱的考慮事項
關鍵驅動因素分析依賴 Qlik AutoML 計算特徵對目標的影響力。進行方式是建立機器學習模型,這用來為對應至所選資料子集中納入特徵的資料點,計算 SHAP 值。
建立關鍵驅動因素分析會取用透過 Qlik AutoML 衡量的服務。大部分的 Qlik Cloud 訂閱包含特定的 AutoML 使用量。若需要更多容量,需要升級至 AutoML 付費層級。
與服務帳戶擁有者確認,並查閱您使用的訂閱條款,以瞭解關鍵驅動因素分析的使用容量。
下列資源可提供其他詳細資訊:
資料要求
最低資料量需求
從目標和特徵建立的資料集需要至少有 400 個儲存格。否則,您無法執行分析。
其他要求
下列要求適用於從分析設定建立的資料集:
-
目標需要包含至少兩個唯一值。
-
若目標包含二到十個唯一值,每個唯一值需要出現在資料集中的至少十個記錄。
若您在執行關鍵驅動因素分析時遇到錯誤,可能是因為您選取用於分析的資料不符合這些要求。關於您可能遇到的其他問題以及可能的解決方案清單,請參閱 疑難排解 。
在 Qlik Sense 中使用關鍵驅動因素分析
下列說明主題可協助您開始在 Qlik Sense 中建立並解譯關鍵驅動因素分析:
限制
關鍵驅動因素分析的限制清單如下:
-
不支援包含日期、時間或時間戳記資料類型的欄位作為目標或特徵使用。