在 Qlik Sense 應用程式中視覺化預測資料
流程中的最後步驟是建立 Qlik Sense 分析應用程式,以視覺化您已產生的預測資料。
替代工作流程:上傳預先設定的應用程式
如果不要按照本主題的剩餘步驟,您可以改為將本教學課程開始時下載的 Customer churn predictions.qvf 應用程式上傳至 分析 活動中心。
此頁面的剩餘區段會指導您建立類似的應用程式。應用程式的預測資料和您自己的預測資料之間將會有一些差異。
可下載的應用程式包含標題為 Individual Customer Analysis 的附加工作表,這使用條件運算式,以鼓勵一次進行更精細的單一客戶分析。
開始使用
從 分析 活動中心,前往「建立」頁面,並按一下分析應用程式。 選取應用程式的空間,並命名為客戶流失預測。
按一下建立。
建立資料模型
選取您的資料
您需要將必要資料新增至應用程式。這包括套用資料集 (在教學課程開始時上傳) 和兩個從預測產生的資料集。
請執行下列動作:
-
在新的應用程式中,按一下以從資料目錄新增資料。
-
在資料目錄中,按一下以下三個資料集旁的核取方塊:
-
套用資料集:AutoML Tutorial - Churn data - apply.csv 或 AutoML Tutorial - Churn data - apply.qvd
-
預測資料集:AutoML Tutorial - Churn data - apply_Prediction.csv
-
座標 SHAP 資料集:AutoML Tutorial - Churn data - apply_Prediction_Coordinate_SHAP.csv
-
-
按一下下一步。
-
就會顯示摘要面板。按一下 AutoML Tutorial - Churn data - apply.csv 資料集以展開要載入的可用欄位。
-
按一下任何特徵旁邊、在模型訓練期間取消選取的 圖示。這應為 DaysSinceLastService,以及由於對模型影響力低而取消選取的任何特徵。
-
按一下載入到應用程式中。
關聯資料
此時,您已將資料新增至應用程式,但在您將資料集關聯在一起時,不會建構連接的資料模型。在此案例中,AccountID 欄位會是將資料集連結在一起的索引。
在應用程式中,現在會開啟資料管理員。您將會看見三個資料集,但這會顯示為沒有連接的獨立實體。
請執行下列動作:
-
在應用程式中,現在會開啟資料管理員。您將會看見三個資料集,但這會顯示為沒有連接的獨立實體。
-
在資料管理員的右側窗格,尋找 AccountID 關聯建議。
-
按一下套用。表格現在應連接在一起。
-
按一下載入資料。
在 資料模型檢視器 中檢查關聯
在應用程式中建置任何視覺化之前,您應驗證資料已正確關聯。
請執行下列動作:
-
在介面頂端的導覽列中,開啟應用程式導覽功能表並選取 資料模型檢視器。
-
確認三個資料集已正確連接。AccountID 欄位應在全部三個資料集作為金鑰運作。應用程式的資料模型看起來應為下圖。
您現在已準備好開始建置分析內容。在導覽列按一下分析索引標籤內的工作表。
第一個工作表:彙總預測儀表板
第一個工作表將會聚焦於彙總形式的預測分析。
請執行下列動作:
-
您現在應處於工作表編輯模式。按一下進階選項。
-
用滑鼠右鍵按一下工作表中任何現有的視覺化,並刪除。此為我們不會在本教學課程使用的圖表建議特徵。
-
向工作表提供標題,例如彙總預測。若要這麼做,按一下空白工作表的任何地方,以開啟介面右側的工作表屬性。在標題之下,輸入工作表的名稱。
圓形圖
圓形圖可讓您輕鬆視覺化成比例的資料解析。在此案例中,透過預測的結果 (yes 或 no) 解析資料是合理的做法。
請執行下列動作:
-
將圓形圖拖曳至工作表。
-
新增 Churned_predicted 作為維度。
-
新增 Count(AccountID) 作為量值。
-
如有需要,在屬性面板的外觀 > 呈現之下關閉維度標籤。
-
在屬性面板的資料之下展開維度,並將維度的標籤修改為預測會流失。
標籤會在圖例中更新。
篩選窗格
此儀表板將用於整個資料模型的廣泛分析。不過,能夠在各種維度快速篩選資料以分析特定群組,當然也很重要。
以多個清單方塊建立篩選窗格。每個清單方塊允許單一維度內的值選項。
請執行下列動作:
-
將篩選窗格拖曳至工作表。
-
將欄位新增至篩選窗格。這些可以是您預期對預測的結果會很重要的維度。
-
在屬性面板中按一下資料之下的欄位,以根據需要修改每個清單方塊。這會開啟清單方塊屬性。
例如,您可能會想要變更欄位標籤,並將摺疊清單方塊設定為永遠以儲存工作表空間。
調整篩選窗格的大小,以在工作表的某一側顯示為面板。
KPI 物件
若要為特別重要的資料分析顯示單一值,KPI 是很棒的方式。在此,我們將會建立三個 KPI 圖表。
請執行下列動作:
-
建立空白 KPI 圖表。新增下列量值:
=Count(Churned_predicted)
這將會針對已產生流失預測的客戶計算客戶總數。
-
將量值標示為客戶總數。
-
將數字格式設定為數字並以 1,000 格式 (沒有小數或百分比值) 呈現值。
-
建立另一個空白 KPI 圖表。新增下列量值:
=Count({<Churned_predicted={"yes"}>}(Churned_predicted))
此為計算 yes 值在 Churned_predicted 欄位中顯示次數的集合運算式。
-
將量值標示為預測會流失。
-
使用與第一個 KPI 相同的設定來設定圖表的數字格式。
-
建立第三個空白 KPI 圖表。新增下列量值:
=Count({<Churned_predicted={"no"}>}(Churned_predicted))
這計算 no 值在 Churned_predicted 欄位中顯示的次數。
-
將量值標示為預測會留存。
直方圖
您可以使用長條圖視覺化預測可能性值的分佈。
將長條圖拖曳至工作表,並提供標題。新增 Churned_yes 作為維度。
堆疊長條圖
若要依類別欄位 (例如方案類型) 分析預測,您可以透過互相堆疊的個別集合分析建立長條圖。
請執行下列動作:
-
將長條圖拖曳到工作表並提供標題依方案類型的流失預測。
-
新增 PlanType 作為維度。標示為方案類型。
-
新增下列量值:
=Count({<Churned_predicted={"no"}>}(Churned_predicted))
將量值標示為預測會留存。
-
新增下列量值:
=Count({<Churned_predicted={"yes"}>}(Churned_predicted))
將量值標示為預測會流失。
-
在外觀 > 呈現之下,將版面配置從分組變更為堆疊。
-
移除捲軸並將值標籤設定為開啟。
-
將區段標籤和標籤總數設定為自動。
完成後,您可以使用相同但有不同類別維度 (例如 NumberOfPenalties) 的兩個量值,建立類似的長條圖。
用來分析個別數字欄位值的分佈圖
分佈圖可用來依量值與不同數值呈現預測資料。在此區段中,您將會建立圖表,以依基本費用與相異的客戶服務評價分組顯示流失預測。
請執行下列動作:
-
將分佈圖拖曳到工作表,並命名為依基本費用和服務評價的流失預測。
-
新增 AccountID 作為這些點的維度。
-
在 X 軸新增下列量值:
=Avg(BaseFee)
-
在 Y 軸新增下列計算維度:
=Round(ServiceRating,2)
這會為每個相近的 ServiceRating 值沿著 Y 軸建立分組。值越高,客戶對服務品質的評價越高。
-
在外觀 > 呈現之下,將泡泡大小減少為 20 並開啟抖動點。
-
在色彩和圖例中,將色彩設定為自訂。
-
選取選項以依下列維度為資料著色:
=Churned_predicted
這將會為 Churned_predicted 欄位中的每個值指派一種色彩。在此案例中,會顯示兩種色彩。
-
將標籤新增至維度和量值,並將下列標籤新增至自訂色彩設定:預測會流失。
可以用其他欄位彙總取代 BaseFee 量值,以建立類似圖表以便分析不同數字欄位。
設定工作表上的視覺化,使之類似下圖。
第二個工作表:彙總的 SHAP 儀表板
接下來,建立專門用於分析彙總 SHAP 值的工作表。
請執行下列動作:
-
建立新的工作表並開啟進階編輯模式。
-
向工作表提供標題 (例如彙總 SHAP)。
SHAP importance 排名
此圖表類型類似於自動產生的圖表類型,您可能已在設定實驗版本時看過。在此,我們將會為預測的資料集製作一項。
此圖表類型的目的是顯示對 Churned 欄中所見的結果最有貢獻的特徵。我們需要注意,由於將會使用絕對值,SHAP 結果可以是正值 (yes值) 或負值 (no值)。若您偏好,您也可以使用不會計算絕對值的運算式。
請執行下列動作:
-
將長條圖拖曳至空的工作表。
-
為圖表依特徵的 SHAP 重要性提供標題。
-
新增 automl_feature 作為維度,並提供特徵標籤。
這可讓您在所有納入的特徵呈現彙總資料。
-
新增下列計算量值:
=fabs(Avg(SHAP_value))
-
在標籤之下,輸入 平均絕對 SHAP。
-
在屬性面板中,於外觀 > 呈現之下,移除捲軸 (如有),並將圖表方向從垂直設定為水平。
-
在排序之下,將量值拖曳到維度上方 (如未進行)。每個欄位的排序為自動。
這會以遞減模式依量值排序圖表。
格狀容器
您可以讓格狀容器為維度內的特定欄位值篩選資料。在此案例中,我們可以針對提供給客戶的四種方案類型,解析每一種的 SHAP 值。
若要建立格狀物件,您需要指定維度和主要視覺化。我們會將剛才建立的 SHAP importance 排名轉換為主要視覺化。
請執行下列動作:
- 用滑鼠右鍵按一下工作表中的平均絕對 SHAP 圖表,然後選取 新增至主項目。
- 保留預設名稱並按一下新增。
-
在資產面板中的自訂物件 > Qlik 視覺化搭售之下,將格狀容器拖曳到工作表。
-
新增 PlanType 作為維度。
-
按一下圖表內部的新增主要視覺化,然後新增平均絕對 SHAP 圖表。
-
在屬性面板中的外觀 > 一般之下,開啟顯示標題並向圖表提供標題依方案類型的 SHAP 重要性。
-
調整格狀容器的大小,讓寬度足以在圖表中顯示特徵名稱。若所有標籤都沒有顯示,在瀏覽器視窗中調整縮放。
或者,您可以針對要分析的每個維度值,透過集合運算式建立個別圖表,以顯示此資料。在此案例中,您可以為四種方案類型分別建立各自的圖表。
重複使用篩選窗格
您在第一個工作表建立的篩選窗格可在此工作表重複使用。在進階編輯模式下,用滑鼠右鍵按一下篩選窗格並複製。在彙總 SHAP 工作表中貼上。
樹狀圖
您也可以使用樹狀圖視覺化 SHAP 值解析。將樹狀圖拖曳到工作表,並新增用於 SHAP 重要性排名的相同維度和量值。
設定工作表上的視覺化,使之類似下圖。
使用應用程式
完成建置應用程式之後,就準備好用於資料分析了。
按一下編輯工作表以切換至分析模式。在此檢視中,您可以進行選取 (在篩選窗格中或工作表的任何地方),以篩選用於資料子集特定分析的資料。例如,您可能會想要分析特定客戶方案類型或區域,並與其他資料子集比較結果。
謝謝您!
您已到達本教學課程的結束部分。我們希望您學到幾件事情,並意識到自動化機器學習是產生預測模型時快速且簡單的方式。Qlik Sense 是強大的工具,可以輕鬆視覺化預測資料,並對資料提供有意義的深入資訊。