執行詳細模型分析
在實驗的分析索引標籤中,您可以聚焦於單一模型,進行預測效能的深入分析。詳細分析使用內嵌分析來執行。
訓練結束後,選取模型。接下來,開啟分析索引標籤,以檢視更多關於模型預測準確度的資訊、什麼影響資料中的趨勢,以及其他資訊。顯示在分析索引標籤中的資料是根據模型針對鑑效組資料產生的預測。
詳細模型分析的部分主要優點包括:
-
您可以根據需要在互動式介面精簡並自訂視覺化資料。
-
在鑑效組資料仔細觀察進行的預測,以及特徵重要性統計資料。
分析工作流程
如需完整理解模型訓練結果,建議您完成快速分析,然後在比較和分析索引標籤中繼續進行其他選項。快速分析提供模型訓練摘要,顯示已在智慧最佳化流程期間捨棄哪些特徵,也提供自動產生的視覺化數量,以供快速取用。比較和分析索引標籤不會顯示模型訓練摘要,但可讓您更深入地向下探查模型指標,以進一步理解模型品質。
如需更多關於其他分析選項的資訊,請參閱:
理解概念
在開始評估模型之前,若對模型分析背後的概念能有基本理解,會很有幫助。如需詳細資訊,請參閱理解模型檢閱概念。
最佳化設定對分析的影響
根據您是否已使用智慧模型最佳化,您的分析體驗可能有些微不同。依照預設,會為新的實驗開啟智慧模型最佳化。
透過智慧最佳化訓練的分析模型
依照預設,會透過智慧模型最佳化執行新的實驗。
智慧模型最佳化提供更健全的訓練流程,理想上會建立準備好部署的模型,只需要稍微精簡或不需要進一步精簡。這些模型的效能在部署以用於生產使用情況時,仍取決於透過包括相關特徵和資料的高品質資料集來訓練。
若您的版本已透過智慧模型最佳化進行訓練,請考慮下列事項:
-
根據演算法如何分析資料,版本中的每個模型可以有不同的特徵選項。
-
從模型索引標籤,請先閱讀模型的模型訓練摘要,再深入瞭解特定分析。模型訓練摘要顯示了 AutoML 如何透過迭代特徵選取和套用進階轉換來自動最佳化模型的摘要。
如需更多關於智慧模型最佳化的資訊,請參閱 智慧模型最佳化。
不透過智慧最佳化訓練的分析模型
或者,也可以關閉訓練版本的智慧模型最佳化。若您需要進一步控制訓練流程,手動模型最佳化會很實用。
若您使用了手動最佳化,版本中的所有模型將有相同的特徵選項,因此不需要模型訓練摘要。
檢查設定
在預先處理期間,可能已排除特徵用於訓練。這種情況的發生原因通常是,隨著訓練進展,對於資料的已知資訊,比您執行該版本之前更多。
檢視模型訓練摘要之後 (僅隨智慧最佳化顯示),若您需要查看這些其他變更,可以更仔細地查看實驗設定。
請執行下列動作:
-
在實驗中,切換至資料索引標籤。
-
確保您處於 結構描述檢視。
-
使用工具列中的下拉式功能表,從版本中選取模型。
-
分析模型結構描述。您可能會想要聚焦於深入資訊和特徵類型欄,以查看特定特徵是否已捨棄或已轉換為不同的特徵類型。
例如,有可能已在您執行該版本之後排除原本標記為可能的自由文字的特徵。
如需關於每個深入資訊意義的更多資訊,請參閱 解譯資料集深入資訊。
請注意,若您已透過預設智慧最佳化選項執行該版本,則由於自動精簡,該版本中的每個模型可能有不同的特徵選項。若已在沒有智慧最佳化的情況下執行該版本,則該版本中所有模型的特徵選項將會相同。如需更多關於智慧模型最佳化的資訊,請參閱 智慧模型最佳化。
根據您在此設定中找到的內容,您可能需要回到資料集準備階段,以改善特徵資料。
啟動詳細分析
有幾種可以啟動特定模型詳細分析的方式:
-
在資料或模型索引標籤中選取模型,按一下模型旁邊的 ,然後按一下 分析。
-
在選取了模型後按一下分析索引標籤。
-
若您已經在檢視模型的詳細分析,使用工具列中的下拉式功能表選取不同模型。
分析內容取決於模型類型,如實驗目標所定義。不同的指標將可用於不同的模型類型。
導覽內嵌分析
使用互動式介面,以分析模型與內嵌分析。
在工作表之間切換
工作表面板可讓您於分析中在工作表之間切換。每個工作表有特定焦點。可以根據需要展開並收合面板。
選取選項
使用選項以精簡資料。您可以選取特徵並向下探查特定值和範圍。如有需要,這可讓您更仔細地查看。在某些情況下,您可能需要選取一個或多個選項,以便顯示視覺化。按一下視覺化和篩選窗格中的資料值,以進行選取。
您可以透過以下方式處理選項:
-
按一下內容、定義範圍並繪製,藉此選取值。
-
在圖表內搜尋以選取值。
-
按一下內嵌分析的頂端工具列中的所選欄位。這可讓您在現有選項中搜尋,鎖定或解鎖選項,並進一步修改選項。
-
在內嵌分析的頂端工具列中,按一下 以移除選項。按一下 圖示,以清除所有選項。
-
按一下 和 ,以在選項中向前或向後。
分析包含篩選窗格,以便更輕鬆地精簡資料。在篩選窗格中,按一下值的核取方塊以進行選取。若篩選窗格包含多個清單方塊,按一下清單方塊以展開,然後選取任何所需選項。
將資料匯出至目錄
您可以將詳細分析中使用的資料匯出至目錄。資料匯出至 Qlik Cloud 分析 中的空間。您可以使用匯出的資料建立您自己的 Qlik Sense 應用程式以進行自訂分析。
如需詳細資訊,請參閱匯出模型訓練資料。
分析預測準確度
您解譯預測準確度的方式將取決於訓練資料集的結構和機器學習使用案例。此外,這些視覺化解譯取決於模型類型。以下區段為每個模型類型提供更多資訊。
模型概述工作表的預測區段提供模型做出多少正確和不正確預測的彙總概述。
使用預測和特徵分佈工作表,聚焦於特定特徵,以分析預測不準確的性質。在工作表的左側篩選窗格中選取單一特徵。對於所有模型類型,此工作表並排顯示預測不準確和實際值分佈,以協助判斷資料。
二元分類模型
分析整個模型
在模型概述工作表的預測區段中,會顯示混淆矩陣中定義的原始資料。這包括確判為真和誤判,以及真否定和誤否定。 這些值以靜態總計呈現,所以不會回應選項。若要進一步瞭解這些值代表的意義,請參閱 混淆矩陣。
分析資料子集
在預測和特徵分佈工作表中,預測錯誤圖表為每個可能的特徵值或特徵中的範圍顯示長條,其中長條高度對應至模型做出了多少不正確的預測。長條中的每個色彩對應至每個實際目標值。選取單一特徵,以及任何其他所需欄位中的值,以檢視預測準確度對於不同的資料子集如何變化。
多類別分類模型
分析整個模型
在模型概述工作表的預測區段中,會顯示長條圖,其中長條代表每個實際目標值。長條的每個色彩高度對應至模型預測了特定分類多少次。除了此圖表,預測區段也顯示正確與不正確預測的解析。
分析資料子集
在預測和特徵分佈工作表中,預測錯誤圖表為每個可能的值或特徵中的範圍顯示長條,其中長條高度對應至模型做出了多少不正確的預測。長條中的每個色彩對應至每個實際目標值。
迴歸模型
對於迴歸模型,您可以在模型和特徵層級檢視下列資訊:
-
目標的平均預測值
-
實際目標值
-
第九十和第十百分位預測範圍。這些線條顯示您可以預期模型會預測某個值的範圍。第九十百分位線條永遠會是具有較大值的線條。
-
平均絕對錯誤 (MAE)
對於整個模型和特徵特定視覺化,可為特徵分析指標以及實際值分佈。
分析特徵重要性
存取概述
分析特徵重要性向您指示每個特徵如何影響相對於其他特徵的預測。
模型概述工作表的特徵影響區段提供平均絕對 SHAP 值的彙總概述。此圖表看起來與模型索引標籤中的 SHAP 重要性圖表相同。圖表根據您選取的選項來更新。若您選取單一特徵,您可以向下探查其特定值和範圍,以瞭解其他詳細資訊。
分析 SHAP 分佈
您也可以開啟受特徵影響工作表,以對每個特徵值或範圍的 SHAP 值取得更全面的檢視。會以方向呈現 SHAP 值,而非以絕對值呈現。
此分析可以協助您識別特定群組中的模式,並找到資料中的異常值。在圖表中選取值或範圍,以篩選資料,進行更精細的分析。
圖表的外觀和類型取決於您選取哪個特徵類型。
類別特徵
類別特徵視覺化為盒狀圖。盒狀圖可協助您針對每個類別值查看 SHAP 值的分佈。盒狀圖有下列設定:
-
顯示平均 SHAP 值。
-
使用標準 (Tukey) 設定:
-
值的方塊由第一個四分位數 (下端) 和第三個四分位數 (上端) 定義。
-
中位數是方塊內的水平線。
-
-
上方和下方鬚狀對應至 1.5 四分位數間距的上限和下限。
-
不會顯示異常值。
數值特徵
對於數值特徵,SHAP 值會視覺化為散佈圖。散佈圖有下列設定:
-
會顥示所選樣本的 SHAP 值。
-
散佈圖的外觀和質感決取於要顯示的資料點數量。對於資料點數量較低的圖表,會顯示個別泡泡。對於有大量資料點的圖表,泡泡會集合為區塊,並予以著色,以指示每個區塊內有多少資料點。
在散佈圖中,選取特定值或範圍可進行更仔細的審視。