Przeskocz do zawartości głównej Przejdź do treści uzupełniającej

Wykrywanie stronniczości w modelach uczenia maszynowego

Możesz identyfikować stronniczość w modelach uczenia maszynowego, które trenujesz w eksperymentach ML. Zajmij się wykrytą stronniczością, usuwając skośne cechy, korygując niewłaściwe zbieranie danych lub zmieniając strukturę swojego zbioru danych treningowych.

Zrozumienie stronniczości

W uczeniu maszynowym stronniczość to niepożądane zjawisko, w którym modele faworyzują lub mogłyby faworyzować pewne grupy kosztem innych. Błąd negatywnie wpływa na sprawiedliwość i ma etyczne implikacje dla prognoz oraz decyzji, na które wpływają. Błąd może zostać wprowadzony w danych treningowych, w wynikach przewidywanych przez wytrenowane modele lub w obu przypadkach.

Przykłady błędu—i jego konsekwencje dla podejmowania decyzji—obejmują:

  • Trenowanie modeli na danych, które nieproporcjonalnie reprezentują określone poziomy dochodów lub statusy zdrowotne, co skutkuje niesprawiedliwymi decyzjami w sprawie roszczeń ubezpieczeniowych.

  • Trenowanie modeli na danych zniekształconych pod względem rasy i płci kandydatów, co wpływa na decyzje o zatrudnieniu.

  • Szkolenie modeli, które łączą kody pocztowe z wiarygodnością kredytową.

Stronniczość danych

Błąd danych występuje, gdy dane użyte do trenowania modelu są zniekształcone w sposób faworyzujący niektóre grupy kosztem innych. Błąd danych jest spowodowany nierówną reprezentacją między grupami w danych treningowych.

Na przykład, zbiór danych do przewidywania wyników rekrutacji może zawierać dane, które przedstawiają jedną płeć jako bardziej skuteczną niż inne.

Błąd danych może zostać wprowadzony do danych treningowych na kilka sposobów, w tym:

  • Nieprawidłowe gromadzenie danych, w którym pewne grupy są niedostatecznie lub nadmiernie reprezentowane.

  • Dane, które dokładnie odzwierciedlają historyczne wzorce, ale ujawniają ukryte uprzedzenia w tych trendach i praktykach.

Dane w poniższej wizualizacji wskazują na stronniczość danych.

Przykład stronniczości danych, wizualizowany za pomocą wykresu słupkowego. W danych źródłowych pewne stany cywilne są nadmiernie reprezentowane w porównaniu z innymi w odniesieniu do poziomów dochodów.

Dane obciążone, które wprowadziłyby stronniczość danych, gdyby zostały użyte w modelu uczenia maszynowego.

Stronniczość modelu

Stronniczość modelu, czyli stronniczość algorytmiczna, występuje, gdy przewidywania dokonane przez model uczenia maszynowego faworyzują niektóre grupy kosztem innych. W przypadku stronniczości modelu, modele tworzą powiązania między pewnymi grupami a wynikami, negatywnie wpływając na inne grupy. Stronniczość modelu może być spowodowana niewłaściwie zebranymi lub skośnymi danymi, a także zachowaniami specyficznymi dla używanego algorytmu szkoleniowego.

Na przykład model mógłby przewidywać nieproporcjonalnie negatywne wskaźniki zatrudnienia dla niektórych grup wiekowych z powodu niesprawiedliwych powiązań dokonanych przez model.

Wizualizacja z zakładki Analiza w eksperymencie ML, podkreślająca stronniczość modelu. Wizualizacja pokazuje, że model dokonuje wyższych prognoz dochodów dla niektórych stanów cywilnych niż dla innych.

Zakładka „Analiza” w eksperymencie ML pokazująca stronniczość modelu.

Metryki stronniczości danych

W Qlik Predict, stronniczość danych jest mierzona poprzez analizę:

  • Współczynnik reprezentacji: Porównuje rozkład danych należących do każdej grupy w cesze, w porównaniu do wszystkich danych w cesze. Obliczona metryka to współczynnik parytetu współczynnika reprezentacji.

  • Parytet rozkładu warunkowego: Porównuje równowagę między danymi dla każdej grupy w cesze, w odniesieniu do wartości kolumny docelowej. Obliczona metryka to parytet rozkładu warunkowego.

Aby dowiedzieć się więcej o dopuszczalnych wartościach dla tych metryk, zobacz Dopuszczalne wartości dla metryk odchylenia.

Wskaźniki stronniczości modelu

W Qlik Predict, wskaźniki stronniczości modelu najlepiej rozumieć w kontekście typu modelu dla eksperymentu. Ogólnie rzecz biorąc, istnieją następujące kategorie wskaźników stronniczości:

  • Wskaźniki modeli klasyfikacji

  • Wskaźniki modelu regresji i szeregów czasowych

Aby dowiedzieć się więcej o dopuszczalnych wartościach dla tych metryk, zobacz Dopuszczalne wartości dla metryk odchylenia.

Modele klasyfikacji

W binarnych i wieloklasowych modelach klasyfikacji, stronniczość jest mierzona poprzez analizę przewidywanych wartości docelowych (wyników). W szczególności porównuje się różnice w wskaźnikach pozytywnych i negatywnych wyników dla grup („pozytywne” i „negatywne” odnoszą się tutaj do wyników korzystnych w porównaniu do niekorzystnych — na przykład wartość tak lub nie dla kolumny docelowej Zatrudniony). Modele te posiadają następujące metryki stronniczości:

  • Nierównomierny wpływ

  • Statystyczna różnica parytetu

  • Różnica równych szans

Nierównomierny wpływ

Współczynnik zróżnicowanego wpływu (DI) ocenia, czy grupy w wrażliwej cesze są faworyzowane lub poszkodowane w przewidywanych wynikach modelu. Mierzy się ją, obliczając, jak często każda grupa jest wybierana jako przewidywana wartość, porównując to ze wskaźnikiem wyboru dla najbardziej uprzywilejowanej grupy w cesze.

Statystyczna różnica parytetu

Podobnie jak w przypadku rozbieżnego wpływu, różnica parzystości statystycznej (SPD) ocenia przewidywania modelu, aby określić, czy faworyzują lub szkodzą jakimkolwiek poszczególnym grupom. Metryka jest obliczana poprzez porównanie wskaźników pozytywnych wyników między największą a najmniejszą grupą.

Różnica równych szans

Różnica równych szans (EOD) jest podobna do pozostałych dwóch metryk stronniczości modelu klasyfikacji. EOD porównuje najwyższe i najniższe wskaźniki prawdziwie pozytywnych wyników wśród grup w cesze.

Modele regresji i szeregów czasowych

W modelach regresji i szeregów czasowych, błąd systematyczny jest mierzony poprzez porównanie, jak często modele popełniają błędy w swoich prognozach, używając współczynników parytetu do określenia sprawiedliwości przewidywanych wyników.

Następujące metryki błędu systematycznego są obliczane, używając metryk błędów, które są powszechnie używane do oceny dokładności modelu:

  • Parytet MAE

    MAE

  • Parytet MSE

    MSE

  • Parytet RMSE

    RMSE

  • Rozbieżność R2

    R2

  • Parytet MASE

    MASE

  • Parytet MAPE

    MAPE

  • Parytet SMAPE

    SMAPE

Dopuszczalne wartości dla metryk odchylenia

Metryki odchylenia — dopuszczalne zakresy i wartości
Metryka odchylenia Kategoria odchylenia Odpowiednie typy modeli Dopuszczalne wartości
Parytet współczynnika reprezentacji Stronniczość danych Wszystkie

Wartość idealna: od 0,8 do 1.

Niższy współczynnik wskazuje na nieproporcjonalną reprezentację.

Parytet rozkładu warunkowego Stronniczość danych Wszystkie

Idealna wartość: między 0,8 a 1.

Niższy wskaźnik wskazuje na nieproporcjonalną reprezentację.

Statystyczna różnica parytetu (SPD) Stronniczość modelu Klasyfikacja binarna, klasyfikacja wieloklasowa

Idealna wartość: 0.

Wartość powyżej 0,2 jest silnym sygnałem niesprawiedliwości.

Nierównomierny wpływ (DI) Stronniczość modelu Klasyfikacja binarna, klasyfikacja wieloklasowa

Wartość idealna: 1.

Wartość poniżej 0,8 sygnalizuje niesprawiedliwość.

Różnica równych szans (EOD) Stronniczość modelu Klasyfikacja binarna, klasyfikacja wieloklasowa

Wartość idealna: 0.

Wartość powyżej 0,1 sygnalizuje nieuczciwość.

Parytet MAE Stronniczość modelu Regresja

Wartość idealna: między 0,8 a 1.

Wartość powyżej 1,25 sygnalizuje nieuczciwość.

Parytet MSE Stronniczość modelu Regresja

Wartość idealna: między 0,8 a 1.

Wartość powyżej 1.25 sygnalizuje nieuczciwość.

Parytet RMSE Stronniczość modelu Regresja

Wartość idealna: między 0.8 a 1.

Wartość powyżej 1.25 sygnalizuje nieuczciwość.

Rozbieżność R2 Stronniczość modelu Regresja

Wartość idealna: 0.

Wartość powyżej 0.2 sygnalizuje nieuczciwość.

Parytet MASE Stronniczość modelu Szereg czasowy Wartość powyżej 1,25 sygnalizuje niesprawiedliwość.
Parytet MAPE Stronniczość modelu Szereg czasowy Wartość powyżej 1,25 sygnalizuje niesprawiedliwość.
Parytet SMAPE Stronniczość modelu Szereg czasowy Wartość powyżej 1,25 sygnalizuje niesprawiedliwość.

Konfigurowanie wykrywania stronniczości

Wykrywanie stronniczości jest konfigurowane dla każdej cechy treningowej w wersji eksperymentu.

  1. W eksperymencie ML rozwiń Uprzedzenie w panelu konfiguracji trenowania.

  2. Wybierz cechy, dla których chcesz uruchomić wykrywanie uprzedzeń.

Alternatywnie, włącz wykrywanie uprzedzeń dla żądanych cech w Wiersze widoku schematu.

Szybka analiza wyników stronniczości

Po zakończeniu trenowania możesz uzyskać szybki przegląd wyników wykrywania stronniczości w zakładce Modele.

Przewiń w dół przez elementy szybkiej analizy, aby znaleźć Wykrywanie stronniczości. Rozwiń sekcje za pomocą Strzałka w dół ikon. Możesz analizować cechy pod kątem możliwych stronniczości danych i modelu.

Analizowanie stronniczości danych za pomocą sekcji Wykrywanie stronniczości w zakładce Modele.

Analizowanie stronniczości danych za pomocą sekcji Wykrywanie stronniczości na karcie Modele.

Notatki

  • Grupy uprzywilejowane to wartości docelowe lub zakresy, które są nadmiernie reprezentowane w danych lub przewidywanych wynikach celu, na podstawie metryk stronniczości. Grupy poszkodowane to wartości docelowe lub zakresy, które są niedostatecznie reprezentowane w danych lub przewidywanych wynikach celu, na podstawie metryk stronniczości.

    Informacje na temat sposobu użycia metryk stronniczości można znaleźć na stronie Dopuszczalne wartości dla metryk odchylenia.

    Liczby w nawiasach opisują kryteria użyte do obliczenia metryki. Na przykład, jeśli metryka to różnica równych szans (EOD), kobiety (10%) i mężczyźni (80%) wskazuje na wskaźniki prawdziwie pozytywnych wyników wynoszące 80% dla mężczyzn i 10% dla kobiet.

  • Wynik docelowy odnosi się do wartości kolumny docelowej przewidywanej przez model.

  • Nie wszystkie metryki i wartości stronniczości są wyświetlane w zakładce Modele z powodu ograniczonej przestrzeni. Na przykład:

    • W zależności od typu metryki i modelu, niektóre metryki i grupy mogą zawierać tylko wartości minimalne i maksymalne.

    • Jeśli wiele metryk przekracza próg stronniczości dla cechy, wyświetlana jest metryka wskazująca najwyższy stopień niesprawiedliwości.

    • W przypadku stronniczych cech w modelach klasyfikacji wieloklasowej wyświetlana jest tylko metryka wskazująca najwyższy stopień stronniczości.

  • Bardziej szczegółowe informacje są dostępne na karcie Analizuj oraz w raporcie z trenowania modelu. Zob. Szczegółowa analiza wyników stronniczości.

  • Więcej informacji na temat terminologii w tej sekcji można znaleźć w Terminologia na tej stronie.

Szczegółowa analiza wyników stronniczości

Możesz dokładniej przeanalizować wyniki stronniczości na karcie Analizuj.

  1. W eksperymencie ML wybierz model i przejdź do zakładki Analizuj.

  2. Otwórz arkusz Tendencja.

  3. Wybierz między Tendencja danych a Tendencja modelu w zależności od pożądanej analizy.

  4. W tabeli Cechy z potencjalną tendencją wybierz pojedynczą cechę.

Wykresy i metryki wskazujące na możliwą tendencję są wyświetlane z czerwonym tłem. Możesz wybierać cechy, klikając i rysując w wizualizacjach.

Metryki w tabeli są statyczne dla metryk odchylenia odpowiadających standardowym cechom. Dla przyszłych cech metryki odchylenia zmieniają się dynamicznie w zależności od wyboru grupy szeregów czasowych.

Karta Analizuj pokazująca analizę odchylenia modelu dla wybranej cechy. Możliwe odchylenie jest wskazywane przez czerwone tła dla wykresów i metryk.

Analizowanie stronniczości modelu w szczegółowy sposób przy użyciu arkusza Stronniczość na karcie Analizuj.

Więcej informacji na temat nawigowania po szczegółowych analizach modelu zawiera temat Szczegółowa analiza modelu.

Wyniki stronniczości w raportach szkoleniowych

Metryki stronniczości są również przedstawiane w raportach szkoleniowych ML.Są one uwzględnione w dedykowanej sekcji Stronniczość w raporcie.

Więcej informacji na temat raportów z uczenia zawiera temat Pobieranie raportów z uczenia maszynowego.

Eliminowanie stronniczości

Po przeanalizowaniu wyników wykrywania stronniczości dla Twoich modeli możesz chcieć wykonać jedną z następujących czynności:

Terminologia na tej stronie

Na tej stronie, i w Qlik Predict, „grupy” to termin, który ma różne znaczenia w zależności od kontekstu:

  • „Grupy” odnoszą się do wartości lub zakresów w cechach, które są analizowane pod kątem stronniczości. Na przykład, cecha Stan cywilny może mieć cztery możliwe grupy w danych treningowych: Żonaty/Zamężna, Rozwiedziony/Rozwiedziona, W separacji lub Wdowiec/Wdowa.

  • W eksperymentach szeregów czasowych „grupy” odnoszą się do funkcji, która umożliwia śledzenie wyników docelowych dla określonych wartości zgodnych cech. Na tej stronie grupy te są nazywane „grupami szeregów czasowych”. Więcej informacji na temat tych grup można znaleźć w Grupy.

Ograniczenia

  • Nie można aktywować wykrywania stronniczości dla:

    • Cecha docelowa.

    • Cechy wolnego tekstu (nawet jeśli typ cechy zostanie zmieniony na kategoryczny).

    • Cechy daty, które są używane jako indeks daty w eksperymentach szeregów czasowych.

    • Cechy daty poddawane automatycznej inżynierii. Możesz uruchomić wykrywanie stronniczości na tych cechach, ale nie aktywujesz ich niezależnie. Zamiast tego, aktywuj nadrzędną cechę daty do wykrywania stronniczości i upewnij się, że automatycznie zaprojektowane cechy daty są uwzględnione do szkolenia.

Czy ta strona była pomocna?

Jeżeli natkniesz się na problemy z tą stroną lub jej zawartością — literówkę, brakujący krok lub błąd techniczny — daj nam znać!