Wykrywanie stronniczości w modelach uczenia maszynowego

Możesz identyfikować stronniczość w modelach uczenia maszynowego, które trenujesz w eksperymentach ML. Możesz również opcjonalnie wybrać otrzymywanie rekomendacji od dużego modelu językowego (LLM) dla cech, które mogą być podatne na stronniczość. Zajmij się wykrytą stronniczością, usuwając skośne cechy, korygując niewłaściwe zbieranie danych lub zmieniając strukturę zestawu danych treningowych.

Qlik nie gwarantuje dokładności, kompletności ani wiarygodności żadnych wyników wykrywania stronniczości i nie zapewnia zgodności z żadnymi przepisami lokalnymi, stanowymi, federalnymi ani międzynarodowymi, regulacjami ani standardami branżowymi. Użytkownik ponosi wszelkie ryzyko i odpowiedzialność za wszelkie działania podjęte na podstawie danych wyjściowych narzędzia, które nie powinny być wykorzystywane jako substytut profesjonalnej porady prawnej ani niezależnego audytu ludzkiego.

Wykrywanie stronniczości ma opcjonalny komponent, który wykorzystuje generatywną sztuczną inteligencję („GenAI”) do rekomendowania cech, które mogą być podatne na stronniczość. Użytkownik ma obowiązek przejrzeć i zweryfikować wszelkie rekomendacje GenAI, a także ocenić, czy jej użycie jest właściwe w konkretnym przypadku i zgodne z obowiązującymi przepisami prawa.

Zrozumienie stronniczości

W uczeniu maszynowym stronniczość to niepożądane zjawisko, w którym modele faworyzują lub mogłyby faworyzować pewne grupy kosztem innych. Błąd negatywnie wpływa na sprawiedliwość i ma etyczne implikacje dla prognoz oraz decyzji, na które wpływają. Błąd może zostać wprowadzony w danych treningowych, w wynikach przewidywanych przez wytrenowane modele lub w obu przypadkach.

Przykłady błędu—i jego konsekwencje dla podejmowania decyzji—obejmują:

Trenowanie modeli na danych, które nieproporcjonalnie reprezentują określone poziomy dochodów lub statusy zdrowotne, co skutkuje niesprawiedliwymi decyzjami w sprawie roszczeń ubezpieczeniowych.
Trenowanie modeli na danych zniekształconych pod względem rasy i płci kandydatów, co wpływa na decyzje o zatrudnieniu.
Szkolenie modeli, które łączą kody pocztowe z wiarygodnością kredytową.

Stronniczość danych

Błąd danych występuje, gdy dane użyte do trenowania modelu są zniekształcone w sposób faworyzujący niektóre grupy kosztem innych. Błąd danych jest spowodowany nierówną reprezentacją między grupami w danych treningowych.

Na przykład, zbiór danych do przewidywania wyników rekrutacji może zawierać dane, które przedstawiają jedną płeć jako bardziej skuteczną niż inne.

Błąd danych może zostać wprowadzony do danych treningowych na kilka sposobów, w tym:

Nieprawidłowe gromadzenie danych, w którym pewne grupy są niedostatecznie lub nadmiernie reprezentowane.
Dane, które dokładnie odzwierciedlają historyczne wzorce, ale ujawniają ukryte uprzedzenia w tych trendach i praktykach.

Dane w poniższej wizualizacji wskazują na stronniczość danych.

Dane obciążone, które wprowadziłyby stronniczość danych, gdyby zostały użyte w modelu uczenia maszynowego. — Przykład stronniczości danych, wizualizowany za pomocą wykresu słupkowego. W danych źródłowych pewne stany cywilne są nadmiernie reprezentowane w porównaniu z innymi w odniesieniu do poziomów dochodów.

Stronniczość modelu

Stronniczość modelu, czyli stronniczość algorytmiczna, występuje, gdy przewidywania dokonane przez model uczenia maszynowego faworyzują niektóre grupy kosztem innych. W przypadku stronniczości modelu, modele tworzą powiązania między pewnymi grupami a wynikami, negatywnie wpływając na inne grupy. Stronniczość modelu może być spowodowana niewłaściwie zebranymi lub skośnymi danymi, a także zachowaniami specyficznymi dla używanego algorytmu szkoleniowego.

Na przykład model mógłby przewidywać nieproporcjonalnie negatywne wskaźniki zatrudnienia dla niektórych grup wiekowych z powodu niesprawiedliwych powiązań dokonanych przez model.

Zakładka „Analiza” w eksperymencie ML pokazująca stronniczość modelu. — Wizualizacja z zakładki Analiza w eksperymencie ML, podkreślająca stronniczość modelu. Wizualizacja pokazuje, że model dokonuje wyższych prognoz dochodów dla niektórych stanów cywilnych niż dla innych.

Metryki stronniczości danych

W Qlik Predict, stronniczość danych jest mierzona poprzez analizę:

Współczynnik reprezentacji: Porównuje rozkład danych należących do każdej grupy w cesze, w porównaniu do wszystkich danych w cesze. Obliczona metryka to współczynnik parytetu współczynnika reprezentacji.
Parytet rozkładu warunkowego: Porównuje równowagę między danymi dla każdej grupy w cesze, w odniesieniu do wartości kolumny docelowej. Obliczona metryka to parytet rozkładu warunkowego.

Aby dowiedzieć się więcej o dopuszczalnych wartościach dla tych metryk, zobacz Dopuszczalne wartości dla metryk odchylenia.

Wskaźniki stronniczości modelu

W Qlik Predict, wskaźniki stronniczości modelu najlepiej rozumieć w kontekście typu modelu dla eksperymentu. Ogólnie rzecz biorąc, istnieją następujące kategorie wskaźników stronniczości:

Wskaźniki modeli klasyfikacji
Wskaźniki modelu regresji i szeregów czasowych

Aby dowiedzieć się więcej o dopuszczalnych wartościach dla tych metryk, zobacz Dopuszczalne wartości dla metryk odchylenia.

Modele klasyfikacji

W binarnych i wieloklasowych modelach klasyfikacji, stronniczość jest mierzona poprzez analizę przewidywanych wartości docelowych (wyników). W szczególności porównuje się różnice w wskaźnikach pozytywnych i negatywnych wyników dla grup („pozytywne” i „negatywne” odnoszą się tutaj do wyników korzystnych w porównaniu do niekorzystnych — na przykład wartość tak lub nie dla kolumny docelowej Zatrudniony). Modele te posiadają następujące metryki stronniczości:

Nierównomierny wpływ
Statystyczna różnica parytetu
Różnica równych szans

Nierównomierny wpływ

Współczynnik zróżnicowanego wpływu (DI) ocenia, czy grupy w wrażliwej cesze są faworyzowane lub poszkodowane w przewidywanych wynikach modelu. Mierzy się ją, obliczając, jak często każda grupa jest wybierana jako przewidywana wartość, porównując to ze wskaźnikiem wyboru dla najbardziej uprzywilejowanej grupy w cesze.

Statystyczna różnica parytetu

Podobnie jak w przypadku rozbieżnego wpływu, różnica parzystości statystycznej (SPD) ocenia przewidywania modelu, aby określić, czy faworyzują lub szkodzą jakimkolwiek poszczególnym grupom. Metryka jest obliczana poprzez porównanie wskaźników pozytywnych wyników między największą a najmniejszą grupą.

Różnica równych szans

Różnica równych szans (EOD) jest podobna do pozostałych dwóch metryk stronniczości modelu klasyfikacji. EOD porównuje najwyższe i najniższe wskaźniki prawdziwie pozytywnych wyników wśród grup w cesze.

Modele regresji i szeregów czasowych

W modelach regresji i szeregów czasowych, błąd systematyczny jest mierzony poprzez porównanie, jak często modele popełniają błędy w swoich prognozach, używając współczynników parytetu do określenia sprawiedliwości przewidywanych wyników.

Następujące metryki błędu systematycznego są obliczane, używając metryk błędów, które są powszechnie używane do oceny dokładności modelu:

Parytet MAE

MAE
Parytet MSE

MSE
Parytet RMSE

RMSE
Rozbieżność R2

R2
Parytet MASE

MASE
Parytet MAPE

MAPE
Parytet SMAPE

SMAPE

Dopuszczalne wartości dla metryk odchylenia

Metryki odchylenia — dopuszczalne zakresy i wartości
Metryka odchylenia	Kategoria odchylenia	Odpowiednie typy modeli	Dopuszczalne wartości
Parytet współczynnika reprezentacji	Stronniczość danych	Wszystkie	Idealna wartość: między 0,8 a 1. Niższy współczynnik wskazuje na nieproporcjonalną reprezentację.
Parytet rozkładu warunkowego	Stronniczość danych	Wszystkie	Idealna wartość: między 0,8 a 1. Niższy wskaźnik wskazuje na nieproporcjonalną reprezentację.
Statystyczna różnica parytetu (SPD)	Stronniczość modelu	Klasyfikacja binarna, klasyfikacja wieloklasowa	Idealna wartość: 0. Wartość powyżej 0,2 jest silnym sygnałem niesprawiedliwości.
Nierównomierny wpływ (DI)	Stronniczość modelu	Klasyfikacja binarna, klasyfikacja wieloklasowa	Wartość idealna: 1. Wartość poniżej 0,8 sygnalizuje niesprawiedliwość.
Różnica równych szans (EOD)	Stronniczość modelu	Klasyfikacja binarna, klasyfikacja wieloklasowa	Wartość idealna: 0. Wartość powyżej 0,1 sygnalizuje nieuczciwość.
Parytet MAE	Stronniczość modelu	Regresja	Wartość idealna: między 0.8 a 1. Wartość powyżej 1,25 sygnalizuje nieuczciwość.
Parytet MSE	Stronniczość modelu	Regresja	Wartość idealna: między 0.8 a 1. Wartość powyżej 1.25 sygnalizuje nieuczciwość.
Parytet RMSE	Stronniczość modelu	Regresja	Wartość idealna: między 0.8 a 1. Wartość powyżej 1.25 sygnalizuje nieuczciwość.
Rozbieżność R2	Stronniczość modelu	Regresja	Wartość idealna: 0. Wartość powyżej 0.2 sygnalizuje nieuczciwość.
Parytet MASE	Stronniczość modelu	Szereg czasowy	Wartość powyżej 1,25 sygnalizuje niesprawiedliwość.
Parytet MAPE	Stronniczość modelu	Szereg czasowy	Wartość powyżej 1,25 sygnalizuje niesprawiedliwość.
Parytet SMAPE	Stronniczość modelu	Szereg czasowy	Wartość powyżej 1,25 sygnalizuje niesprawiedliwość.

Konfigurowanie wykrywania stronniczości

Wykrywanie stronniczości jest konfigurowane dla każdej cechy treningowej w wersji eksperymentu.

Wykonaj następujące czynności:

W eksperymencie ML rozwiń Uprzedzenie w panelu konfiguracji trenowania.
Przed wybraniem cech do wykrywania stronniczości, opcjonalnie kliknij Pobierz rekomendacje, aby użyć generatywnej sztucznej inteligencji do sugerowania cech, które mogą zawierać stronnicze dane. Zob. Wykorzystywanie generatywnej sztucznej inteligencji do rekomendowania cech do wykrywania stronniczości.
Wybierz lub odznacz dowolne cechy, dla których chcesz uruchomić wykrywanie stronniczości.

Alternatywnie, włącz wykrywanie uprzedzeń dla żądanych cech w Wiersze widoku schematu.

Wykorzystywanie generatywnej sztucznej inteligencji do rekomendowania cech do wykrywania stronniczości

Możesz użyć wbudowanej integracji z dużym modelem językowym (LLM), aby rekomendować potencjalnie wrażliwe cechy przed uruchomieniem eksperymentu.

Jak to działa

Po kliknięciu Pobierz rekomendacje, nazwy cech i próbki danych są skanowane przez LLM, aby sprawdzić, które z Twoich cech są zalecane do wyboru w celu wykrywania stronniczości.
Rekomendacje są generowane w odpowiedzi na żądania wnioskowania, które mogą być przetwarzane poza regionem dzierżawy Qlik Cloud.

InformacjaNiezależnie od tego, czy dane są w spoczynku, czy w transporcie, zawsze są szyfrowane.
Po otrzymaniu rekomendacji możesz przejrzeć uzasadnienie każdej z nich. Na przykład możesz sprawdzić, czy cecha jest zalecana ze względu na potencjalne stronniczość geograficzną.
Rekomendacje z LLM są w języku angielskim.

Przeglądanie rekomendacji AI dla cech, dla których sugerowane jest wykrywanie stronniczości. — Kliknij Pobierz rekomendacje, aby użyć AI do sugerowanych cech, dla których należy uruchomić wykrywanie stronniczości.

Wymagania administracyjne

Funkcje AI — czyli wnioskowanie międzyregionalne — muszą być włączone przez administratora dzierżawy, aby ta funkcjonalność była dostępna. Robią to w centrum aktywności Administrowanie.

Więcej informacji zawiera temat Włączanie wnioskowania międzyregionalnego.
Oprócz uprawnień do konfigurowania eksperymentów użytkownicy muszą mieć uprawnienie Zarządzaj eksperymentami ML ustawione na Dozwolone tam, gdzie dozwolone jest użycie GenAI. Więcej informacji zawiera temat Korzystanie z narzędzi AI w eksperymentach ML.

Szybka analiza wyników stronniczości

Po zakończeniu trenowania możesz uzyskać szybki przegląd wyników wykrywania stronniczości w zakładce Modele.

Przewiń w dół przez elementy szybkiej analizy, aby znaleźć Wykrywanie stronniczości. Rozwiń sekcje za pomocą Strzałka w dół ikon. Możesz analizować cechy pod kątem możliwych stronniczości danych i modelu.

Analizowanie stronniczości danych za pomocą sekcji Wykrywanie stronniczości na karcie Modele. — Analizowanie stronniczości danych za pomocą sekcji Wykrywanie stronniczości w zakładce Modele.

Notatki

Grupy uprzywilejowane to wartości docelowe lub zakresy, które są nadmiernie reprezentowane w danych lub przewidywanych wynikach celu, na podstawie metryk stronniczości. Grupy poszkodowane to wartości docelowe lub zakresy, które są niedostatecznie reprezentowane w danych lub przewidywanych wynikach celu, na podstawie metryk stronniczości.

Informacje na temat sposobu użycia metryk stronniczości można znaleźć na stronie Dopuszczalne wartości dla metryk odchylenia.

Liczby w nawiasach opisują kryteria użyte do obliczenia metryki. Na przykład, jeśli metryka to różnica równych szans (EOD), kobiety (10%) i mężczyźni (80%) wskazuje na wskaźniki prawdziwie pozytywnych wyników wynoszące 80% dla mężczyzn i 10% dla kobiet.
Wynik docelowy odnosi się do wartości kolumny docelowej przewidywanej przez model.
Nie wszystkie metryki i wartości stronniczości są wyświetlane w zakładce Modele z powodu ograniczonej przestrzeni. Na przykład:
- W zależności od typu metryki i modelu, niektóre metryki i grupy mogą zawierać tylko wartości minimalne i maksymalne.
- Jeśli wiele metryk przekracza próg stronniczości dla cechy, wyświetlana jest metryka wskazująca najwyższy stopień niesprawiedliwości.
- W przypadku stronniczych cech w modelach klasyfikacji wieloklasowej wyświetlana jest tylko metryka wskazująca najwyższy stopień stronniczości.
Bardziej szczegółowe informacje są dostępne na karcie Analizuj oraz w raporcie z trenowania modelu. Zob. Szczegółowa analiza wyników stronniczości.
Więcej informacji na temat terminologii w tej sekcji można znaleźć w Terminologia na tej stronie.

Szczegółowa analiza wyników stronniczości

Możesz dokładniej przeanalizować wyniki stronniczości na karcie Analizuj.

Wykonaj następujące czynności:

W eksperymencie ML wybierz model i przejdź do zakładki Analizuj.
Otwórz arkusz Tendencja.
Wybierz między Tendencja danych a Tendencja modelu w zależności od pożądanej analizy.
W tabeli Cechy z potencjalną tendencją wybierz pojedynczą cechę.

Wykresy i metryki wskazujące na możliwą tendencję są wyświetlane z czerwonym tłem. Możesz wybierać cechy, klikając i rysując w wizualizacjach.

Metryki w tabeli są statyczne dla metryk odchylenia odpowiadających standardowym cechom. Dla przyszłych cech metryki odchylenia zmieniają się dynamicznie w zależności od wyboru grupy szeregów czasowych.

Analizowanie stronniczości modelu w szczegółowy sposób przy użyciu arkusza Stronniczość na karcie Analizuj. — Karta Analizuj pokazująca analizę odchylenia modelu dla wybranej cechy. Możliwe odchylenie jest wskazywane przez czerwone tła dla wykresów i metryk.

Więcej informacji na temat nawigowania po szczegółowych analizach modelu zawiera temat Szczegółowa analiza modelu.

Wyniki stronniczości w raportach szkoleniowych

Metryki stronniczości są również przedstawiane w raportach szkoleniowych ML.Są one uwzględnione w dedykowanej sekcji Stronniczość w raporcie.

Więcej informacji na temat raportów z uczenia zawiera temat Pobieranie raportów z uczenia maszynowego.

Eliminowanie stronniczości

Po przeanalizowaniu wyników wykrywania stronniczości dla Twoich modeli możesz chcieć wykonać jedną z następujących czynności:

Uruchom nowe wersje eksperymentów po usunięciu stronniczych cech.

Konfigurowanie nowej wersji
Unikaj wdrażania modeli, które wykazują stronniczość, zamiast tego wdrażaj modele, które spełniają zalecane kryteria dla metryk stronniczości.

Wdrażanie modeli
Zaktualizuj swój zbiór danych, aby skorygować wszelkie nieprawidłowe gromadzenie danych lub aby rozwiązać problem nierównych wskaźników reprezentacji.

Przygotowanie zestawu danych do trenowania
Zdefiniuj na nowo swój problem uczenia maszynowego, używając ustrukturyzowanych ram. Na przykład, jeśli Twoje pierwotne pytanie dotyczące uczenia maszynowego jest z natury stronnicze, modele prawdopodobnie zawsze będą zawodne w tworzeniu sprawiedliwych przewidywań.

Definiowanie pytań uczenia maszynowego

Praca z prognozowaniem wielowymiarowych szeregów czasowych

Terminologia na tej stronie

Na tej stronie, i w Qlik Predict, „grupy” to termin, który ma różne znaczenia w zależności od kontekstu:

„Grupy” odnoszą się do wartości lub zakresów w cechach, które są analizowane pod kątem stronniczości. Na przykład, cecha Stan cywilny może mieć cztery możliwe grupy w danych treningowych: Żonaty/Zamężna, Rozwiedziony/Rozwiedziona, W separacji lub Wdowiec/Wdowa.
W eksperymentach szeregów czasowych „grupy” odnoszą się do funkcji, która umożliwia śledzenie wyników docelowych dla określonych wartości zgodnych cech. Na tej stronie grupy te są nazywane „grupami szeregów czasowych”. Więcej informacji na temat tych grup można znaleźć w Grupy.

Ograniczenia

Istnieją pewne ograniczenia dotyczące rozmiarów zestawów danych szkoleniowych, jeśli wykrywanie stronniczości jest włączone. Zob. Ograniczenia zbioru danych szkoleniowych i profilowania.
Nie można aktywować wykrywania stronniczości dla:
- Cecha docelowa.
- Cechy wolnego tekstu (nawet jeśli typ cechy zostanie zmieniony na kategoryczny).
- Cechy daty, które są używane jako indeks daty w eksperymentach szeregów czasowych.
- Cechy daty poddawane automatycznej inżynierii. Możesz uruchomić wykrywanie stronniczości na tych cechach, ale nie aktywujesz ich niezależnie. Zamiast tego, aktywuj nadrzędną cechę daty do wykrywania stronniczości i upewnij się, że automatycznie zaprojektowane cechy daty są uwzględnione do szkolenia.

Dowiedz się więcej

Czy ta strona była pomocna?

Jeżeli natkniesz się na problemy z tą stroną lub jej zawartością — literówkę, brakujący krok lub błąd techniczny — daj nam znać!

Przekaż tu opinię