Odkrywanie głównych czynników wpływających na dane za pomocą analizy kluczowych czynników
Dzięki analizie kluczowych czynników można identyfikować i porównywać źródła określonych trendów w danych. Analiza kluczowych czynników pomaga wizualizować i klasyfikować wpływ, jaki zdefiniowany zestaw czynników ma na bieżące dane dla określonego pola docelowego. Wykorzystaj odkryte spostrzeżenia, aby ulepszyć i wzmocnić procesy analityczne i decyzyjne w swojej organizacji.
Analiza kluczowych czynników jest dostępna w aplikacji Qlik Sense. Przeprowadź analizę kluczowych czynników w widoku arkusza w trybie analizy.
Analiza kluczowych czynników nie jest dostępna w Qlik Sense Business, Qlik Cloud Analytics Standard ani Qlik Anonymous Access.
Analiza kluczowych czynników w aplikacji Qlik Sense
Czym jest analiza kluczowych czynników?
Analiza kluczowych czynników to forma statystycznego odkrywania danych, która pozwala określić stopień, w jakim różne czynniki wpływają na wynik pojedynczej metryki docelowej. Analiza jest przeprowadzana zarówno dla danych ilościowych, jak i jakościowych. Celem analizy kluczowych czynników jest dokładne ustalenie, co powoduje określony trend w danych, i wykorzystanie tych spostrzeżeń do podjęcia bezpośrednich działań lub poprawy świadomości organizacyjnej.
W analityce biznesowej typowymi celami, dla których warto ocenić czynniki wpływające, są pola, takie jak Sprzedaż, Zadowolenie klienta, Marża, Odejścia i Koszt sprzedaży. Przykłady czynników (kluczowych czynników) obejmują Produkt, Lokalizacja, Numer sklepu i Menedżer.
Metryki oceniane w analizie kluczowych czynników różnią się w zależności od organizacji i przypadku użycia. Metryka docelowa oraz różne czynniki wpływające na jej wyniki zależą od problemu, który chcesz rozwiązać, dostępnych danych i innych czynników.
Dlaczego warto korzystać z analizy kluczowych czynników?
Analiza kluczowych czynników jest przydatna w analityce biznesowej, ponieważ można ją zastosować na wiele sposobów w celu poprawy kluczowych wskaźników wydajności. Możesz użyć analizy kluczowych czynników do rozwiązywania problemów i uzyskiwania spostrzeżeń związanych z inwestycjami w produkty, zwiększaniem przychodów, redukcją kosztów, zadowoleniem klientów i wieloma innymi.
W Qlik Sense analiza kluczowych czynników jest zintegrowana ze środowiskiem użytkownika aplikacji. Korzystając z natywnych dla Qlik Sense możliwości analizy danych w czasie rzeczywistym, możesz uruchamiać nową analizę kluczowych czynników za każdym razem, gdy zmieniają się dane aplikacji. Pozwala to na ciągłe monitorowanie danych pod kątem zmian i szybkie odkrywanie pojawiających się trendów, dzięki czemu można podejmować szybkie i skuteczne działania tam, gdzie jest to potrzebne.
Jak to działa
Analiza kluczowych czynników koncentruje się wokół idei wpływu. W Qlik Sense analiza kluczowych czynników ocenia wpływ, jaki określone pola (cechy lub kluczowe czynniki) mają na konkretne pole zainteresowania (cel).
Dane używane w analizie
Analiza kluczowych czynników to specyficzne badanie podzbioru danych. Podczas tworzenia analizy wybierasz określone pola jako komponenty analizy.
Dla każdej analizy należy wybrać następujące elementy składowe:
-
Cel
-
Wiele cech
Po wybraniu tych komponentów z modelu danych tworzony jest określony zestaw danych przy użyciu celu i cech. Analiza kluczowych czynników wykorzystuje ten zestaw danych, a nie cały model danych, do określenia wpływu, jaki cechy mają na cel. Pola, których nie uwzględnisz w konfiguracji, nie są analizowane.
Więcej informacji o każdym komponencie znajduje się poniżej.
Obliczanie wpływu
W Qlik Sense analiza kluczowych czynników jest przeprowadzana poprzez obliczenie wartości SHAP dla każdej wartości danych cechy w analizowanym podzbiorze danych. Te wartości SHAP są generowane z modelu wytrenowanego przez Qlik Predict. Modele wykorzystują algorytm lasu losowego do generowania wartości SHAP.
Wartość SHAP to obliczenie stopnia wpływu, jaki wartość danych ma na odpowiadającą jej wartość docelową, w odniesieniu do innych cech w zestawie danych utworzonym specjalnie na podstawie konfiguracji analizy kluczowych czynników. Przeglądając wyniki analizy kluczowych czynników, przeglądasz agregacje wartości SHAP dla wszystkich lub określonego zestawu rekordów w zestawie danych.
Więcej informacji na temat ważności SHAP w Qlik Predict można znaleźć w sekcji Omówienie ważności SHAP w uczeniu eksperymentów.
Cel
Cel to pole, dla którego chcesz przeanalizować kluczowe czynniki. Na przykład możesz chcieć porównać, jak pewne czynniki wpływają na Twoją sprzedaż. W takim przypadku jako cel wybierzesz miarę sprzedaży.
Przy wyborze celu ważny jest czas dostępności danych, w szczególności w odniesieniu do cech, które zdecydujesz się uwzględnić w analizie. Więcej informacji na temat odpowiednich ram czasowych gromadzenia danych dla celu i cech można znaleźć w sekcji Cechy.
Liczba unikalnych wartości i typ danych w celu określa rodzaj problemu, który rozwiąże analiza. To z kolei wpływa na wymagania, jakie muszą spełniać Twoje dane. Więcej informacji można znaleźć w sekcji Wymagania dotyczące danych.
Analiza kluczowych czynników obsługuje następujące typy problemów:
-
Regresja
-
Klasyfikacja binarna
Analizy regresji
Analizy regresji są używane, gdy cel zawiera dużą liczbę unikalnych wartości liczbowych. Jeśli jako cel użyjesz obliczenia liczbowego (miary), analiza kluczowych czynników prawdopodobnie zinterpretuje konfigurację jako problem regresji.
Wybierając miarę jako cel, możesz zastosować podstawową agregację bezpośrednio do pola w konfiguracji lub wybrać istniejący element główny, jeśli chcesz użyć bardziej złożonego wyrażenia.
Analizy klasyfikacji binarnej
Jeśli Twój cel zawiera tylko dwie unikalne wartości (na przykład tak lub nie), analiza kluczowych czynników interpretuje konfigurację jako problem klasyfikacji binarnej. Analizy klasyfikacji binarnej są tworzone poprzez wybranie wymiaru binarnego jako celu.
Jako powszechny przykład, jeśli w aplikacji masz pole Odejścia do śledzenia, którzy klienci zrezygnowali z określonej usługi, możesz wybrać pole Odejścia jako cel, aby odkryć, jakie czynniki kierują tymi decyzjami klientów.
Cechy
Cechy to Twoje kluczowe czynniki. Są to pola zawierające możliwe do wyodrębnienia informacje o tym, co wpływa na trendy w danych. Na przykład podczas tworzenia analizy kluczowych czynników w celu zidentyfikowania czynników wpływających na sprzedaż, jako cechy można wybrać wymiary, takie jak Lokalizacja, Typ produktu, Numer sklepu i Przedstawiciel handlowy. Obliczone miary mogą być również używane jako cechy.
Należy uwzględniać tylko cechy zawierające dane, które można zarejestrować i zebrać przed punktem w czasie, w którym gromadzone są dane docelowe. Jeśli uwzględnisz cechy zawierające dane, które byłyby znane dopiero w momencie gromadzenia danych dla celu, analiza będzie zniekształcona i nie zapewni wartości analitycznej.
Na przykład, jeśli Twoim celem jest Sprzedaż, nie powinieneś uwzględniać cech zawierających dane bezpośrednio z niej pochodzące. Podobnie, jeśli Twoim celem jest pole Odejścia z wynikiem binarnym (Tak lub Nie), nie powinieneś uwzględniać cechy zawierającej datę odejścia klienta.
Więcej informacji na temat identyfikowania nieprawidłowych wyników analizy można znaleźć w sekcji Identyfikowanie nieprawidłowych wyników.
Cesze przypisywany jest jeden z dwóch następujących typów:
-
Cecha kategoryczna: taka, która zawiera wartości danych oparte na odrębnych, powtarzających się kategoriach. Przykładem cechy kategorycznej może być pole Kontynent, w którym istnieje tylko kilka możliwych wartości i nie są one interpretowane jako surowe dane liczbowe, ale jako tekst. Liczby mogą być używane jako kategorie.
-
Cecha liczbowa: taka, w której wartości danych są wyłącznie danymi liczbowymi i nie należą do kategorii.
Wszystkie uwzględnione cechy są specjalnie analizowane w celu określenia, jak duży wpływ każda z nich ma na bieżące dane w celu.
Więcej informacji na temat wymagań dotyczących celu i uwzględnionych cech można znaleźć w sekcji Wymagania dotyczące danych.
Wybory w aplikacji
Wybory dokonane w aplikacji są używane w analizie kluczowych czynników. Na przykład możesz chcieć odkryć kluczowe czynniki dla sprzedaży, ale uwzględniając wymiar Numer sklepu jako cechę, możesz chcieć przeanalizować wpływ tylko pięciu konkretnych sklepów w Twojej organizacji. Aby to zrobić, możesz wybrać wartości w aplikacji, a następnie skonfigurować analizę kluczowych czynników.
Ponieważ wybory są w zasadzie filtrami stosowanymi do modelu danych, należy pamiętać, że dokonywanie wyborów w jednym polu może wpłynąć na dostępne dane, które można wykorzystać w analizie.
Kwestie dotyczące subskrypcji dzierżawy
Analiza kluczowych czynników opiera się na Qlik Predict w celu obliczenia wpływu cech na cel. Robi to poprzez tworzenie modeli uczenia maszynowego, które są używane do obliczania wartości SHAP dla punktów danych odpowiadających uwzględniononym cechom w wybranym podzbiorze danych.
Tworzenie analizy kluczowych czynników zużywa usługi mierzone przez Qlik Predict. Pewna ilość użycia Qlik Predict jest uwzględniona w większości subskrypcji Qlik Cloud. Jeśli potrzebna jest większa pojemność, wymagana jest aktualizacja do płatnego poziomu Qlik Predict.
Skontaktuj się z właścicielem konta usługi i zapoznaj się z warunkami używanej subskrypcji, aby dowiedzieć się, jaka jest Twoja pojemność w zakresie korzystania z analizy kluczowych czynników.
Poniższe zasoby mogą dostarczyć dodatkowych szczegółów:
-
Opis produktu dla Subskrypcji Qlik Cloud®
Wymagania dotyczące danych
Minimalne wymagania dotyczące ilości danych
Zestaw danych utworzony z celu i cech musi mieć co najmniej 400 komórek. W przeciwnym razie nie można uruchomić analizy.
Inne wymagania
Następujące wymagania dotyczą zestawu danych utworzonego z konfiguracji analizy:
-
Cel musi zawierać co najmniej dwie unikalne wartości.
-
Jeśli cel zawiera od dwóch do dziesięciu unikalnych wartości, każda unikalna wartość musi pojawić się w co najmniej dziesięciu rekordach w zestawie danych.
Jeśli podczas uruchamiania analizy kluczowych czynników wystąpią błędy, może to oznaczać, że dane wybrane do analizy nie spełniają tych wymagań. Informacje o innych problemach, które można napotkać, oraz listę możliwych rozwiązań można znaleźć w sekcji Rozwiązywanie problemów .
Korzystanie z analizy kluczowych czynników w Qlik Sense
Poniższe tematy pomocy mogą pomóc w rozpoczęciu tworzenia i interpretowania analiz kluczowych czynników w Qlik Sense:
Ograniczenia
Poniżej znajduje się lista ograniczeń dotyczących analizy kluczowych czynników:
-
Pola zawierające typy danych daty, godziny lub znacznika czasu nie są obsługiwane jako cel ani jako cechy.