Analizowanie pochodzenia w Analytics

Pochodzenie śledzi dane i transformacje danych wstecz do oryginalnego źródła. Qlik Cloud zapewnia szczegółową wizualną reprezentację historii tego przepływu, umożliwiając interaktywne badanie pochodzenia wstecznego (upstream) zawartości analitycznej. Pochodzenie jest dostępne dla zawartości takiej jak aplikacje, skrypty, przepływy danych, przepisy na tabele, eksperymenty ML, wdrożenia ML i zestawy danych.

Aby wyświetlić pochodzenie zawartości analitycznej, dane leżące u jej podstaw muszą być przechowywane w Qlik Cloud jako skatalogowane źródło.

Użytkownicy biznesowi badający dane pole mają widok pochodzenia dla tego pola, który podsumowuje jego najważniejsze zależności:

Pola używane do jego wyprowadzenia
Bezpośrednie powiązania i zależności, w tym właściciel i przestrzeń
Oryginalne źródło (pierwsze znane źródło)

Aby wyświetlić zależności następcze (downstream) lub przyszłe, można zbadać, na jakie elementy wpłynęłaby zmiana obiektu, wyświetlając Analiza wpływu. Patrz Analizowanie analizy wpływu w Analytics.

Wizualną prezentację sposobu korzystania z pochodzenia zawiera sekcja:

Korzystanie z pochodzenia

Aby korzystać z pochodzenia, musisz mieć również uprawnienie Wyświetl pochodzenie ustawione na Dozwolone za pośrednictwem roli User Default lub niestandardowej roli zabezpieczeń.

Wykres pochodzenia

Wykres Pochodzenie przedstawia przepływ danych przez zawartość analityczną w postaci interaktywnego wykresu graficznego. Zasób, tabela lub pole są nazywane węzłami na wykresie pochodzenia. Gdy węzeł jest badanym węzłem bazowym, mówi się, że jest on aktywny (w centrum uwagi) i jest wyświetlany jako ostatni element na wykresie. Na najbardziej szczegółowym poziomie wykresy pochodzenia na poziomie pola pokazują źródła danych i transformacje, z których pochodzi dany węzeł lub od których jest zależny.

Wykresy pochodzenia są przydatne dla:

Ekspertów ds. danych pracujących z danymi
Specjalistów biznesowych tworzących aplikacje
Zaawansowanych użytkowników biznesowych korzystających z aplikacji
Użytkowników pracujących z modelami uczenia maszynowego

Każdy węzeł reprezentuje krok w pochodzeniu wybranej zawartości. Te informacje o pochodzeniu są kompilowane za każdym razem, gdy zasób analityczny odświeża swoje dane. Jeśli Twoja aplikacja, skrypt, przepływ danych lub przepis na tabelę nie były ostatnio odświeżane, pochodzenie może być niekompletne lub niedokładne.

Pochodzenie jest dostępne dla obsługiwanych typów zawartości z poziomu kafelka lub wiersza w postaci, w jakiej pojawiają się one w Twoim katalogu. Możesz analizować pochodzenie dla następującej zawartości analitycznej:

Zestaw danych: Zestawy danych to źródła danych, takie jak dane ładowane z łączników lub plików danych. Zestawy danych mogą być tabelami w bazie danych, danymi przesłanymi do magazynu danych lub danymi wygenerowanymi z aplikacji, takimi jak plik qvd. Zestawy danych zazwyczaj zawierają po jednej tabeli, ale niektóre, na przykład pliki Excel, mogą zawierać wiele tabel.

Zestawy danych opublikowane z poziomu Talend Studio są oznaczone ikoną . Możesz przejść do zadania Talend Management Console Job, które zostało użyte do wygenerowania zestawu danych, klikając Otwórz zadanie TMC w menu ... zestawu danych. Aby uzyskać więcej informacji, zobacz Publikowanie zestawów danych i pochodzenia w Qlik Cloud.
Aplikacja: Węzły aplikacji reprezentują aplikacje analityczne Qlik Sense, które korzystają ze źródeł danych w pochodzeniu. Węzły aplikacji wyświetlają nazwę aplikacji i lokalizację aplikacji jako Qlik Sense.
Skrypt: Węzły skryptów reprezentują skrypty utworzone w interfejsie Script.
Przepływ danych: Przepływy danych można badać w celu lepszego zrozumienia źródeł danych, z których korzystają i które transformują.
Przepis na tabelę: Przepisy na tabele można badać w celu lepszego zrozumienia źródła danych, z którego korzystają i które transformują.
Eksperyment ML: Możesz zrozumieć pochodzenie eksperymentu uczenia maszynowego, które składa się ze źródeł danych połączonych w celu wygenerowania danych treningowych dla modeli uczenia maszynowego.
Wdrożenie ML: Możesz zrozumieć pochodzenie wdrożenia ML i sposób jego wykorzystania w prognozach. Pochodzenie wdrożeń ML zazwyczaj składa się z eksperymentów ML, wersji eksperymentów, modeli i zestawów danych.

Typowe węzły wejściowe obejmują źródła danych używane przez węzeł bazowy lub aplikacje generujące zestawy danych. Pochodzenie na poziomie pola pozwala na szczegółowe zbadanie sposobu obliczania pól i ich konkretnego pochodzenia w różnych transformacjach i aplikacjach.

Węzły dostępne na wykresie pochodzenia to dane wejściowe dla wybranej zawartości. Wybierz element, aby wyznaczyć go jako węzeł bazowy. Węzły wejściowe to węzły znajdujące się przed węzłem bazowym (upstream).

Węzły dostępne na wykresie pochodzenia to dane wejściowe dla wybranego węzła bazowego, czyli węzła aktywnego (w centrum uwagi). Węzeł bazowy to pojedynczy węzeł, dla którego chcesz pobrać pochodzenie; może to być na przykład aplikacja, przepływ danych, eksperyment ML, zestaw danych, plik, tabela lub pole.

Będzie to skrajny prawy węzeł na ekranie, obwiedziony niebieską ramką. Jest on centrum uwagi Twojego badania i prezentowane będą tylko dane wejściowe do tego węzła bazowego.

Podczas badania pochodzenia możesz interaktywnie zmienić węzeł bazowy na inną tabelę, aplikację, pole lub inny element na ekranie, aby skupić na nim swoje badanie.

Aktywny węzeł (w centrum uwagi), zwany również węzłem bazowym, będzie znajdować się po prawej stronie ekranu — Węzeł bazowy pochodzenia

Linie łączące węzły to krawędzie. Krawędzie reprezentują relację jednego węzła z innym. Reprezentują one relacje wskazujące na powiązania, takie jak zestaw danych używany przez aplikację. Mogą również reprezentować dane wygenerowane jako produkt uboczny aplikacji. Zbiór węzłów i krawędzi tworzy razem wykres pochodzenia.

Krawędzie reprezentują relacje między obiektami — Krawędzie pochodzenia reprezentują relacje

Węzły zwijają się lub rozwijają, ujawniając poziomy hierarchii od ogólnych do bardziej szczegółowych, zaczynając od grupy zestawów danych wyższego poziomu lub aplikacji, aż po najbardziej szczegółowy poziom, którym jest poziom pola.

Węzeł z poziomami zasobu, zasobu danych, tabeli i pola — Na tym obrazie węzła pokazano następujące poziomy hierarchii, od najwyższego (najbardziej ogólnego) do najniższego (najbardziej szczegółowego): zasób danych (aplikacja), zasób (zestaw danych), tabela i pola.

Otwieranie wykresu pochodzenia

Wykonaj następujące czynności:

Otwórz centrum aktywności Insights lub Analytics.
Wybierz Narzędzia > Pochodzenie w menu kontekstowym elementu, który obsługuje pochodzenie.

Możesz również uzyskać dostęp do wykresu pochodzenia niektórych treści, gdy masz otwarty dany element. Kliknij Więcej i wybierz Pochodzenie.

Szczegóły węzła

Szczegóły są ograniczone przez Twój dostęp do tego obiektu. Szczegóły mogą dostarczyć następujących informacji:

Nazwa
Opis
Tagi
Lokalizacja
Przestrzeń
Właściciel
Twórca
Ostatnia modyfikacja

Nawigacja po wykresie pochodzenia

Kliknij i przeciągnij wykres, aby nawigować i wyśrodkować wykres pochodzenia. Możesz również użyć przycisków nawigacyjnych. Wybierz ikonę Home Strona główna , aby wyśrodkować wykres pochodzenia na węźle bazowym. Klikaj wstecz i w przód, aby poruszać się po dokonanych wyborach.

Przyciski nawigacyjne dla wykresu pochodzenia. — Nawigacja po wykresie pochodzenia

Wykres Pochodzenie pokazuje zależności wsteczne (upstream) dla Twojej zawartości analitycznej, która jest prezentowana jako domyślny węzeł po otwarciu dla niej wykresu. Możesz uzyskać dostęp do pochodzenia (wstecznego) lub analizy wpływu (następczego) dla innych węzłów pojawiających się na wykresie, wybierając Więcej i Pochodzenie (nowy węzeł bazowy) lub Analiza wpływu. Wybierz węzeł, aby wyznaczyć go jako węzeł bazowy.

Rozwiń Strzałka w dół lub zwiń Strzałka w górę węzły, aby rozwinąć lub zwinąć grupy obiektów na tym samym poziomie.

Opcja menu do analizowania różnych węzłów

Widok podsumowania pochodzenia w aplikacji

Widok podsumowania pochodzenia w aplikacji może zapewnić użytkownikom biznesowym ogólny przegląd zależności wstecznych (upstream) w aplikacji. Aby uzyskać więcej informacji, zobacz Widok podsumowania pochodzenia w aplikacji.

Analizowanie pochodzenia dla zawartości uczenia maszynowego

Możesz użyć wykresu Pochodzenie do analizy pochodzenia zawartości uczenia maszynowego, w tym eksperymentów ML, wdrożeń ML i zestawów danych. Użyj wykresu, aby uzyskać całościowy widok sposobu tworzenia modeli uczenia maszynowego, danych, na których zostały przeszkolone, oraz tego, do czego są używane w scenariuszach produkcyjnych.

Eksperymenty, wdrożenia i zestawy danych pojawiają się również jako węzły podczas analizowania innej zawartości na wykresie Pochodzenie, takiej jak aplikacje następcze (downstream).

Zasoby uczenia maszynowego są również wyświetlane w sekcji Analiza wpływu w celu kompleksowej analizy zawartości następczej (downstream). Aby uzyskać więcej informacji, zobacz Analizowanie analizy wpływu w Analytics.

Otwieranie sekcji Pochodzenie dla zawartości uczenia maszynowego

Wykonaj jedną z poniższych czynności:

W swoim centrum aktywności kliknij obok eksperymentu ML, wdrożenia ML lub zestawu danych i wybierz Narzędzia > Pochodzenie.
W eksperymencie ML lub wdrożeniu ML kliknij na pasku nawigacyjnym i wybierz Pochodzenie.

Nawigacja po sekcji Pochodzenie dla zawartości uczenia maszynowego

Węzły uczenia maszynowego bada się w taki sam sposób, jak inną zawartość. Przeglądy interfejsu zawierają sekcje:

Wykres pochodzenia
Nawigacja po wykresie pochodzenia

Rozpoznawanie elementów uczenia maszynowego na wykresie Pochodzenie

W poniższej tabeli opisano typowe elementy związane z uczeniem maszynowym, które pojawiają się na wykresie Pochodzenie.

Typowe elementy pochodzenia dla uczenia maszynowego
Element	Ikona (ikony)	Objaśnienie
Pamięć masowa plików		Nie dotyczy wyłącznie zawartości uczenia maszynowego. Pokazuje lokalizację, w której przechowywany jest zestaw danych (w większości przypadków w przestrzeni). Ma zastosowanie do zestawu danych treningowych, eksportów z wbudowanych analiz w eksperymencie, zestawów danych stosowania używanych do prognoz oraz wyjściowych zestawów danych prognoz.
Zestaw danych	Wiele (na przykład dla QVD)	Nie dotyczy wyłącznie zawartości uczenia maszynowego. Służy do reprezentowania zestawów danych treningowych, eksportów z wbudowanych analiz w eksperymencie, zestawów danych stosowania oraz wyjściowych zestawów danych prognoz.
Eksperyment ML		Eksperyment ML, w którym trenowane są modele.
Wersja eksperymentu ML		Wersja w ramach eksperymentu ML, w której przeszkolono jeden lub więcej modeli.
Model ML		Model ML przeszkolony w ramach wersji eksperymentu. Służy do reprezentowania przeszkolonych modeli w eksperymencie ML oraz wdrożonych modeli we wdrożeniu ML.
Wdrożenie ML		Wdrożenie ML zawierające jeden lub więcej wdrożonych modeli.
Brak ikony	-	Węzły wyjściowe prognoz w ramach wdrożenia ML nie mają ikon. Pola zawarte w wyjściowym zestawie danych prognoz również nie mają ikon.

Pochodzenie i eksperymenty ML

Eksperymenty ML są prezentowane w układach grupowych. Rozwijają się w następujący sposób:

Eksperyment ML rozwija się w jedną lub więcej wersji eksperymentu.
Wersja eksperymentu rozwija się w jeden lub więcej modeli ML.

Gdy model przeszkolony w eksperymencie zostanie wdrożony we wdrożeniu ML, pojawia się on na wykresie pochodzenia, gdy jako węzeł bazowy zostanie wybrana zawartość następcza (downstream, na przykład prognozy lub wdrożenia ML).

Pochodzenie i wdrożenia ML

Wdrożenia ML są prezentowane w układach grupowych. Rozwijają się w następujący sposób:

Wdrożenie ML rozwija się w jeden lub więcej wdrożonych modeli.
Jeśli model we wdrożeniu został użyty w prognozach wsadowych, model rozwija się, pokazując wyniki poszczególnych prognoz wsadowych.

Pochodzenie na poziomie pola jest dostępne dla zestawów danych stosowania i wyjściowych zestawów danych prognoz powiązanych z wdrożeniem ML.

Wdrożone modele używane do prognoz są powiązane z eksperymentem, w którym zostały przeszkolone.

Przykładowy scenariusz

Przykładowy scenariusz zawiera sekcja Przykład: Badanie pochodzenia zawartości uczenia maszynowego.

Ograniczenia

Wykres pochodzenia ma następujące ograniczenia:

Aplikacje, które nie zostały przeładowane po udostępnieniu pochodzenia w Qlik Cloud, mogą nie mieć dostępnych pełnych informacji o pochodzeniu, dopóki nie zostaną przeładowane. Szczegóły dotyczące niektórych węzłów mogą być ograniczone, jeśli nie zostały załadowane po włączeniu pochodzenia dla Twojej dzierżawy.
Szczegóły węzłów dla zestawów danych spoza Twojej dzierżawy, takich jak połączenia SQL Server lub Google Drive, są ograniczone do typu zestawu danych i nazwy. Połączenia REST wyświetlają jedynie informację, że są to dane REST.
Jeśli element zostanie usunięty, może nadal być wyświetlany w sekcji Pochodzenie podczas analizowania innych węzłów.

Uprawnienia

Musisz mieć możliwość wyświetlania elementu, aby móc wyświetlić jego pochodzenie ze swoich centrów aktywności. Jeśli widzisz wykres pochodzenia dla węzła bazowego, możesz zobaczyć podstawowe szczegóły i metadane dla obiektów pochodzenia wstecznego (upstream).

Zabezpieczenia

Użytkownik może zmienić węzeł bazowy tylko na taki, do którego ma dostęp; w przeciwnym razie menu kontekstowe jest niedostępne.
Jeśli użytkownik ma dostęp do węzła bazowego, będzie miał dostęp do wyświetlania całego pochodzenia wstecznego (upstream).

Przykładowe przypadki użycia do analizy pochodzenia

Przewodnik po analizie pochodzenia zawiera sekcja Przypadki użycia pochodzenia na poziomie pola.

Przykład: Badanie pochodzenia informacji za pomocą widoku podsumowania pochodzenia

Jako odbiorca analiz patrzący na wykres słupkowy w aplikacji cars-data4-app, chcesz wiedzieć, skąd pochodzą te informacje. Upewniasz się, że opcje Pokaż szczegóły i Pokaż wyrażenia są włączone dla wykresu w sekcji Wygląd > Ogólne we właściwościach, a następnie przechodzisz do trybu analizy arkusza. Kliknij wykres prawym przyciskiem myszy lub użyj menu icon more actions i wybierz Pokaż szczegóły, aby wyświetlić widok pochodzenia dla odbiorcy. Kliknij Pokaż zależności.

Widzisz, że wymiar Car_ID jest zależny od pola Car_ID, które znajduje się w trzech wymienionych źródłach CSV. Wybierz menu icon more actions przy wpisie pola i wybierz Pochodzenie - Car_ID / Cars, aby otworzyć wykres pochodzenia dla pola Car_ID w aplikacji.

Wybierz menu, a następnie opcję wyświetlenia pochodzenia dla źródła w widoku podsumowania pochodzenia dla odbiorcy — Wybierz źródło lub pole, aby wyświetlić pochodzenie tego obiektu

Wykres pochodzenia jest przeglądany od prawej do lewej i pokazuje, że pole Car_ID znajduje się w tabeli Cars, która została załadowana do aplikacji cars-data4-app. Rozwiń Strzałka w dół węzły, śledząc historię pola wstecz do oryginalnego pliku przesłanego do Qlik Cloud. Zobaczysz, że pierwsze powiązanie wstecz pokazuje, że plik CSV cars-data.csv zawierający pole Car_ID został załadowany do aplikacji cars-data4-app. Kolejnym węzłem wstecz jest aplikacja cars-data3-app, z której wygenerowano plik cars-data.csv. Cofając się o jeszcze jedno powiązanie i rozwijając węzeł, zobaczysz, że oryginalnym plikiem źródłowym był plik CSV cars-data3.csv i zawierał on pole ID.

Rozwijając tabele i przeglądając pola, możesz zidentyfikować oryginalny plik źródłowy, tabelę i pole wymiaru wykresu słupkowego Car_id-ID.

Zacznij od aktywnego węzła (w centrum uwagi) i prześledź historię pochodzenia wstecz do oryginalnego źródła — Rozwiń węzły, aby prześledzić historię pola wstecz do pliku źródłowego

Przykład: Badanie pochodzenia zestawu danych i sposobu jego utworzenia

Jako programista aplikacji rozważasz użycie istniejącego zestawu danych current_customers_analytics.xlsx w swojej aplikacji. Badasz pochodzenie tego zestawu danych, aby zrozumieć, skąd pochodzą dane. Z poziomu kafelka lub wiersza zestawu danych wybierz Pochodzenie z menu Więcej , aby otworzyć wykres pochodzenia. Z poziomu wykresu pochodzenia możesz wyświetlić metadane zestawu danych, wybierając menu icon more actions przy pliku XLSX current_customers_analytics.xlsx i klikając Otwórz przegląd.

Przegląd zestawu danych można otworzyć z poziomu wykresu pochodzenia — Otwórz przegląd zestawu danych z poziomu wykresu pochodzenia

Dostęp do przeglądów zestawów danych można uzyskać z poziomu wykresu pochodzenia — Wyświetlaj tagi, klasyfikacje i inne metadane techniczne na karcie przeglądu zestawu danych

Karta profilu pól jest dostępna z poziomu wykresu pochodzenia — Profil danych jest dostępny na karcie Profil

Kliknij strzałkę wstecz w przeglądarce, aby powrócić do wykresu pochodzenia i zbadać wykres pochodzenia dla zestawu danych. Rozwiń Strzałka w dół węzeł current_customers_analytics.xlsx i kliknij Zaznacz wszystko, aby wyświetlić dostępne pola. Zrób to samo dla wszystkich węzłów. Zwróć uwagę, że każde pole oferuje opcję uczynienia go aktywnym węzłem bazowym poprzez wybranie Pochodzenie (nowy węzeł bazowy) lub wybranie Analiza wpływu w celu wyświetlenia pochodzenia następczego i obiektów zależnych, na które wpłyną zmiany w zestawie danych.

Wyświetlanie pochodzenia dla zestawu danych — Rozwinięty wykres Pochodzenie dla zestawu danych. Każde pole w każdym węźle będzie miało opcje otwarcia aplikacji lub danych, wyświetlenia analizy wpływu lub zmiany aktywnego węzła

Śledząc pochodzenie wstecz i rozwijając węzły, można zauważyć, że ten zestaw danych XLSX jest wynikiem działania aplikacji Prep Current Customers Sales - Analytics. Cofając się o kolejne powiązanie i rozwijając węzeł Pamięć masowa plików, zobaczysz, że do aplikacji do analizy sprzedaży załadowano plik CSV: rgb_customers.csv. Analiza na poziomie pola ujawnia, że pole Tags w oryginalnym pliku źródłowym zostało przemianowane na rgb_customers.Tags w aplikacji do analizy sprzedaży. Oryginalny plik CSV można otworzyć w widoku przeglądu, aby ujawnić cenne metadane, takie jak właściciel, twórca, wskaźniki użycia, tagi, klasyfikacje, profil pola i analiza wpływu.

Przykład: Badanie pochodzenia zawartości uczenia maszynowego

Zwykły użytkownik biznesowy lub ekspert ds. uczenia maszynowego może użyć wykresu Pochodzenie do zbadania pochodzenia określonych wartości prognozowanych. Po ustawieniu węzła bazowego na zestaw danych prognoz użytkownik ten może zobaczyć:

Dane treningowe, w tym ich źródła i transformacje
Eksperyment, wersję eksperymentu i model
Miejsce wdrożenia modelu oraz sposób jego wykorzystania

Wykres pochodzenia pokazujący pełny przepływ od przygotowania danych treningowych do zestawu danych prognoz — Wykres pochodzenia ze wszystkimi rozwiniętymi węzłami. Wykres pokazuje pełny przepływ od przygotowania danych treningowych do zestawu danych prognoz.

Powyższy obraz przedstawia następujący proces:

Przepływ danych ładuje i transformuje dane z zestawu danych CSV przechowywanego w przestrzeni prywatnej . Wynik jest zapisywany w zestawie danych Parquet w tej samej przestrzeni.
Zestaw danych Parquet jest używany w wersji 1 eksperymentu ML . Ta wersja eksperymentu trenuje model ML .
Model ML zostaje wdrożony we wdrożeniu ML .
Używając zestawu danych CSV w przestrzeni prywatnej jako zestawu danych stosowania, wdrożenie ML generuje zestaw danych prognoz w formacie Parquet .

Pochodzenie w Data Integration

Wykres Pochodzenie jest również dostępny w Data Integration. Aby uzyskać więcej informacji, zobacz Analizowanie pochodzenia w Data Integration.

Czy ta strona była pomocna?

Jeżeli natkniesz się na problemy z tą stroną lub jej zawartością — literówkę, brakujący krok lub błąd techniczny — daj nam znać!

Przekaż tu opinię