Analiza pochodzenia w Analytics | Qlik Cloud Pomoc
Przeskocz do zawartości głównej Przejdź do treści uzupełniającej

Analiza pochodzenia w Analytics

Pochodzenie śledzi dane i transformacje danych wstecz do oryginalnego źródła. Qlik Cloud zapewnia szczegółową wizualną reprezentację historii tego przepływu, w której można interaktywnie badać pochodzenie zasobów analitycznych w górę strumienia. Pochodzenie jest dostępne dla takich treści, jak aplikacje, skrypty, przepływy danych, przepisy na tabele, eksperymenty uczenia maszynowego (ML), wdrożenia ML i zestawy danych.

InformacjaAby wyświetlić pochodzenie dla treści analitycznych, podstawowe dane muszą być przechowywane w Qlik Cloud jako skatalogowane źródło.

Użytkownicy biznesowi badający dane pole mają widok pochodzenia dla tego pola, który podsumowuje jego najważniejsze zależności:

  • Pola, które są używane do jego wyprowadzenia
  • Bezpośrednie powiązania i zależności, w tym właściciel i przestrzeń
  • Oryginalne źródło (pierwsze znane źródło)

Aby wyświetlić zależności w dół strumienia lub wybiegające w przyszłość, można zbadać, na jakie elementy wpłynęłaby zmiana obiektu, wyświetlając Analizę wpływu. Zobacz Analizowanie analizy wpływu w Analytics.

Aby obejrzeć wizualną demonstrację korzystania z pochodzenia, zobacz:

Korzystanie z pochodzenia

Informacja

Aby korzystać z pochodzenia, musisz również mieć ustawienie Wyświetl pochodzenie na Dozwolone za pośrednictwem User Default lub niestandardowej roli zabezpieczeń.

Wykres pochodzenia

Wykres Pochodzenie pokazuje przepływ danych przez treści analityczne na interaktywnym, graficznym wykresie. Zasób, tabela lub pole nazywane są węzłem na wykresie pochodzenia. Gdy węzeł jest badanym węzłem bazowym, mówi się, że jest w centrum uwagi i wyświetla się jako ostatni element na wykresie. Na najbardziej szczegółowym poziomie wykresy pochodzenia na poziomie pola pokazują źródła danych i transformacje, z których pochodzi węzeł lub od których jest zależny.

Wykresy pochodzenia są przydatne dla:

  • Ekspertów ds. danych pracujących z danymi

  • Specjalistów biznesowych tworzących aplikacje

  • Zaawansowanych użytkowników biznesowych korzystających z aplikacji

  • Użytkowników pracujących z modelami uczenia maszynowego

Każdy węzeł reprezentuje krok w pochodzeniu wybranej treści. Te informacje o pochodzeniu są kompilowane za każdym razem, gdy zasób analityczny odświeża swoje dane. Jeśli Twoja aplikacja, skrypt, przepływ danych lub przepis na tabelę nie były ostatnio odświeżane, pochodzenie może być niekompletne lub niedokładne.

Pochodzenie jest dostępne dla obsługiwanych typów treści z kafelka lub wiersza, tak jak pojawiają się one w Twoim katalogu. Możesz analizować pochodzenie dla następujących treści analitycznych:

  • Zestaw danych: Zestawy danych to źródła danych, takie jak dane ładowane z łączników lub plików danych. Zestawy danych mogą być tabelami w bazie danych, danymi przesyłanymi do magazynu danych lub danymi generowanymi z aplikacji, takimi jak plik qvd. Zestawy danych zazwyczaj mają po jednej tabeli, ale niektóre, takie jak pliki Excel, mogą mieć wiele tabel.

    Zestawy danych opublikowane z Talend Studio są oznaczone ikoną Talend Studio. Możesz przejść do zadania Talend Management Console, które zostało użyte do wygenerowania zestawu danych, klikając Otwórz zadanie TMC w menu ... zestawu danych. Aby uzyskać więcej informacji, zobacz Publikowanie zestawów danych i pochodzenia w Qlik Cloud.

  • Aplikacja: Węzły aplikacji reprezentują aplikacje analityczne Qlik Sense, które używają źródeł danych w pochodzeniu. Węzły aplikacji wyświetlają nazwę aplikacji i lokalizację aplikacji jako Qlik Sense.

  • Scrypt: Węzły skryptów reprezentują skrypty utworzone w interfejsie Skrypt.

  • Przepływ danych: Przepływy danych można badać w celu lepszego zrozumienia źródeł danych, których używają i które transformują.

  • Przepis na tabelę: Przepisy na tabele można badać w celu lepszego zrozumienia źródła danych, którego używają i które transformują.

  • Eksperyment ML: Możesz zrozumieć pochodzenie eksperymentu uczenia maszynowego, które składa się ze źródeł danych połączonych w celu wyprodukowania danych treningowych dla modeli uczenia maszynowego.

  • Wdrożenie ML: Możesz zrozumieć pochodzenie wdrożenia ML i sposób jego wykorzystania w predykcjach. Pochodzenie dla wdrożeń ML zazwyczaj składa się z eksperymentów ML, wersji eksperymentów, modeli i zestawów danych.

Typowe węzły wejściowe obejmują źródła danych używane przez węzeł bazowy lub aplikacje generujące zestawy danych. Pochodzenie na poziomie pola pozwala na szczegółowe badanie sposobu obliczania pól i ich konkretnego pochodzenia w różnych transformacjach i aplikacjach.

Węzły dostępne na wykresie pochodzenia to dane wejściowe do wybranej treści. Wybierz element, aby wyznaczyć go jako węzeł bazowy. Węzły wejściowe to węzły znajdujące się w górę strumienia od węzła bazowego.

Wykres pochodzenia na poziomie pola

Wykres pochodzenia na poziomie pola

Węzły dostępne na wykresie pochodzenia to dane wejściowe do wybranego węzła bazowego, czyli węzła będącego w centrum uwagi. Węzeł bazowy to pojedynczy węzeł, dla którego chcesz pobrać pochodzenie; na przykład może to być aplikacja, przepływ danych, eksperyment ML, zestaw danych, plik, tabela lub pole.

Będzie to węzeł znajdujący się najbardziej po prawej stronie ekranu i obrysowany na niebiesko. Jest to główny obiekt Twojego badania i prezentowane będą tylko dane wejściowe do tego węzła bazowego.

Podczas eksploracji pochodzenia możesz interaktywnie zmienić węzeł bazowy na inną tabelę, aplikację, pole lub inny element na ekranie, aby skupić swoje badanie.

Węzeł bazowy pochodzenia

Węzeł w centrum uwagi, zwany również węzłem bazowym, będzie znajdował się po prawej stronie ekranu

Linie łączące węzły to krawędzie. Krawędzie reprezentują relację węzła z innym węzłem. Reprezentują one relacje wskazujące powiązania, takie jak zestaw danych używany przez aplikację. Mogą również reprezentować dane generowane jako produkt uboczny aplikacji. Zbiór węzłów i krawędzi tworzy razem wykres pochodzenia.

Krawędzie pochodzenia reprezentują relacje

Krawędzie reprezentują relacje między obiektami

Węzły zwijają się lub rozwijają, aby ujawnić poziomy hierarchii od ogólnych do bardziej szczegółowych, zaczynając od grupy zestawów danych wyższego poziomu lub aplikacji, aż do najbardziej szczegółowego poziomu, jakim jest poziom pola.

Na tym obrazie węzła pokazano następujące poziomy hierarchii, od najwyższego (najbardziej ogólnego) do najniższego (najbardziej szczegółowego): Zasób danych (aplikacja), zasób (zestaw danych), tabela i pola.

Węzeł z poziomami zasobu, zasobu, tabeli i pola

Otwieranie wykresu pochodzenia

  1. Otwórz centrum aktywności Wnioski lub Analytics.

  2. Wybierz Narzędzia > Pochodzenie w menu kontekstowym Więcej na elemencie, który obsługuje pochodzenie.

Możesz również uzyskać dostęp do wykresu pochodzenia niektórych treści, gdy masz otwarty element. Kliknij Więcej i Pochodzenie.

Szczegóły węzła

Szczegóły są ograniczone przez Twój dostęp do tego obiektu. Szczegóły mogą dostarczać następujących informacji:

  • Nazwa

  • Opis

  • Tagi

  • Lokalizacja

  • Przestrzeń

  • Właściciel

  • Twórca

  • Ostatnia modyfikacja

Nawigacja po wykresie pochodzenia

Kliknij i przeciągnij wykres, aby nawigować i wyśrodkować wykres pochodzenia. Możesz również użyć przycisków nawigacyjnych. Wybierz Strona główna Strona główna, aby wyśrodkować wykres pochodzenia na węźle bazowym. Kliknij wstecz i do przodu, aby poruszać się po swoich wyborach.

Nawigacja po wykresie pochodzenia

Przyciski nawigacyjne dla wykresu pochodzenia.

Wykres Pochodzenie pokazuje zależności w górę strumienia dla Twoich treści analitycznych, które są prezentowane jako domyślny węzeł po otwarciu dla nich wykresu. Możesz uzyskać dostęp do pochodzenia (w górę strumienia) lub analizy wpływu (w dół strumienia) dla innych węzłów pojawiających się na wykresie, wybierając Więcej i Pochodzenie (nowy węzeł bazowy) lub Analiza wpływu. Wybierz węzeł, aby wyznaczyć go jako węzeł bazowy.

Rozwiń Strzałka w dół lub zwiń strzałka w górę węzły, aby rozwinąć lub zwinąć grupy obiektów na tym samym poziomie.

Opcja menu do analizy różnych węzłów

Opcja menu do analizy różnych węzłów

Widok podsumowania pochodzenia w aplikacji

Widok podsumowania pochodzenia w aplikacji może dać użytkownikom biznesowym ogólny przegląd zależności w górę strumienia w aplikacji. Aby uzyskać więcej informacji, zobacz Widok podsumowania pochodzenia w aplikacji.

Analiza pochodzenia dla treści uczenia maszynowego

Możesz użyć wykresu Pochodzenie do analizy pochodzenia treści uczenia maszynowego, w tym eksperymentów ML, wdrożeń ML i zestawów danych. Użyj wykresu, aby uzyskać całościowy widok tego, jak tworzono modele uczenia maszynowego, na jakich danych były trenowane i do czego są używane w scenariuszach produkcyjnych.

Eksperymenty, wdrożenia i zestawy danych pojawiają się również jako węzły podczas analizy innych treści na wykresie Pochodzenie, takich jak aplikacje w dół strumienia.

Zasoby uczenia maszynowego są również pokazywane w Analizie wpływu w celu kompleksowej analizy treści w dół strumienia. Aby uzyskać więcej informacji, zobacz Analizowanie analizy wpływu w Analytics.

Otwieranie Pochodzenia dla treści uczenia maszynowego

  • W swoim centrum aktywności kliknij Więcej obok eksperymentu ML, wdrożenia ML lub zestawu danych i wybierz Narzędzia > Pochodzenie.

  • W eksperymencie ML lub wdrożeniu ML kliknij Więcej na pasku nawigacyjnym i wybierz Pochodzenie.

Nawigacja po Pochodzeniu dla treści uczenia maszynowego

Węzły uczenia maszynowego eksploruje się w taki sam sposób, jak w przypadku innych treści. Przeglądy interfejsu można znaleźć w:

Rozpoznawanie elementów uczenia maszynowego na wykresie Pochodzenie

Poniższa tabela przedstawia typowe elementy związane z uczeniem maszynowym, które pojawiają się na wykresie Pochodzenie.

Typowe elementy pochodzenia dla uczenia maszynowego
Element Ikona(y) Wyjaśnienie
Magazyn plików Folder

Nie jest unikalne dla treści uczenia maszynowego. Pokazuje lokalizację, w której przechowywany jest zestaw danych (w większości przypadków w przestrzeni). Istotne dla zestawu danych treningowych, eksportów z osadzonej analityki w eksperymencie, zestawów danych zastosowania używanych do predykcji oraz zestawów danych wyjściowych predykcji.

Zestaw danych Wiele (na przykład Typ pliku QVD dla QVD) Nie jest unikalne dla treści uczenia maszynowego. Służy do reprezentowania zestawów danych treningowych, eksportów z osadzonej analityki w eksperymencie, zestawów danych zastosowania i zestawów danych wyjściowych predykcji.
Eksperyment ML Eksperyment ML Eksperyment ML, w którym trenowane są modele.
Wersja eksperymentu ML Rozwidlenie Wersja w ramach eksperymentu ML, w której wytrenowano jeden lub więcej modeli.
Model ML Model ML Model ML wytrenowany w ramach wersji eksperymentu. Służy do reprezentowania wytrenowanych modeli w eksperymencie ML i wdrożonych modeli we wdrożeniu ML.
Wdrożenie ML Wdrożenie ML Wdrożenie ML zawierające jeden lub więcej wdrożonych modeli.
Brak ikony - Węzły wyjściowe predykcji w ramach wdrożenia ML nie mają ikon. Pola zawarte w zestawie danych wyjściowych predykcji również nie mają ikon.

Pochodzenie i eksperymenty ML

Eksperymenty ML są prezentowane w układach grupowych. Rozwijają się one w następujący sposób:

  • Eksperyment ML rozwija się w jedną lub więcej wersji eksperymentu.

  • Wersja eksperymentu rozwija się w jeden lub więcej modeli ML.

Gdy model wytrenowany w eksperymencie zostanie wdrożony we wdrożeniu ML, pojawia się on na wykresie pochodzenia, gdy treść w dół strumienia (na przykład predykcje lub wdrożenia ML) zostanie wybrana jako węzeł bazowy.

Pochodzenie i wdrożenia ML

Wdrożenia ML są prezentowane w układach grupowych. Rozwijają się one w następujący sposób:

  • Wdrożenie ML rozwija się w jeden lub więcej wdrożonych modeli.

  • Jeśli model we wdrożeniu został użyty w predykcjach wsadowych, model rozwija się, aby pokazać każde wyjście predykcji wsadowej.

Pochodzenie na poziomie pola jest dostępne dla zestawów danych zastosowania i zestawów danych wyjściowych predykcji, które odnoszą się do wdrożenia ML.

Wdrożone modele używane do predykcji są połączone z powrotem z eksperymentem, w którym zostały wytrenowane.

Przykładowy scenariusz

Aby zapoznać się z przykładowym scenariuszem, zobacz Przykład: Badanie pochodzenia treści uczenia maszynowego.

Ograniczenia

Wykres pochodzenia ma następujące ograniczenia:

  • Aplikacje, które nie zostały ponownie załadowane po udostępnieniu pochodzenia w Qlik Cloud, mogą nie mieć pełnych informacji o pochodzeniu, dopóki nie zostaną ponownie załadowane. Szczegóły dla niektórych węzłów mogą być ograniczone, jeśli nie zostały załadowane po włączeniu pochodzenia dla Twojej dzierżawy.

  • Szczegóły węzła dla zestawów danych poza Twoją dzierżawą, takich jak połączenia SQL Server lub Google Drive, są ograniczone do typu zestawu danych i nazwy. Połączenia REST wyświetlają tylko informację, że są to dane REST.

  • Jeśli element zostanie usunięty, może być nadal wyświetlany w Pochodzeniu podczas analizy innych węzłów.

Uprawnienia

Musisz mieć możliwość wyświetlenia elementu, aby wyświetlić jego pochodzenie ze swoich centrów aktywności. Jeśli widzisz wykres pochodzenia dla węzła bazowego, możesz zobaczyć podstawowe szczegóły i metadane dla obiektów pochodzenia w górę strumienia.

Bezpieczeństwo

  • Użytkownik może zmienić węzeł bazowy tylko na taki, do którego ma dostęp; w przeciwnym razie menu kontekstowe jest niedostępne.

  • Jeśli użytkownik ma dostęp do węzła bazowego, będzie miał dostęp do wyświetlania całego pochodzenia w górę strumienia.

Przykładowe przypadki użycia do analizy pochodzenia

Aby zapoznać się z przewodnikiem po analizie pochodzenia, zobacz Przypadki użycia pochodzenia na poziomie pola.

Przykład: Badanie, skąd pochodzą informacje, za pomocą widoku podsumowania pochodzenia

Jako konsument analityki patrzący na wykres słupkowy w aplikacji cars-data4-app, chciałbyś wiedzieć, skąd pochodzą informacje. Upewniasz się, że opcje Pokaż szczegóły i Pokaż wyrażenia są włączone dla wykresu w sekcji Wygląd > Ogólne we właściwościach, a następnie wybierasz przełączenie do trybu analizy arkusza. Kliknij wykres prawym przyciskiem myszy lub użyj menu ikona więcej akcji i wybierz Pokaż szczegóły, aby wyświetlić widok konsumenta pochodzenia. Kliknij Pokaż zależności.

Widzisz, że wymiar Car_ID jest zależny od pola Car_ID, które znajduje się w trzech wymienionych źródłach CSV. Wybierz menu ikona więcej akcji na wpisie pola i wybierz Pochodzenie - Car_ID / Cars, aby otworzyć wykres pochodzenia dla pola Car_ID w aplikacji.

Wybierz źródło lub pole, aby wyświetlić pochodzenie dla tego obiektu

Wybierz menu, a następnie opcję wyświetlenia pochodzenia dla źródła w widoku podsumowania pochodzenia konsumenta

Wykres pochodzenia jest oglądany od prawej do lewej i pokazuje, że pole Car_ID znajduje się w tabeli Cars, która została załadowana do aplikacji cars-data4-app. Rozwiń Strzałka w dół węzły, śledząc historię pola wstecz do oryginalnego pliku, który został przesłany do Qlik Cloud. Widzisz, że pierwszy przekaźnik wstecz pokazuje, że plik CSV cars-data.csv zawierający pole Car_ID został załadowany do aplikacji cars-data4-app. Następny węzeł wstecz to aplikacja cars-data3-app, z której wygenerowano plik cars-data.csv. Cofając się o jeszcze jeden przekaźnik i rozwijając węzeł, widzisz, że oryginalnym plikiem źródłowym był plik CSV cars-data3.csv i zawierał on pole ID.

Rozwijając tabele i przeglądając pola, jesteś w stanie zidentyfikować oryginalny plik źródłowy, tabelę i pole wymiaru wykresu słupkowego Car_id-ID.

Rozwiń węzły, aby prześledzić historię pola wstecz do pliku źródłowego

Zacznij od węzła w centrum uwagi i prześledź historię pochodzenia wstecz do oryginalnego źródła

Przykład: Badanie pochodzenia zestawu danych i sposobu jego utworzenia

Jako programista aplikacji rozważasz użycie istniejącego zestawu danych current_customers_analytics.xlsx dla swojej aplikacji. Badasz pochodzenie tego zestawu danych, aby zrozumieć, skąd pochodzą dane. Z kafelka zestawu danych lub wiersza wybierz Pochodzenie z menu Więcej, aby otworzyć wykres pochodzenia. Z wykresu pochodzenia przeglądasz metadane dla zestawu danych, wybierając menu ikona więcej akcji na pliku XLSX current_customers_analytics.xlsx i Otwórz przegląd.

Otwórz przegląd zestawu danych z wykresu pochodzenia

Przegląd zestawu danych można otworzyć z wykresu pochodzenia

Wyświetl tagi, klasyfikacje i inne metadane techniczne z karty przeglądu zestawu danych

Przeglądy zestawów danych są dostępne z wykresu pochodzenia

Profil danych jest dostępny z karty Profil

Karta profilu pól jest dostępna z wykresu pochodzenia

Kliknij strzałkę wstecz w przeglądarce, aby powrócić do wykresu pochodzenia w celu eksploracji wykresu pochodzenia dla zestawu danych. Rozwiń Strzałka w dół węzeł current_customers_analytics.xlsx i kliknij Zaznacz wszystko, aby wyświetlić dostępne pola. Zrób to samo dla wszystkich węzłów. Zauważ, że każde pole zapewnia opcję uczynienia go węzłem bazowym w centrum uwagi poprzez wybranie Pochodzenie (nowy węzeł bazowy) lub wybranie Analiza wpływu, aby wyświetlić pochodzenie w przód i obiekty zależne, na które wpłyną zmiany w zestawie danych.

Rozwinięty wykres Pochodzenie dla zestawu danych. Każde pole w każdym węźle będzie miało opcje otwarcia aplikacji lub danych, wyświetlenia analizy wpływu lub zmiany węzła w centrum uwagi

Wyświetlanie pochodzenia dla zestawu danych

Śledząc pochodzenie wstecz i rozwijając węzły, możesz zobaczyć, że ten zestaw danych XLSX jest wynikiem aplikacji Prep Current Customers Sales - Analytics. Cofając się o kolejny przekaźnik i rozwijając węzeł Magazyn plików, widzisz, że do aplikacji analizy sprzedaży załadowano plik CSV: rgb_customers.csv. Analiza na poziomie pola ujawnia, że pole Tags w oryginalnym pliku źródłowym zostało zmienione na rgb_customers.Tags w aplikacji analizy sprzedaży. Oryginalny plik CSV można otworzyć w przeglądzie, aby ujawnić cenne metadane, takie jak właściciel, twórca, metryki użycia, tagi, klasyfikacje, profil pola i analiza wpływu.

Przykład: Badanie pochodzenia treści uczenia maszynowego

Zwykły użytkownik biznesowy lub ekspert ds. uczenia maszynowego może użyć wykresu Pochodzenie do zbadania pochodzenia określonych przewidywanych wartości. Z węzłem bazowym ustawionym na zestaw danych predykcji, ten użytkownik może zobaczyć:

  • Dane treningowe, w tym ich źródła i transformacje

  • Eksperyment, wersję eksperymentu i model

  • Gdzie model został wdrożony i jak był używany

Wykres pochodzenia ze wszystkimi rozwiniętymi węzłami. Wykres pokazuje kompleksowy przepływ od przygotowania danych treningowych do zestawu danych predykcji.

Wykres pochodzenia pokazujący kompleksowy przepływ od przygotowania danych treningowych do zestawu danych predykcji

Powyższy obraz pokazuje następujący proces:

  1. Przepływ danych Przepływ danych ładuje i transformuje dane z zestawu danych CSV Typ pliku Parquet przechowywanego w przestrzeni prywatnej Folder. Wynik jest zapisywany w zestawie danych Parquet Typ pliku Parquet w tej samej przestrzeni.

  2. Zestaw danych Parquet Typ pliku Parquet jest używany w wersji 1 Rozwidlenie eksperymentu ML Eksperyment ML. Ta wersja eksperymentu trenuje model ML Model ML.

  3. Model ML Model ML jest wdrażany we wdrożeniu ML Wdrożenie ML.

  4. Używając zestawu danych CSV Typ pliku Parquet w przestrzeni prywatnej Folder jako zestawu danych zastosowania, wdrożenie ML Wdrożenie ML generuje zestaw danych predykcji w formacie Parquet Typ pliku Parquet.

Pochodzenie w Integracja danych

Wykres Pochodzenie jest również dostępny w Integracja danych. Aby uzyskać więcej informacji, zobacz Analizowanie pochodzenia w Integracja danych.

Czy ta strona była pomocna?

Jeżeli natkniesz się na problemy z tą stroną lub jej zawartością — literówkę, brakujący krok lub błąd techniczny — daj nam znać!