Zarządzanie metadanymi na poziomie pól i profilowanie danych

Dzięki profilowaniu administratorzy danych uzyskują dostęp do obszernych informacji technicznych o swoich zestawach danych. Twórcy aplikacji używają statystyk profilu i próbkowania danych do uzyskiwania pomysłów i wskazówek dotyczących tworzenia aplikacji oraz planowania wizualizacji. Profilowanie pól może pomóc analitykom danych i użytkownikom biznesowym w szybszym uzyskiwaniu wniosków. Mogą oni przeglądać i wizualizować cenne wskaźniki profili pól bez konieczności wcześniejszego tworzenia aplikacji. Metadane na poziomie pól umożliwiają użytkownikom stosowanie aliasów, opisów i klasyfikacji do pól. Funkcje te pomagają w identyfikacji określonych danych i wrażliwych pól.

Qlik Cloud profiluje tylko do 12 milionów wierszy w zestawie danych. Jeśli zestaw danych zawiera więcej niż 12 milionów wierszy, to sprofilowane zostanie tylko pierwsze 12 milionów. Metadane dla wszystkich pól zostaną dodane niezależnie od liczby sprofilowanych wierszy.

Zarządzanie metadanymi na poziomie pól

Możesz uzyskiwać dostęp do metadanych i edytować je dla każdego pola w zestawie danych na karcie Pola. Wybierz dowolną kartę z widoku Wybierz ikonę kafelka, aby wyświetlić widok kafelków Kafelków, dowolny wiersz z widoku Wybierz ikonę listy, aby wyświetlić widok listy Listy lub dowolną kolumnę z widoku Dane, aby otworzyć panel Szczegóły tego pola po prawej stronie siatki. Pola metadanych na poziomie pól — Alias pola, Opis, Znaczniki i Klasyfikacja — są opcjonalne i można je definiować oraz edytować w tym panelu.

Pola metadanych pól
Szczegóły	Opis
Alias pola	Wprowadź opcjonalną nazwę alternatywną, aby nazwy pól były bardziej znaczące w analizie profilu. Aliasy nazw pól są wyświetlane tylko w analizie profilu i nie mają wpływu na techniczne nazwy kolumn.
Opis	Wprowadź wszelkie informacje, które mogą być przydatne dla użytkowników przeglądających metadane pola i profilujących w odniesieniu do pola.
Znaczniki	Wprowadź wstawki tekstu w celu zdefiniowania i sklasyfikowania pola oraz jego danych.
Klasyfikacja	Zaznacz pole wyboru Dane osobowe lub Informacje poufne.

Wybrane klasyfikacje na poziomie pól Dane osobowe i Informacje poufne są wyświetlane na karcie Przegląd zestawu danych, według pól poniżej metadanych technicznych zestawu danych.

Klasyfikacje zastosowane do pól w plikach programu Excel z wieloma arkuszami zostaną wyświetlone wraz z nazwą arkusza i nazwą pola (przykład: Dane osobowe: Arkusz1/EmpID).

Wybierz kartę pola w widoku kafelków, aby otworzyć panel Szczegóły — Metadane na poziomie pól dla pliku XLSX z wieloma arkuszami

Profilowanie danych

Statystyki profilu oferują analizy kolumn mierzące częstość występowania, zakresy i wartości występujące w zestawach danych. Te wskaźniki opisują relacje między wartościami pól, takie jak:

Liczba wartości odrębnych (kardynalność)
Przykładowe wartości, najczęściej występujące wartości i częstotliwość wartości
Nadmiarowości przydatne w identyfikowaniu wartości domyślnych lub potencjalnie zduplikowanych
Liczba wartości null, ciągów i liczbowych
Informacje o zakresach wartości, w tym minimum, maksimum, średnia, suma i odchylenie standardowe

Katalog oferuje trzy różne widoki danych profili pól: Tile view, List view i Data view.

Tile view to wykorzystująca karty, wizualna reprezentacja pól ułożonych w formie siatki.

List view jest tabelarycznym podsumowaniem konfigurowanych statystyk profilu.

Table view wyświetla nazwy kolumn pól i maksymalnie dwadzieścia pierwszych rekordów zestawu danych.

Wybierz Tile Wybierz ikonę kafelka, aby wyświetlić widok kafelków , List Wybierz ikonę listy, aby wyświetlić widok listy lub ikonę Dane , aby przełączać widoki profilów.

Widok Kafelek profilu

Widok Kafelek profilu to wizualny profil pola przeznaczony do wyświetlania najistotniejszych pod względem informacyjnym treści dla tego typu pola. Domyślnie wyświetlany typ karty widoku zależy od tego, czy liczba wartości liczbowych lub tekstowych jest większa dla tego pola. Na przykład, dla pól z wartościami tekstowymi i liczbowymi, typ karty Najczęściej występujące wartości wyświetla się domyślnie, jeśli jest więcej wartości tekstowych, a typ karty dystrybucja liczbowa Grupowana częstotliwość wyświetla się, jeśli w polu jest więcej wartości liczbowych. Jest dostępny rozwijany przełącznik umożliwiający przełączenie na typ karty Najczęściej występujące wartości dla każdego pola, które ma powtarzalne wartości, gdy wybrano ikona Najczęściej występujące wartości . Można też powrócić do karty dystrybucji liczbowej, jeśli wybrano Grupowaną częstotliwość ikona Grupowana częstotliwość . Zauważ, że wszystkie typy kart zawierają liczbę wartości null, jeśli pole ma wartości null.

Widok kafelków profilu zestawu danych — Widok kafelków: pola są profilowane według wskaźników, które są istotne dla typu danych zawartych w tym polu (przykład: tekst a wartości liczbowe)

Karta Przykładowe wartości

Karta Przykładowe wartości jest pokazywana, gdy wszystkie wartości są unikalne i tylko tekstowe. Spowoduje to wyświetlenie (maksymalnie) pierwszych trzech wartości i łącznej liczby dodatkowych wartości unikatowych.

Kafelek wartości przykładowych — Karta widoku kafelków: Wartości przykładowe

Kryteria profilu Wartości przykładowe: wartości pól są profilowane za pomocą tej karty, gdy liczebność jest wysoka (wszystkie wartości odrębne). W przypadku, gdy każda wartość jest unikatowa i tekstowa, kilka przykładowych wartości zapewnia najlepszy wstępny wgląd w ten typ danych pola.

Każda karta profilu Przykładowe wartości zawiera następujące elementy:

Nazwa pola
Liczba kardynalna (wartości odrębne)
Maksymalnie trzy przykładowe wartości (pola mogą mieć mniej niż trzy wartości)

Karta Częstotliwość najczęściej występujących wartości

Karta Częstotliwość najczęściej występujących wartości pokazuje pięć najczęstszych wartości i ich częstotliwość. Jeśli jest więcej niż pięć różnych wartości, są one łączone i wyświetlane jako Inne. Jeśli w którymś z pól brakuje wartości, suma jest wyświetlana jako Null. Tę kartę profilu można zastosować do tekstowych, liczbowych lub mieszanych wartości danych.

Kafelek Częstotliwość najczęściej występujących wartości — Karta widoku kafelków: Częstotliwość najczęściej występujących wartości

Kryteria Częstotliwość najczęściej występujących wartości: pola, które mają niewiele wartości lub nierównomierny rozkład wartości, są profilowane przy użyciu karty częstotliwości najczęściej występujących wartości. To profilowanie jest stosowane tylko wtedy, gdy istnieje wiele wystąpień tych samych wartości. Użytkownicy mogą uzyskać szybki wgląd w rozkład wartości pól. Jeśli dane pola zawierają zarówno wartości tekstowe, jak i liczbowe, a wartości tekstowych jest więcej niż liczbowych, wówczas wyświetlana jest karta Częstotliwość najczęściej występujących wartości. Przełącznik Grupowana częstotliwość jest dostępny, gdy w polu są więcej niż trzy wartości liczbowe.

Każda karta profilu Częstotliwość najczęściej występujących wartości zawiera następujące elementy:

Nazwa pola
Liczba kardynalna (wartości odrębne)
Najczęściej występujące wartości i ich częstotliwość
Inne – łączna częstotliwość pozostałych wartości

Karta Grupowana częstotliwość

Karta Grupowana częstotliwość zawiera informacje dotyczące dystrybucji i profilowania, które są istotne dla pól liczbowych, w tym minimalne, średnie i maksymalne wartości danych. Jeśli dane pola zawierają zarówno wartości tekstowe, jak i liczbowe, a wartości liczbowych jest więcej niż tekstowych, wówczas wyświetlana jest karta Grupowana częstotliwość. Typ karty Częstotliwość najczęściej występujących wartości jest dostępna dla wszystkich pól, które mają powtarzalne wartości.

Kafelek Grupowana częstotliwość — Karta widoku kafelków: rozkład liczbowy Grupowanej częstotliwości

Każda karta profilu Grupowana częstotliwość zawiera następujące elementy:

Nazwa pola
Liczba kardynalna (wartości odrębne)
Histogram przedstawiający rozkład danych liczbowych
Wartość minimalna
Średnia wartość (suma liczb podzielona przez łączną liczbę wartości w zestawie danych)
Wartość maksymalna

Widok Lista profili

Widok Lista profili zawiera tabelę z opcjami statystyk profilu. Użytkownicy sprawdzają interesujące ich wskaźniki mające największe znaczenie dla zestawu danych, który można znaleźć pod selektorem kolumn , przewijając do skrajnej prawej krawędzi tabeli. Pierwszych dziewięć statystyk jest domyślnie wstępnie wybranych.

Widok listy profilów zestawu danych — Widok listy: wybierz interesujące Cię statystyki profilu z rozwijanego menu Wybór kolumn, które można znaleźć, przewijając tabelę w prawo

Statystyki profilu pola
Statystyki	Opis
Nazwa	Nazwa pola (np. CategoryID)
Typ danych	Qlik Sense rejestruje dane z wielu różnych systemów, a dane pola (kolumny) są poddawane mapowaniu zewnętrznych typów danych na jednolite wewnętrzne do celów informacyjnych. Obsługiwane wartości typu danych obejmują: Date: data zawierająca miesiąc, dzień i rok w formacie ISO 8601: YYYY-MM-DD Time: wartość czasu zawierająca godzinę, minuty i sekundy w formacie ISO 8601: hh.mm.ss.sss±hh:mm Datetime: wartość daty i godziny zawierająca rok, miesiąc, dzień, godzinę, minuty, sekundy i ułamki sekund w formacie YYYY-MM-DDThh.mm.ss.sss Timestamp: wartość typu znacznik czasu zawierająca rok, miesiąc, dzień, godzinę, minuty, sekundy, ułamki sekund i strefę czasową w formacie YYYY-MM-DDThh.mm.ss.sssZ String: dane znakowe reprezentujące tekst Double: liczbowy typ danych — 64-bitowa liczba zmiennoprzecinkowa o podwójnej precyzji w standardzie IEEE 754 Decimal: dokładny liczbowy typ danych określany przez jego dokładność (łączną liczbę cyfr) i skalę (liczbę cyfr po prawej stronie przecinka dziesiętnego) Integer: dodatnie lub ujemne liczby całkowite Boolean: wartość logiczna (PRAWDA/FAŁSZ) Binary: dane kategorialne, które mogą przyjmować dokładnie dwie możliwe wartości, takie jak „1” i „2” Custom: typ danych spoza mapowanych typów znanych w systemie
Wartości odrębne	Liczba kardynalna — liczba różnych wartości występujących w przypadku tego pola
Wartości Null	Liczba wartości null
Wartości przykładowe	Przykładowe wartości (wyświetlanie 3 przykładowych wartości)
Suma	Suma wszystkich wartości w tym polu (w przypadku pól ciągów znakowych wyświetlane jest „0”)
Min.	Minimalna obserwowana wartość tego pola (pola liczbowe)
Maks.	Maksymalna obserwowana wartość tego pola (pola liczbowe)
Średnia	Średnia obserwowana wartość tego pola
Mediana	Mediana (lub środkowa liczba) w tablicy liczb dla tego pola
Znaczniki systemowe	Znaczniki plików zastosowane w celu identyfikacji zestawu kodowania (np. $ascii, $text)
Odchylenie standardowe	Odchylenie standardowe w przypadku pól liczbowych
Dodatnie	Liczba wartości dodatnich
Ujemne	Liczba wartości ujemnych
Wartości zerowe	Liczba wartości „0”
Puste ciągi	Liczba pustych ciągów
Minimalna długość	Najmniejsza obserwowana liczba znaków
Średnia długość	Średnia obserwowana liczba znaków
Maksymalna długość	Największa obserwowana liczba znaków
Pierwsza wartość sortowana	Pierwsza (najniższa) wartość wagi sortowania (pola ciągów tekstowych)
Ostatnia wartość sortowana	Ostatnia (najwyższa) wartość wagi sortowania (pola ciągów tekstowych)
Wartości liczbowe	Liczba wartości liczbowych
Wartości tekstowe	Liczba wartości tekstowych
Najczęstsze wartości	Trzy najczęściej spotykane wartości w polu

Widok Dane profilu

Widok danych profilu wyświetla zestaw danych jako prostą tabelę danych z nazwami kolumn pól i (maksymalnie) pierwszymi dwudziestoma wartościami.

Widok danych profilów zestawu danych — Widok danych: wyświetlane są nazwy kolumn zestawu danych i pierwsze dwadzieścia rekordów

Uprawnienia

Do profilowania i próbkowania danych wymagane są uprawnienia. Musisz mieć rolę w przestrzeni zestawu danych, która umożliwia profilowanie źródeł danych. Więcej informacji zawiera temat Zarządzanie uprawnieniami w przestrzeniach udostępnionych lub Zarządzanie uprawnieniami w przestrzeniach zarządzanych.

POWIĄZANE MATERIAŁY EDUKACYJNE:

Jak używać Katalogu danych do profilowania danych?

Dowiedz się więcej

Jak używać Katalogu danych do profilowania danych?

Czy ta strona była pomocna?

Jeżeli natkniesz się na problemy z tą stroną lub jej zawartością — literówkę, brakujący krok lub błąd techniczny — daj nam znać, co możemy poprawić!

Przekaż tu opinię