Przeskocz do zawartości głównej Przejdź do treści uzupełniającej

Zarządzanie zestawami danych

Zestawami danych zawartymi w zadaniach danych do umieszczania, pamięci masowej, transformacji, data mart i replikacji można zarządzać w celu utworzenia przekształceń, filtrowania danych i dodawania kolumn.

Lista uwzględnionych zestawów danych znajduje się w obszarze Zestawy danych w widoku Projekt. Kolumny, które mają być wyświetlane, możesz wybrać za pomocą selektora kolumn (selektor kolumn).

Zestawy danych w widoku Projekt zadania danych

Zestawy danych w widoku Projekt zadania danych

Reguły transformacji i transformacje jawne

Można wykonywać zarówno transformacje globalne, jak i jawne.

Reguły transformacji

Możesz dokonywać transformacji globalnych, tworząc regułę transformacji, która używa symbolu wieloznacznego % w zakresie w celu zastosowania do wszystkich pasujących zestawów danych.

Reguły transformacji są wskazywane za pomocą ciemnofioletowego narożnika danego atrybutu.

Transformacje jawne

Transformacje jawne tworzy się:

  • Po wybraniu opcji Edytuj w celu zmiany atrybutu kolumny.

  • Po wybraniu opcji Zmień nazwę w zestawie danych.

  • Podczas dodawania kolumny.

Transformacje jawne zastępują transformacje globalne i są wskazane za pomocą jasnofioletowego narożnika danego atrybutu.

Modele zestawów danych

Zestawy danych mogą być oparte na źródle lub oparte na celu, w zależności od rodzaju zadania i operacji w zadaniu. Używany model zestawu danych wpływa na działanie potoku przy zmianach źródła i na to, jakie operacje można wykonywać.

  • Zestaw danych jest oparty na źródłowych zestawach danych i będzie przechowywał tylko zmiany w metadanych. Zmiana danych źródłowych jest automatycznie stosowana, co może powodować zmiany we wszystkich zadaniach podrzędnych. Nie jest możliwa zmiana kolejności kolumn ani zmiana źródłowego zestawu danych.

    Następujące typy zadań zawsze używają zestawu danych opartego na źródle: umieszczanie danych, pamięć masowa, zarejestrowane dane, replikacja oraz umieszczanie danych w jeziorze danych.

  • Zestaw danych jest oparty na docelowych metadanych. Jeżeli kolumna zostanie dodana ze źródła lub usunięta, nie zostanie to automatycznie zastosowane do następnego zadania podrzędnego. Możesz zmienić kolejność kolumn i źródłowy zestaw danych. Oznacza to, że zadanie jest bardziej autonomiczne oraz pozwala kontrolować efekt zmian w źródle.

    Następujące typy zadań mogą korzystać z modelu zestawu danych opartego na celu: transformacja, data mart. Istnieją przypadki, w których model oparty na źródle jest używany w zadaniach transformacji w zależności od operacji.

    • Jeśli transformacja SQL lub przepływ transformacji dokonuje wyboru kolumny, zestaw danych będzie oparty na celu. Na przykład, jeśli używasz SELECT A, B, C from XYZ w transformacji SQL lub procesora Wybierz kolumny w przepływie transformacji.

    • Jeśli domyślne kolumny zostaną zachowane, zestaw danych będzie oparty na źródle. Na przykład, jeśli używasz SELECT * from XYZ w transformacji SQL.

Aktualizowanie projektów z modelu opartego na źródle do modelu opartego na celu.

Dotychczasowe projekty są aktualizowane do modelu danych opartego na celu, gdy jest to uzasadnione. Użytkownik zostanie przeprowadzony przez proces aktualizacji po pierwszym otwarciu projektu. Istnieją pewne kwestie do uwzględnienia podczas importu i eksportu projektów w przypadku różnych modeli zestawów danych.

  • Nie można importować projektu z modelem opartym na źródle do projektu z modelem opartym na celu.

    Importuj projekt z modelem opartym na źródle do nowego projektu, zaktualizuj nowy projekt, a następnie wyeksportuj projekt wynikowy. Możesz teraz ponownie zaimportować ten projekt do projektu z modelem opartym na celu.

  • Nie można importować projektu z modelem opartym na celu do projektu z modelem opartym na źródle.

    Zaktualizuj projekt do modelu opartego na celu przed zaimportowaniem projektu z modelem opartym na celu.

Filtrowanie zestawów danych

InformacjaMożliwość filtrowania zestawów danych jest dostępna tylko w przypadku zadań umieszczania danych, które umieszczają dane za pośrednictwem Brama danych Qlik — ruch danych, zadań danych pamięci masowej i transformacji.

W razie potrzeby można filtrować dane, aby utworzyć podzbiór wierszy.

  • Kliknij Filtruj.

Więcej informacji zawiera temat Filtrowanie zestawów danych.

Zmiana nazwy zestawu danych

Nazwę zestawu danych można zmienić.

  • Kliknij na zestawie danych, a następnie Edytuj.

Dodawanie kolumn

W razie potrzeby można dodać kolumny z transformacjami na poziomie wiersza.

  • Kliknij przycisk Dodaj kolumnę.

Aby uzyskać więcej informacji, zobacz temat Dodawanie kolumn do zestawu danych.

Edytowanie kolumny

Właściwości kolumny można edytować po wybraniu kolumny i kliknięciu przycisku Edytuj.

  • Nazwa

  • Klucz

    Ustaw kolumnę jako klucz podstawowy. Klucze można też ustawić przez zaznaczenie opcji lub anulowanie wyboru w kolumnie Klucz.

  • Nullowalne

  • Typ danych

    Ustaw typ danych kolumny. W przypadku niektórych typów danych można ustawić właściwość dodatkową, na przykład Długość.

Omówienie wpływu zmiany typu danych

Istnieją dwa typowe uzasadnienia zmiany rozmiaru typu danych lub przełączenia na inny typ danych:

  • Pozyskiwanie danych, które nie mieszczą się w bieżącym typie danych.
  • Wymóg większej dokładności liczbowej. Na przykład zmiana SMALLINT na DECIMAL (p,s).

W większości przypadków zmiana typu danych spowoduje operację ALTER TABLE, zapobiegając w ten sposób utracie danych. Na przykład, jeśli poprzedni typ danych to STRING (25), a nowy typ danych to STRING (50), dane w kolumnie z nowym typem danych zostaną zaktualizowane bez żadnego problemu. Jednak w niektórych przypadkach zmiana typu danych spowoduje usunięcie tabeli i jej ponowne utworzenie. Na przykład, jeśli typ danych poprzedniej kolumny to NUMBER i zmienisz go na DATE, tabela zostanie usunięta i utworzona od nowa, ponieważ konwersja liczb na daty nie jest możliwa. Podobnie, jeśli platforma docelowa nie obsługuje operacji ALTER TABLE (np. Databricks), tabela zostanie usunięta i utworzona na nowo.

W niektórych przypadkach teoretycznie możliwa jest modyfikacja tabeli, ale ze względu na złożoność zadania danych zostanie ona usunięta i ponownie utworzona. Wreszcie istnieją przypadki, w których potencjalna, a nie faktyczna utrata danych, spowoduje operację usunięcia i odtworzenia. Jeżeli na przykład zmienisz STRING(25) na STRING(1), nastąpi utrata danych, jeśli pobrane dane nie będą się mieścić w STRING(1). STRING(25) może jednak zawsze zawierać tylko jeden znak, więc w praktyce nie nastąpi utrata danych, ale tabela i tak zostanie usunięta i utworzona na nowo ze względu na potencjalną utratę danych.

Zmiany w typach danych wymagające usunięcia i ponownego utworzenia tabeli, niezależnie od platformy docelowej

Zmiana następujących typów danych spowoduje usunięcie i ponowne utworzenie tabeli:

  • BYTES
  • BLOB
  • CLOB
  • NCLOB

Platformy docelowe obsługujące zmiany rozmiaru typu danych bez usuwania i ponownego tworzenia tabeli

Pracując ze Snowflake, Google BigQuery, Amazon Redshift, Microsoft SQL Server i Azure Synapse Analytics, możesz zmienić rozmiar niektórych typów danych bez usuwania i ponownego tworzenia tabeli. W poniższej tabeli przedstawiono listę obsługiwanych typów danych dla wszystkich wymienionych powyżej platform.

Typ danych Snowflake Google BigQuery Azure Synapse Analytics Microsoft SQL Server Amazon Redshift

INT1

Nie

Tak

Tak

Tak

Nie

INT2

Nie

Tak

Tak

Tak

Nie

INT4

Nie

Tak

Tak

Tak

Nie

INT8

Nie

Tak

Tak

Tak

Nie

REAL4

Nie

Nie

Tak

Tak

Nie

REAL8

Nie

Nie

Tak

Tak

Nie

UINT1

Nie

Tak

Tak

Tak

Nie

UINT2

Nie

Tak

Tak

Tak

Nie

UNIT4

Nie

Tak

Tak

Tak

Nie

UNIT8

Nie

Tak

Tak

Tak

Nie

NUMERIC

Tak

Tak

Tak

Tak

Nie

STRING

Tak

Tak

Tak

Tak

Tak

WSTRING

Nie

Tak

Tak

Tak

Nie

Platformy docelowe obsługujące zmiany typu danych na STRING bez usuwania i ponownego tworzenia tabeli

Podczas przenoszenia danych na platformy Microsoft SQL Server i Azure Synapse Analytics możesz zmienić następujące typy danych na STRING bez usuwania i ponownego tworzenia tabeli:

  • BOOLEAN
  • DATE
  • TIME
  • DATETIME
  • INT1
  • INT2
  • INT4
  • INT8
  • REAL4
  • REAL8
  • UINT1
  • UINT2
  • UNIT4
  • UNIT8
  • NUMERIC
  • WSTRING (obsługiwane tylko w przypadku Azure Synapse Analytics)

Usuwanie kolumn

Z zestawu danych można usunąć co najmniej jedną kolumnę.

  • Wybierz kolumny do usunięcia i kliknij przycisk Usuń.

Aby zobaczyć usunięte kolumny, kliknij przycisk Pokaż usunięte kolumny. Wskaźnikiem usuniętych kolumn jest przekreślony tekst. Usuniętą kolumnę można przywrócić, zaznaczając ją i klikając przycisk Odwróć.

WskazówkaAby usunąć dodaną kolumnę, zaznacz ją i kliknij przycisk Odwróć.

Odwracanie jawnych zmian w kolumnach

Można odwrócić wszystkie jawne zmiany w co najmniej jednej kolumnie.

  • Wybierz kolumny do odwrócenia zmian i kliknij przycisk Odwróć.

Zmiany wynikające z globalnych reguł transformacji nie zostaną odwrócone.

Odwrócenie dodanej kolumny spowoduje jej usunięcie.

Ustawienia zestawu danych

Ustawienia zestawu danych można zmienić. Ustawienie domyślne jest dziedziczone z ustawienia zasobu danych, ale można też zmienić ustawienie, aby było jawnie włączone lub wyłączone.

  • Kliknij ikonę obok zestawu danych, a następnie wybierz polecenie Ustawienia.

Wyświetlanie danych

Możesz wyświetlić próbkę danych, aby zobaczyć i zweryfikować stan danych podczas projektowania potoku danych.

Muszą zostać spełnione następujące wymagania:

  • Wyświetlanie danych jest włączone na poziomie dzierżawy w funkcji Administrowanie.

    Włącz Ustawienia > Sterowanie funkcją > Wyświetlanie danych w Integracja danych.

  • Przypisano Ci rolę Może wyświetlać dane w przestrzeni, w której znajduje się połączenie.

  • Przydzielono Ci rolę Może wyświetlać w przestrzeni, w której znajduje się ten projekt.

InformacjaKiedy projekty i połączenia są tworzone w przestrzeni prywatnej, właściciel zawsze może przeglądać dane.

Aby wyświetlić przykładowe dane na karcie Zestawy danych w widoku Projekt:

  • Kliknij Wyświetl dane w obszarze Obiekty fizyczne.

Wyświetlona zostanie próbka danych. Ustawienie Liczba wierszy umożliwia określenie, ile wierszy danych należy uwzględnić w próbce.

Aby przełączać zestawy danych i tabele:

  • Wybierz Zestawy danych, aby wyświetlić logiczną reprezentację danych.

  • Wybierz Obiekty fizyczne, aby wyświetlić fizyczną reprezentację w bazie danych w postaci tabel i widoków.

    Uwaga dotycząca wiadomościTa opcja nie jest dostępna, jeśli reprezentacja fizyczna nie została jeszcze utworzona.

Dane przykładowe można filtrować na dwa sposoby:

  • Użyj filtr do filtrowania pobieranych danych przykładowych.

    Jeżeli na przykład użyjesz filtru ${OrderYear}>2023, a Liczba wierszy będzie ustawiona na 10, otrzymasz próbkę 10 zamówień z 2024 roku.

  • Filtruj dane przykładowe według określonej kolumny.

    Wpłynie to tylko na istniejące dane przykładowe. Jeżeli użyto filtr do uwzględnienia tylko zamówień z roku 2024, a filtr kolumny ustawiono tak, by wyświetlać zamówienia z 2022 roku, wynikiem będzie pusta próbka.

Możesz także posortować próbkę danych według określonej kolumny. Sortowanie wpłynie tylko na istniejące dane przykładowe. Jeżeli użyto filtr do uwzględniania tylko zamówień z 2024 roku i odwrócono kolejność sortowania, dane przykładowe będą nadal zawierać tylko zamówienia z 2024 roku.

Możesz ukryć kolumny w widoku danych:

  • Ukryj pojedynczą kolumnę, klikając na kolumnie, a następnie Ukryj kolumnę.

  • Ukryj kilka kolumn, klikając na dowolnej kolumnie, a następnie Wyświetl kolumny. W ten sposób możesz kontrolować widoczność wszystkich kolumn w widoku.

Sprawdzanie poprawności i dostosowywanie zestawów danych

Można sprawdzić poprawność wszystkich zestawów danych uwzględnionych w zadaniu danych.

Aby zobaczyć wszystkie błędy wykryte podczas sprawdzania poprawności i zmiany w projekcie, rozwiń pozycję Sprawdź poprawność i dostosuj.

Sprawdzanie poprawności zestawów danych

  • Aby sprawdzić poprawność zestawów danych, kliknij przycisk Sprawdź poprawność zestawów danych.

Sprawdzenie poprawności obejmuje ustalenie, czy:

  • Wszystkie tabele mają klucz podstawowy,

  • Nie brakuje atrybutów,

  • Nie ma zduplikowanych nazw tabeli lub kolumn.

Zostanie też wyświetlona lista zmian w projekcie w porównaniu ze źródłem:

  • Dodane tabele i kolumny,

  • Usunięte tabele i kolumny,

  • Tabele i kolumny o zmienionych nazwach,

  • Zmienione klucze podstawowe i typy danych.

Aby zobaczyć wszystkie błędy wykryte podczas sprawdzania poprawności i zmiany w projekcie, rozwiń pozycję Sprawdź poprawność i dostosuj.

  • Popraw wykryte błędy, a następnie ponownie sprawdź poprawność zestawu danych.

  • Większość zmian w projekcie można dostosować automatycznie, poza zmienionymi kluczami podstawowymi i typami danych. W takim przypadku jest konieczna synchronizacja zestawów danych.

Przygotowanie zestawów danych

Możesz przygotować zestawy danych, aby dostosować zmiany w projekcie w miarę możliwości bez utraty danych. Jeśli istnieją zmiany w projekcie, których nie można dostosować bez utraty danych, uzyskasz opcję odtworzenia tabel ze źródła z utratą danych.

To wymaga zatrzymania zadania.

  • Kliknij , a następnie Przygotuj.

Po przygotowaniu zestawów danych, ale przed ponownym uruchomieniem zadania pamięci masowej sprawdź poprawność zestawów danych.

Odtwarzanie zestawów danych

Zestawy danych możesz odtworzyć ze źródła. Podczas odtwarzania zestawu danych nastąpi utrata danych. Dopóki masz dane źródłowe, możesz załadować je ponownie ze źródła.

To wymaga zatrzymania zadania.

  • Kliknij ikonę , a następnie polecenie Odtwórz.

Ograniczenia

  • Usunięcie kolumny lub zmiana jej nazwy w przypadku platformy Google BigQuery powoduje odtworzenie tabeli i utratę danych.

Czy ta strona była pomocna?

Jeżeli natkniesz się na problemy z tą stroną lub jej zawartością — literówkę, brakujący krok lub błąd techniczny — daj nam znać, co możemy poprawić!