Przeskocz do zawartości głównej Przejdź do treści uzupełniającej

Umieszczanie danych w jeziorze danych w ramach subskrypcji Standard, Premium lub Enterprise

Możesz skonfigurować zadanie umieszczania danych w jeziorze danych, aby umieścić dane w następujących miejscach docelowych:

  • Amazon S3

    Informacje na temat konfigurowania połączenia z Amazon S3 zawiera temat Amazon S3.

  • Azure Data Lake Storage

    Informacje na temat konfigurowania połączenia z usługą Azure Data Lake Storage zawiera temat Azure Data Lake Storage.

  • Google Cloud Storage

    Informacje na temat konfigurowania połączenia z usługą Google Cloud Storage zawiera temat Google Cloud Storage.

WskazówkaChociaż możesz skonfigurować ustawienia połączenia źródła i miejsca docelowego w kreatorze konfiguracji zadania umieszczania danych w jeziorze danych, aby uprościć procedurę konfiguracji, zaleca się wykonanie tej czynności przed utworzeniem zadania.

Informacje o konfigurowaniu powiązań ze źródłami danych można znaleźć w temacie Łączenie ze źródłami danych.

Wskazówka

Firma Qlik udostępniła nową nawigację, która jest obecnie opcjonalna. Jeżeli administrator dzierżawy włączył nową nawigację:

  • Menu Launcher () dające dostęp do Integracji danych będzie się znajdować w lewym górnym rogu.
  • Działania wykonywane wcześniej za pomocą przycisku Dodaj nowy (który został usunięty), wykonuje się teraz, przechodząc do określonego kontekstu (np.Integracja danych > Połączenia) i klikając przycisk Utwórz <object>.

Szczegółowy opis zmian zawiera temat Nowa nawigacja po platformie Qlik Talend Integracja danych.

Aby skonfigurować zadanie umieszczania w jeziorze danych:

  1. W Integracja danych > Projekty kliknij Utwórz projekt.

  2. W oknie dialogowym Nowy projekt wykonaj następujące czynności:

    1. Podaj Nazwę swojego projektu.

    2. Wybierz Przestrzeń, w której chcesz utworzyć projekt.
    3. Opcjonalnie podaj Opis.
    4. Wybierz opcję Replikacja jako Zastosowanie.
    5. Opcjonalnie usuń zaznaczenie pola Otwórz, jeśli chcesz utworzyć pusty projekt bez konfigurowania ustawień.
    6. Kliknij polecenie Utwórz.

      Nastąpi jedna z poniższych sytuacji:

      • Jeżeli w oknie dialogowym Nowy projekt zostało zaznaczone pole wyboru Otwórz (domyślnie), projekt zostanie otwarty.
      • Jeżeli w oknie dialogowym Nowy projekt zostało usunięte zaznaczenie pola Otwórz, projekt zostanie dodany do Twojej listy projektów. Możesz otworzyć projekt później, wybierając polecenie Otwórz z menu projektu.
  3. Po otwarciu projektu kliknij Umieść dane w jeziorze danych.

    Zostanie otwarty kreator Umieść dane w jeziorze danych.

  4. Na karcie Ogólne określ nazwę i opis zadania umieszczania w jeziorze danych. Następnie kliknij Dalej.

    InformacjaNazwy zawierające ukośnik (/) lub ukośnik odwrotny (\) nie są obsługiwane.
  5. Na karcie Wybierz połączenie źródłowe wybierz połączenie z danymi źródłowymi. Opcjonalnie możesz edytować ustawienia połączenia wybierając opcję Edytuj z menu w kolumnie Działania.

    Jeśli nie masz jeszcze połączenia z danymi źródłowymi, musisz je najpierw utworzyć, klikając Utwórz połączenie w prawym górnym rogu karty.

    Listę połączeń można filtrować, korzystając z filtrów po lewej stronie. Połączenia można filtrować według typu źródła, bramy, przestrzeni i właściciela. Przycisk Wszystkie filtry nad listą połączeń pokazuje liczbę bieżących filtrów. Za pomocą tego przycisku można zamknąć lub otworzyć panel Filtry po lewej stronie. Aktualnie aktywne filtry widoczne są także nad listą dostępnych połączeń.

    Możesz także posortować listę, wybierając opcję Ostatnia modyfikacja, Ostatnio utworzone lub Alfabetycznie z listy rozwijanej po prawej stronie. Aby zmienić kolejność sortowania, kliknij strzałkę po prawej stronie listy.

    Po wybraniu połączenia ze źródłem danych opcjonalnie kliknij Testuj połączenie w prawym górnym rogu karty (zalecane), a następnie kliknij Dalej.

  6. Na karcie Wybierz zestawy danych wybierz tabele i/lub widoki do uwzględnienia w zadaniu umieszczania w jeziorze danych. Można także używać symboli wieloznacznych i tworzyć reguły wyboru zgodnie z opisem w temacie Selekcja danych z bazy danych.

    InformacjaNazwy schematów lub nazwy tabel zawierające ukośnik (/) lub ukośnik odwrotny (\) nie są obsługiwane.
  7. Na karcie Wybierz połączenie z celem wybierz miejsce docelowe z listy dostępnych połączeń, a następnie kliknij Dalej. Pod względem funkcjonalnym ta karta nie różni się od opisanej wcześniej karty Wybierz połączenie źródłowe.

  8. Na karcie Ustawienia opcjonalnie zmień następujące ustawienia, a następnie kliknij Dalej.

    • Przechwytywanie zmian danych (CDC): Zadania umieszczania w jeziorze danych rozpoczynają się od pełnego ładowania (podczas którego umieszczania są wszystkie wybrane tabele). Umieszczone dane są następnie aktualizowane przy użyciu technologii przechwytywania danych zmian (CDC).

      InformacjaPrzechwytywanie zmian danych operacji DDL nie jest obsługiwane.

      Podczas pracy z bramą Brama danych ruchu danych zmiany są przechwytywane ze źródła w czasie niemal rzeczywistym. Podczas pracy bez bramy Brama danych ruchu danych zmiany są przechwytywane zgodnie z ustawieniami harmonogramu. Domyślny interwał przechwytywania zmian wynosi co godzinę. Więcej informacji zawiera temat Planowanie zadań podczas pracy bez Brama danych ruchu danych.

    • Przeładuj: Wykonuje pełne ładowanie danych z wybranych tabel źródłowych na platformę docelową i w razie potrzeby tworzy tabele docelowe. Pełne ładowanie następuje automatycznie w momencie rozpoczęcia zadania, ale w razie potrzeby można je wykonać także ręcznie lub zaplanować tak, aby występowało okresowo, w miarę potrzeb.

    Jeśli wybierzesz opcję Przechwytywanie zmian danych (CDC), a dane zawierają także tabele, które nie obsługują CDC, lub widoki, zostaną utworzone dwa potoki danych. Jeden potok ze wszystkimi tabelami obsługującymi CDC i drugi potok ze wszystkimi innymi tabelami i widokami używającymi Przeładuj.

    Wybierz jedną z poniższych opcji w zależności od folderu zasobnika, w którym chcesz zapisywać pliki:

    • Domyślny folder: Domyślny format folderu to <nazwa-projektu>/<nazwa-zadania>
    • Folder główny: pliki zostaną zapisane bezpośrednio w zasobniku.
    • Folder: wprowadź nazwę folderu. Folder zostanie utworzony podczas zadania umieszczania w jeziorze danych, jeśli nie istnieje.

      Informacja Nazwa folderu nie może zawierać znaków specjalnych (na przykład @, #, ! itd.).
  9. Na karcie Podsumowanie wyświetlana jest wizualizacja potoku danych. Wybierz Otwórz zadanie <nazwa> lub Nic nie rób. Następnie kliknij Utwórz.

    W zależności od dokonanego wyboru albo zadanie zostanie otwarte, albo wyświetli się lista projektów.

  10. Jeśli zdecydujesz się otworzyć zadanie, na karcie Zestawy danych zostanie wyświetlona struktura i metadane wybranych tabel zasobów danych. Dotyczy to wszystkich jawnie wybranych tabel oraz tabel pasujących do reguł wyboru.

    Jeśli chcesz dodać więcej tabel ze źródła danych, kliknij Wybierz źródło danych.

  11. Opcjonalnie zmień ustawienie zadania zgodnie z opisem w temacie Ustawienia celów przechowywania w chmurze.

  12. Możesz wykonywać transformacje na zestawach danych, filtrować dane lub dodawać kolumny.

    Więcej informacji zawiera temat Zarządzanie zestawami danych.

  13. Po dodaniu odpowiednich transformacji możesz zatwierdzić zestawy danych, klikając Zatwierdź zestawy danych. Jeśli walidacja się nie powiedzie, napraw błędy przed kontynuacją.

    Więcej informacji zawiera temat Sprawdzanie poprawności i dostosowywanie zestawów danych.

  14. Kiedy wszystko będzie gotowe, kliknij Przygotuj, aby skatalogować zadanie umieszczania i przygotować je do wykonania.

  15. Po przygotowaniu zadania danych kliknij Uruchom.

  16. Powinno się teraz rozpocząć zadanie umieszczania w jeziorze danych. Możesz monitorować jego postęp w widoku Monitoruj. Więcej informacji zawiera temat Monitorowanie indywidualnego zadania danych.

Ustawianie priorytetu ładowania dla zestawów danych

Kolejność ładowania zestawów danych w zadaniu danych można kontrolować, przypisując każdemu z nich priorytet ładowania. Może się to przydać na przykład do ładowania mniejszych zestawów danych przed dużymi.

  1. Kliknij Priorytet ładowania.

  2. Wybierz priorytet ładowania dla każdego zestawu danych.

    Domyślny priorytet ładowania to Normalny. Zestawy danych będą ładowane w następującej kolejności priorytetów:

    • Najwyższy

    • Wyższy

    • Wysoka

    • Normalny

    • Niska

    • Niższy

    • Najniższy

    Zestawy danych z tym samym priorytetem będą ładowane w kolejności dowolnej.

  3. Kliknij przycisk OK.

InformacjaZestawy danych ze źródeł aplikacji SaaS mogą zawierać zależności w kolejności ładowania. Uwzględnij to podczas ustawiania priorytetu ładowania.

Odświeżanie metadanych

Możesz odświeżyć metadane w zadaniu, aby dostosować je do zmian w metadanych źródła w widoku Projekt zadania. W przypadku aplikacji SaaS korzystających z narzędzia Metadata manager należy odświeżyć Metadata manager, zanim będzie można odświeżyć metadane w zadaniu danych.

InformacjaTa operacja wpływa tylko na tabele w zadaniu projektowania.
  1. Możesz wybrać jedną z opcji:

    • Kliknij ..., a następnie Odśwież metadane, aby odświeżyć metadane dla wszystkich zestawów danych w zadaniu.

    • Kliknij ... na zestawie danych w obszarze Zestawy danych, a następnie Odśwież metadane, aby odświeżyć metadane dla pojedynczego zestawu danych.

    Stan odświeżania metadanych można sprawdzić w obszarze Odśwież metadane w dolnej części ekranu. Datę ostatniego odświeżenia metadanych można zobaczyć w przycisk informacji.

  2. Przygotuj zadanie danych, aby zastosować zmiany

    Po przygotowaniu zadania danych i zastosowaniu zmian zmiany zostaną usunięte z Odśwież metadane.

Należy przygotować zadania pamięci masowej, które wykorzystują to zadanie, aby propagować zmiany.

Jeśli kolumna zostanie usunięta, dodana zostanie transformacja z wartościami Null, aby zapewnić, że pamięć nie utraci danych historycznych.

Ograniczenia

  • Zmiana nazwy wcześniej usuniętej kolumny w tym samym przedziale czasowym zostanie zinterpretowana jako zmiana nazwy usuniętej kolumny, jeśli mają one ten sam typ i długość danych.

    Przykład:  

    Przed: a b c d

    Po: a c1 d

    W tym przykładzie usunięto b i zmieniono nazwę c na c1, a b i c mają ten sam typ i długość danych.

    Zostanie to zidentyfikowane jako zmiana nazwy b na c1 i usunięcie c.

  • Zmiana nazwy ostatniej kolumny nie jest rozpoznawana, nawet jeśli ostatnia kolumna została usunięta, a nazwa poprzedniej kolumny została zmieniona.

    Przykład:  

    Przed: a b c d

    Po: a b c1

    W tym przykładzie usunięto d, a nazwę c zmieniono na c1.

    Zostanie to zidentyfikowane jako usunięcie c i d oraz dodanie c1.

  • Zakłada się, że nowe kolumny będą dodawane na końcu. Jeśli w środku zostaną dodane kolumny z tym samym typem danych co w następnej kolumnie, może to zostać zinterpretowane jako usunięcie i zmiana nazwy.

Czy ta strona była pomocna?

Jeżeli natkniesz się na problemy z tą stroną lub jej zawartością — literówkę, brakujący krok lub błąd techniczny — daj nam znać, co możemy poprawić!