Umieszczanie danych w jeziorze danych w ramach subskrypcji Standard, Premium lub Enterprise

Możesz skonfigurować zadanie umieszczania danych w jeziorze danych, aby umieścić dane w następujących miejscach docelowych:

Amazon S3

Informacje na temat konfigurowania połączenia z Amazon S3 zawiera temat Amazon S3.
Azure Data Lake Storage

Informacje na temat konfigurowania połączenia z usługą Azure Data Lake Storage zawiera temat Azure Data Lake Storage.
Google Cloud Storage

Informacje na temat konfigurowania połączenia z usługą Google Cloud Storage zawiera temat Google Cloud Storage.

Chociaż możesz skonfigurować ustawienia połączenia źródła i miejsca docelowego w kreatorze konfiguracji zadania umieszczania danych w jeziorze danych, aby uprościć procedurę konfiguracji, zaleca się wykonanie tej czynności przed utworzeniem zadania.

Informacje o konfigurowaniu powiązań ze źródłami danych można znaleźć w temacie Konfiguracja połączeń ze źródłami danych.

Aby skonfigurować zadanie umieszczania w jeziorze danych:

W Integracja danych > Projekty, kliknij Utwórz nowy > Projekt.
W oknie dialogowym Nowy projekt wykonaj następujące czynności:
1. Podaj Nazwę swojego projektu.
2. Wybierz Przestrzeń, w której chcesz utworzyć projekt.
3. Opcjonalnie podaj Opis.
4. Wybierz opcję Replikacja jako Zastosowanie.
5. Opcjonalnie usuń zaznaczenie pola Otwórz, jeśli chcesz utworzyć pusty projekt bez konfigurowania ustawień.
6. Kliknij Utwórz.
  
  Nastąpi jedna z poniższych sytuacji:
  - Jeżeli w oknie dialogowym Nowy projekt zostało zaznaczone pole wyboru Otwórz (domyślnie), projekt zostanie otwarty.
  - Jeżeli w oknie dialogowym Nowy projekt zostało usunięte zaznaczenie pola Otwórz, projekt zostanie dodany do Twojej listy projektów. Możesz otworzyć projekt później, wybierając polecenie Otwórz z menu projektu.
Po otwarciu projektu kliknij Umieść dane w jeziorze danych.

Zostanie otwarty kreator Umieść dane w jeziorze danych.
Na karcie Ogólne określ nazwę i opis zadania umieszczania w jeziorze danych. Następnie kliknij Dalej.

InformacjaNazwy zawierające ukośnik (/) lub ukośnik odwrotny (\) nie są obsługiwane.
Na karcie Wybierz połączenie źródłowe wybierz połączenie z danymi źródłowymi. Opcjonalnie możesz edytować ustawienia połączenia wybierając opcję Edytuj z menu w kolumnie Działania.

InformacjaW przypadku zmiany połączenia źródłowego lub źródłowej bramy danych po przygotowaniu zadania należy odtworzyć wszystkie zestawy danych.

Jeśli nie masz jeszcze połączenia z danymi źródłowymi, musisz je najpierw utworzyć, klikając Utwórz połączenie w prawym górnym rogu karty.

Listę połączeń można filtrować, korzystając z filtrów po lewej stronie. Połączenia można filtrować według typu źródła, bramy, przestrzeni i właściciela. Przycisk Wszystkie filtry nad listą połączeń pokazuje liczbę bieżących filtrów. Za pomocą tego przycisku można zamknąć lub otworzyć panel Filtry po lewej stronie. Aktualnie aktywne filtry widoczne są także nad listą dostępnych połączeń.

Możesz także posortować listę, wybierając opcję Ostatnia modyfikacja, Ostatnio utworzone lub Alfabetycznie z listy rozwijanej po prawej stronie. Aby zmienić kolejność sortowania, kliknij strzałkę po prawej stronie listy.

Po wybraniu połączenia ze źródłem danych opcjonalnie kliknij Testuj połączenie w prawym górnym rogu karty (zalecane), a następnie kliknij Dalej.
Na karcie Wybierz zestawy danych wybierz tabele i/lub widoki do uwzględnienia w zadaniu umieszczania w jeziorze danych. Można także używać symboli wieloznacznych i tworzyć reguły wyboru zgodnie z opisem w temacie Selekcja danych z bazy danych.

InformacjaNazwy schematów lub nazwy tabel zawierające ukośnik (/) lub ukośnik odwrotny (\) nie są obsługiwane.
Na karcie Wybierz połączenie z celem wybierz miejsce docelowe z listy dostępnych połączeń, a następnie kliknij Dalej. Pod względem funkcjonalnym ta karta nie różni się od opisanej wcześniej karty Wybierz połączenie źródłowe.

InformacjaW przypadku zmiany połączenia z celem po przygotowaniu zadania należy odtworzyć wszystkie zestawy danych.
Na karcie Ustawienia opcjonalnie zmień następujące ustawienia, a następnie kliknij Dalej.

Metoda aktualizacji:
- Przechwytywanie zmian danych (CDC) za pomocą tabel zmian: Zadania umieszczania w jeziorze danych rozpoczynają się od pełnego ładowania (podczas którego wszystkie wybrane tabele są ładowane do miejsca docelowego). Dane w miejscu docelowym są następnie aktualizowane przy użyciu technologii przechwytywania danych zmian (CDC).
  
  InformacjaPrzechwytywanie zmian danych operacji DDL nie jest obsługiwane.
  
  Podczas pracy z Brama danych ruchu danych, z wyjątkiem używania źródła aplikacji SaaS, zmiany są przechwytywane ze źródła w czasie niemal rzeczywistym. Podczas pracy bez Brama danych ruchu danych lub ze źródłami aplikacji SaaS, zmiany są przechwytywane zgodnie z ustawieniami harmonogramu. Więcej informacji zawiera temat Scheduling tasks.
- Ponowne ładowanie: Wykonuje pełne ładowanie danych z wybranych tabel źródłowych na platformę docelową i w razie potrzeby tworzy tabele docelowe. Pełne ładowanie następuje automatycznie w momencie rozpoczęcia zadania, ale w razie potrzeby można je wykonać także ręcznie lub zaplanować tak, aby występowało okresowo, w miarę potrzeb.
  
  InformacjaTo ustawienie nie jest dostępne podczas używania łącznika aplikacji SaaS.
Informacja
Gdy Przechwytywanie zmian danych (CDC) jest metodą aktualizacji i Twoje źródło danych:
- Nie jest aplikacją SaaS
- Zawiera zestawy danych, które obsługują CDC, oraz zestawy danych, które obsługują tylko przeładowanie (takie jak widoki)
Dwa potoki danych zostaną utworzone. Jeden potok zostanie utworzony dla tabel obsługujących CDC, a inny potok zostanie utworzony dla zestawów danych obsługujących tylko przeładowanie.
Folder do użycia

Wybierz jedną z poniższych opcji, w zależności od tego, do którego folderu zasobnika mają zostać zapisane pliki:
- Folder domyślny
  
  Domyślny format folderu to <nazwa-twojego-projektu>/<nazwa-twojego-zadania>
- Folder główny
  
  Pliki zostaną zapisane w głównym folderze zasobnika.
- Folder
  
  Określ nazwę folderu. Folder zostanie utworzony podczas zadania danych, jeśli jeszcze nie istnieje.
  
  Informacja Nazwa folderu nie może zawierać znaków specjalnych (na przykład @, #, ! itp.).
Harmonogram replikacji

Można zaplanować, jak często przechwytywać zmiany ze źródła danych oraz ustawić datę i godzinę rozpoczęcia. Kreator konfiguracji zadania umożliwia ustawienie podstawowej częstotliwości planowania. Po zakończeniu konfiguracji zadania dostępne są dodatkowe opcje planowania.

Aby uzyskać opis wszystkich opcji planowania, zobacz Scheduling tasks.
Na karcie Podsumowanie wyświetlana jest wizualizacja potoku danych. Wybierz Otwórz zadanie <name> lub Nic nie rób. Następnie kliknij Utwórz.

W zależności od dokonanego wyboru albo zadanie zostanie otwarte, albo wyświetli się lista projektów.
Jeśli zdecydujesz się otworzyć zadanie, na karcie Zestawy danych zostanie wyświetlona struktura i metadane wybranych tabel zasobów danych. Dotyczy to wszystkich jawnie wybranych tabel oraz tabel pasujących do reguł wyboru.

Jeśli chcesz dodać więcej tabel ze źródła danych, kliknij Wybierz źródło danych.
Opcjonalnie zmień ustawienie zadania zgodnie z opisem w temacie Ustawienia celów przechowywania w chmurze.
Możesz wykonywać transformacje na zestawach danych, filtrować dane lub dodawać kolumny.

Więcej informacji zawiera temat Zarządzanie zestawami danych.
Po dodaniu odpowiednich transformacji możesz zatwierdzić zestawy danych, klikając Zatwierdź zestawy danych. Jeśli walidacja się nie powiedzie, napraw błędy przed kontynuacją.

Więcej informacji zawiera temat Sprawdzanie poprawności i dostosowywanie zestawów danych.
Kiedy wszystko będzie gotowe, kliknij Przygotuj, aby skatalogować zadanie umieszczania i przygotować je do wykonania.
Po przygotowaniu zadania danych kliknij Uruchom.
Powinno się teraz rozpocząć zadanie umieszczania w jeziorze danych. Możesz monitorować jego postęp w widoku Monitoruj. Więcej informacji: Monitorowanie indywidualnego zadania danych

Ustawianie priorytetu ładowania dla zestawów danych

Kolejność ładowania zestawów danych w zadaniu danych można kontrolować, przypisując każdemu z nich priorytet ładowania. Może się to przydać na przykład do ładowania mniejszych zestawów danych przed dużymi.

Kliknij Priorytet ładowania.
Wybierz priorytet ładowania dla każdego zestawu danych.

Domyślny priorytet ładowania to Normalny. Zestawy danych będą ładowane w następującej kolejności priorytetów:
- Najwyższy
- Wyższy
- Wysoka
- Normalny
- Niska
- Niższy
- Najniższy
Zestawy danych z tym samym priorytetem będą ładowane w kolejności dowolnej.
Kliknij przycisk OK.

Zestawy danych ze źródeł aplikacji SaaS mogą zawierać zależności w kolejności ładowania. Uwzględnij to podczas ustawiania priorytetu ładowania.

Ewolucja schematu

Ewolucja schematów pozwala łatwo wykrywać zmiany strukturalne w wielu źródłach danych, a następnie kontrolować, jak zmiany te zostaną zastosowane do zadania. Ewolucja schematu może być używana do wykrywania zmian DDL, które zostały wprowadzone do schematu źródła danych. Niektóre zmiany możesz również stosować automatycznie.

Ewolucja schematu nie jest dostępna z subskrypcją Qlik Talend Cloud Starter. Podczas pracy z łącznikami aplikacji SaaS obsługiwane są tylko zmiany typu danych.

Dla każdego typu zmian można wybrać sposób obsługi zmian w sekcji Ewolucja schematu w ustawieniach zadania. Możesz zastosować lub zignorować zmianę, zawiesić tabelę lub zatrzymać przetwarzanie zadania.

Możesz ustawić, które działanie ma być używane do obsługi zmiany DDL dla każdego typu zmiany. Niektóre działania nie są dostępne dla wszystkich typów zmian.

Zastosuj do celu

Zastosuj zmiany automatycznie.
Ignoruj

Zignoruj zmiany.
Zawieś tabelę

Zawieś tabelę. Tabela zostanie wyświetlona jako błąd w sekcji Monitorowanie.
Zatrzymaj zadanie

Zatrzymaj przetwarzanie zadania. Jest to przydatne, jeśli chcesz obsługiwać wszystkie zmiany schematu ręcznie. Spowoduje to również zatrzymanie planowania, tzn. zaplanowane uruchomienia nie zostaną wykonane.

Obsługiwane są następujące zmiany:

Dodanie kolumny
Zmień nazwę kolumny
Zmień typ danych kolumny
Dodanie tabeli pasującej do wzorca wyboru

Jeśli użyto reguły wyboru, aby dodać zestawy danych pasujące do wzorca, nowe tabele spełniające ten wzorzec zostaną wykryte i dodane.

Więcej informacji o ustawieniach zadania, zobacz Automatyczna ewolucja schematu

Można również otrzymywać powiadomienia o zmianach, które są obsługiwane przy użyciu ewolucji schematu. Więcej informacji zawiera temat Ustawianie powiadomień o zmianach w działaniu.

Ograniczenia dla ewolucji schematu

W odniesieniu do ewolucji schematu obowiązują następujące ograniczenia:

Ewolucja schematu jest obsługiwana tylko w przypadku korzystania z CDC jako metody aktualizacji.
Po zmianie ustawień ewolucji schematu należy ponownie przygotować zadanie.
W przypadku zmiany nazw tabel ewolucja schematu nie jest obsługiwana. W takim przypadku należy odświeżyć metadane przed przygotowaniem zadania.
Jeśli projektujesz zadanie, należy odświeżyć przeglądarkę, aby otrzymać zmiany ewolucji schematu. Można ustawić powiadomienia, aby otrzymywać alarmy o zmianach.
W zadaniach umieszczania usuwanie kolumny nie jest obsługiwane. Usunięcie kolumny i jej dodanie spowoduje błąd tabeli.
W zadaniach umieszczania operacja usunięcia tabeli nie spowoduje usunięcia tabeli. Usunięcie tabeli, a następnie jej dodanie spowoduje jedynie obcięcie starej tabeli, a nowa tabela nie zostanie dodana.
Zmiana długości kolumny nie jest możliwa dla wszystkich obiektów docelowych w zależności od obsługi w docelowej bazie danych.
Jeśli nazwa kolumny zostanie zmieniona, jawne transformacje zdefiniowane przy użyciu tej kolumny nie będą miały wpływu, ponieważ są one oparte na nazwie kolumny.
Ograniczenia dotyczące odświeżania metadanych mają również zastosowanie do ewolucji schematu.
Jeśli zadanie zawiera zmiany projektowe, które nie zostały jeszcze przygotowane, a podczas uruchamiania zadania zostaną wykryte zmiany ewolucji schematu źródłowego, zadanie zostanie zatrzymane, aby uniknąć konfliktów. Przygotuj oczekujące zmiany projektowe i uruchom zadanie ponownie.

Podczas przechwytywania zmian DDL obowiązują następujące ograniczenia:

Gdy w źródłowej bazie danych występuje szybka sekwencja operacji (na przykład DDL>DML>DDL), Qlik Talend Data Integration może przeanalizować dziennik w niewłaściwej kolejności, co może skutkować brakiem danych lub nieprzewidywalnym działaniem. Aby zminimalizować ryzyko wystąpienia takiej sytuacji, najlepszą praktyką jest poczekanie na zastosowanie zmian w obiekcie docelowym przed wykonaniem kolejnej operacji.

Na przykład podczas przechwytywania zmian, jeśli nazwa tabeli źródłowej zostanie zmieniona wiele razy w krótkim odstępie czasu (a druga operacja zmieni jej nazwę z powrotem na oryginalną), może wystąpić komunikat o błędzie, że tabela już istnieje w docelowej bazie danych.
Jeśli zmienisz nazwę tabeli używanej w zadaniu, a następnie zatrzymasz zadanie, Qlik Talend Data Integration nie przechwyci żadnych zmian dokonanych w tej tabeli po wznowieniu zadania.
Zmiana nazwy tabeli źródłowej, gdy zadanie jest zatrzymane, nie jest obsługiwana.
Realokacja kolumn klucza głównego tabeli nie jest obsługiwana (i dlatego nie zostanie zapisana w tabeli kontrolnej Historia DDL).
Gdy typ danych kolumny zostanie zmieniony, a następnie nazwa (tej samej) kolumny zostanie zmieniona, kiedy zadanie zostanie zatrzymane, zmiana DDL pojawi się w tabeli kontrolnej Historia DDL jako działanie „Usuń kolumnę”, a następnie „Dodaj kolumnę” po wznowieniu zadania. Takie samo działanie może również wystąpić w wyniku przedłużającego się opóźnienia.
Operacje CREATE TABLE wykonywane na źródle, gdy zadanie jest zatrzymane, zostaną zastosowane do celu, gdy zadanie zostanie wznowione, ale nie zostaną zapisane jako DDL w tabeli kontrolnej Historia DDL.
Operacje związane ze zmianami metadanych (takie jak ALTER TABLE, reorganizacja, odbudowa indeksu klastrowego itp.) mogą powodować nieprzewidywalne działania, jeśli zostaną wykonane:
- Podczas pełnego ładowania
  
  LUB
- Pomiędzy znacznikiem czasu opcji Zacznij przetwarzanie zmian od a bieżącym czasem (tj. momentem, w którym użytkownik kliknie przycisk OK w oknie dialogowym Zaawansowane opcje uruchamiania).
  
  Przykład:
  
  IF:
  
  Określony czas opcji Zacznij przetwarzanie zmian od to 10:00.
  
  AND:
  
  Kolumna o nazwie Wiek została dodana do tabeli Pracownicy o godzinie 10:10.
  
  AND:
  
  Użytkownik klika OK w oknie dialogowym Zaawansowane opcje uruchamiania o godzinie 10:15.
  
  THEN:
  
  Zmiany, które nastąpiły między 10:00 a 10:10 mogą skutkować błędami CDC.
Informacja
W każdym z powyższych przypadków należy przeładować tabele danych, aby dane zostały poprawnie przeniesione do miejsca docelowego.

Instrukcja DDL ALTER TABLE ADD/MODIFY <column> <data_type> DEFAULT <> nie replikuje wartości domyślnej do wartości docelowej, a nowa/zmodyfikowana kolumna jest ustawiona na NULL. Może się tak zdarzyć, nawet jeśli instrukcja DDL, która dodała lub zmodyfikowała kolumnę została wykonana w przeszłości. Jeśli nowa lub zmodyfikowana kolumna jest pusta, źródłowy punkt końcowy aktualizuje wszystkie wiersze tabeli przed zarejestrowaniem samej instrukcji DDL. W rezultacie Qlik Talend Data Integration przechwytuje zmiany, ale nie aktualizuje celu. Ponieważ nowa lub modyfikowana kolumna jest ustawiona na NULL, jeśli tabela docelowa nie ma klucza głównego / unikatowego indeksu, kolejne aktualizacje wygenerują komunikat „zmieniono zero wierszy”.
Modyfikacje kolumn o precyzji TIMESTAMP i DATE nie będą rejestrowane.

Zmiana bramy lub połączeń

W przypadku zmiany połączenia docelowego lub źródłowego, lub bramy źródłowej, należy ponownie utworzyć tabele.

Wyświetlanie informacji o zadaniu

Kliknij na pasku menu, aby wyświetlić informacje o zadaniu, takie jak:

Właściciel
Przestrzeń
Platforma danych
Identyfikator projektu
Identyfikator czasu wykonania zadania danych

Ograniczenia i uwagi dotyczące umieszczania danych w jeziorze danych

Transformacje podlegają następującym ograniczeniom:

Transformacje nie są obsługiwane w przypadku kolumn z tekstem w językach od prawej do lewej.
Nie można wykonywać transformacji na kolumnach, które mają w nazwie znaki specjalne (np. #, \, /, -).
Jedyną obsługiwaną transformacją dla typów danych LOB/CLOB jest usunięcie kolumny w miejscu docelowym.
Nie jest obsługiwane używanie transformacji polegającej na zmianie nazwy kolumny i dodaniu nowej kolumny o tej samej nazwie.

Zmiana dopuszczalności wartości null nie jest obsługiwana w przypadku kolumn przenoszonych, niezależnie od tego, czy są zmieniane bezpośrednio, czy też za pomocą reguły transformacji. W przypadku nowych kolumn utworzonych w zadaniu wartości null są jednak dopuszczalne domyślnie.

Czy ta strona była pomocna?

Jeżeli natkniesz się na problemy z tą stroną lub jej zawartością — literówkę, brakujący krok lub błąd techniczny — daj nam znać!

Przekaż tu opinię