Replikacja danych w ramach subskrypcji Qlik Talend Cloud Starter
Korzystając z kreatora konfiguracji zadania, możesz łatwo skonfigurować zadanie replikacji zaledwie kilkoma kliknięciami.
Ustawienia pokazane w kreatorze odzwierciedlają wybrany typ celu. Na przykład podczas replikacji do docelowych miejsc pamięci masowej, takich jak Amazon S3, pojawi się prośba o podanie lokalizacji przechowywania. W przypadku replikacji do obiektów docelowych takich jak Amazon Redshift, które wymagają obszaru tymczasowego, zostanie wyświetlony monit o zdefiniowanie lub wybranie obszaru tymczasowego.
Poniższa tabela pomoże Ci poruszać się po tym temacie zgodnie z zamierzonym celem.
Replikacja do baz danych i hurtowni danych bez etapu tymczasowego
Skonfiguruj zadanie replikacji do baz danych lub hurtowni danych, które nie wymagają etapu tymczasowego, czyli:
- Google BigQuery
- Snowflake
Replikacja do baz danych i hurtowni danych z obszarem tymczasowym
Skonfiguruj zadanie replikacji do hurtowni danych wymagających etapu tymczasowego, czyli:
- Amazon Redshift
- Microsoft Fabric
- Databricks
Replikowanie do pamięci w chmurze
Skonfiguruj zadanie replikacji do pamięci w chmurze.
Replikacja do baz danych i hurtowni danych bez etapu tymczasowego
W tej sekcji wyjaśniono, jak skonfigurować zadanie replikacji do baz danych i hurtowni danych, które nie wymagają oddzielnego obszaru tymczasowego.
Wykonaj następujące czynności:
-
W Integracja danych > Strona główna kliknij Replikuj dane.
Zostanie otwarty kreator Replikuj dane.
-
Na karcie Ogólne wykonaj następujące czynności:
-
Nazwa zadania
Określ nazwę zadania.
-
Opis
Opcjonalnie wpisz opis zadania.
-
Projekt
Wykonaj jedną z poniższych czynności:
- Wybierz istniejący już projekt.
-
Określ nazwę nowego projektu, a następnie kliknij Dodaj nowy projekt: <nazwa-projektu> pod polem Projekt.
Nazwa projektu zostanie dodana do pola Projekt.
-
Przestrzeń
Wybierz przestrzeń danych do projektu replikacji. Jeżeli nie zostały jeszcze utworzone przestrzenie danych, wykonaj jedną z następujących czynności:
-
Wybierz Data-Space (domyślną przestrzeń danych dzierżawy)
InformacjaData-Space ma pełne uprawnienia dla wszystkich członków. Role i uprawnienia poszczególnych członków można edytować później, jak opisano to w temacie Role i uprawnienia w przestrzeni danych. -
Anuluj kreator, utwórz własny obszar danych zgodnie z opisem w sekcji Tworzenie przestrzeni danych, a następnie ponownie uruchom kreator.
Więcej informacji na temat przestrzeni danych zawiera temat Praca w przestrzeniach w Qlik Talend Data Integration.
-
-
-
Kliknij przycisk Dalej. Na karcie Wybierz połączenie źródłowe wybierz połączenie z danymi źródłowymi. Opcjonalnie możesz edytować ustawienia połączenia wybierając opcję Edytuj z menu w kolumnie Działania.
Jeśli nie utworzono jeszcze połączenia ze źródłem danych, musisz je utworzyć, klikając Utwórz połączenie w prawym górnym rogu karty.
Listę połączeń można filtrować, korzystając z filtrów po lewej stronie. Połączenia można filtrować według typu źródła, bramy, przestrzeni i właściciela. Przycisk Wszystkie filtry nad listą połączeń pokazuje liczbę bieżących filtrów. Za pomocą tego przycisku można zamknąć lub otworzyć panel Filtry po lewej stronie. Aktualnie aktywne filtry widoczne są także nad listą dostępnych połączeń.
Możesz także posortować listę, wybierając opcję Ostatnia modyfikacja, Ostatnio utworzone lub Alfabetycznie z listy rozwijanej po prawej stronie. Aby zmienić kolejność sortowania, kliknij strzałkę po prawej stronie listy.
Po wybraniu połączenia ze źródłem danych opcjonalnie kliknij Testuj połączenie w prawym górnym rogu karty (zalecane), a następnie kliknij Dalej.
-
Na karcie Wybierz zestawy danych wybierz tabele i/lub widoki do uwzględnienia w zadaniu replikacji. Można także używać symboli wieloznacznych i tworzyć reguły wyboru zgodnie z opisem w temacie Selekcja danych z bazy danych.
-
Na karcie Wybierz połączenie z celem wybierz miejsce docelowe z listy dostępnych połączeń, a następnie kliknij Dalej. Pod względem funkcjonalnym ta karta nie różni się od opisanej wcześniej karty Wybierz połączenie źródłowe.
-
Na karcie Ustawienia opcjonalnie zmień następujące ustawienia, a następnie kliknij Dalej.
Tryb replikacji
InformacjaPodczas replikacji ze źródeł aplikacji SaaS tryb replikacji Pełne ładowanie jest domyślnie włączony i nie można go wyłączyć.- Pełne ładowanie: Ładuje dane z wybranych tabel źródłowych na platformę docelową i w razie potrzeby tworzy tabele docelowe. Pełne ładowanie następuje automatycznie w momencie rozpoczęcia zadania, ale w razie potrzeby można je wykonać także ręcznie.
-
Zastosuj zmiany: Zapewnia aktualność tabel docelowych względem wszelkich zmian wprowadzonych w tabelach źródłowych.
-
Zapisz zmiany: Przechowuje zmiany w tabelach źródłowych w tabelach zmian (po jednej na tabelę źródłową).
Więcej informacji zawiera temat Zapisz zmiany.
Częstotliwość przechwytywania zmian danych zależy od ustawień harmonogramu. Domyślny interwał przechwytywania zmian wynosi sześć godzin. Więcej informacji zawiera temat Planowanie zadań podczas pracy bez Brama danych ruchu danych.
Schematy niestandardowe
- Schemat docelowego zestawu danych: Opcjonalnie wybierz schemat, w którym chcesz utworzyć zestawy danych w miejscu docelowym.
- Schemat tabeli kontrolnej: Opcjonalnie wybierz schemat, w którym chcesz utworzyć tabele kontrolne w miejscu docelowym.
Planista replikacji
-
Replikuj dane co: Można zaplanować częstotliwość przechwytywania zmian ze źródła danych oraz ustawić Godzinę rozpoczęcia i Datę rozpoczęcia. Jeśli źródłowe zestawy danych obsługują przechwytywanie zmian danych (CDC), tylko zmiany w danych źródłowych zostaną zreplikowane i zastosowane w odpowiednich tabelach docelowych. Jeśli źródłowe zestawy danych nie obsługują CDC (na przykład widoki), zmiany zostaną zastosowane przez ponowne załadowanie wszystkich danych źródłowych do odpowiednich tabel docelowych. Jeśli niektóre źródłowe zestawy danych obsługują CDC, a inne nie, zostaną utworzone dwa osobne zadania podrzędne (zakładając, że Zastosuj zmiany lub wybrano opcje replikacji Zapisz zmiany): jedno do przeładowania zestawów danych, które nie obsługują CDC, a drugie do przechwycenia zmian w zestawach danych, które obsługują CDC.
Kreator konfiguracji zadania umożliwia zaplanowanie interwału godzinowego. Po zakończeniu konfiguracji zadania możesz zapoznać się z różnymi opcjami planowania, jak opisano to w temacie Planowanie zadań podczas pracy bez Brama danych ruchu danych.
Informacje na temat minimalnych interwałów planowania według typu źródła danych i poziomu subskrypcji zawiera temat Minimalne dozwolone interwały planowania.
Ustawienia te można zmienić później, jak opisano to w temacie Ustawienia zadania replikacji danych.
-
Na karcie Podsumowanie wyświetlana jest wizualizacja potoku danych. Wybierz jedno z następujących działań Po utworzeniu potoku:
- Otwórz projekt <nazwa> (domyślnie)
-
Otwórz zadanie danych <name>
InformacjaJeśli niektóre z wybranych zestawów danych nie obsługują CDC, zostaną wyświetlone dwa potoki: jeden dla zadania CDC, a drugi dla zadania przeładowania.
Następnie kliknij Utwórz i uruchom (domyślnie) lub Utwórz, aby utworzyć zadanie bez jego uruchamiania.
Jeżeli klikniesz Utwórz i uruchom, zadanie zostanie utworzone i zacznie działać (co może potrwać kilka chwil).
-
Kliknięcie Utwórz będzie mieć jeden z następujących rezultatów zgodnie z wybranym wcześniej działaniem Po utworzeniu potoku:
- Zostanie otwarty projekt z nowo utworzonym zadaniem.
-
Zadanie zostanie otwarte na karcie Zestawy danych. Na karcie Zestawy danych jest wyświetlana struktura i metadane wybranych tabel źródłowych. Dotyczy to wszystkich jawnie wybranych tabel oraz tabel pasujących do reguł wyboru.
Jeśli chcesz dodać więcej tabel ze źródła danych, kliknij Wybierz źródło danych.
-
Możesz wykonywać transformacje na zestawach danych, filtrować dane lub dodawać kolumny.
Więcej informacji zawiera temat Zarządzanie zestawami danych.
-
Po dodaniu odpowiednich transformacji możesz zatwierdzić zestawy danych, klikając Zatwierdź zestawy danych. Jeśli walidacja się nie powiedzie, napraw błędy przed kontynuacją.
Więcej informacji zawiera temat Sprawdzanie poprawności i dostosowywanie zestawów danych.
-
Kiedy wszystko będzie gotowe, kliknij Przygotuj i uruchom, aby przygotować i uruchomić zadanie danych.
Informacje na temat odzyskiwania zadań i innych metod uruchamiania zadań zawiera temat Zaawansowane opcje uruchamiania.
-
Zadanie replikacji powinno się teraz rozpocząć, a jego przebieg możesz zobaczyć w menu Monitoruj. Więcej informacji zawiera temat Monitorowanie indywidualnego zadania danych
Replikacja do baz danych i hurtowni danych z obszarem tymczasowym
W tej sekcji wyjaśniono, jak skonfigurować zadanie replikacji do baz danych i hurtowni danych, które wymagają oddzielnego obszaru tymczasowego.
Wykonaj następujące czynności:
-
W Integracja danych> Strona główna kliknij Replikuj dane.
Zostanie otwarty kreator Replikuj dane.
-
Na karcie Ogólne wykonaj następujące czynności:
-
Nazwa zadania
Określ nazwę zadania.
-
Opis
Opcjonalnie wpisz opis zadania.
-
Projekt
Wykonaj jedną z poniższych czynności:
- Wybierz istniejący już projekt.
-
Określ nazwę nowego projektu, a następnie kliknij Dodaj nowy projekt: <nazwa-projektu> pod polem Projekt.
Nazwa projektu zostanie dodana do pola Projekt.
-
Przestrzeń
Wybierz przestrzeń danych do projektu replikacji. Jeżeli nie zostały jeszcze utworzone przestrzenie danych, wykonaj jedną z następujących czynności:
-
Wybierz Data-Space (domyślną przestrzeń danych dzierżawy)
InformacjaData-Space ma pełne uprawnienia dla wszystkich członków. Role i uprawnienia poszczególnych członków można edytować później, jak opisano to w temacie Role i uprawnienia w przestrzeni danych. -
Anuluj kreatora, utwórz własną przestrzeń danych zgodnie z opisem w temacie Tworzenie przestrzeni danych i uruchom kreatora ponownie.
Więcej informacji na temat przestrzeni danych zawiera temat Praca w przestrzeniach w Qlik Talend Data Integration.
-
-
-
Kliknij przycisk Dalej. Na karcie Wybierz połączenie źródłowe wybierz połączenie z danymi źródłowymi. Opcjonalnie możesz edytować ustawienia połączenia wybierając opcję Edytuj z menu w kolumnie Działania.
Jeśli nie utworzono jeszcze połączenia ze źródłem danych, musisz je utworzyć, klikając Utwórz połączenie w prawym górnym rogu karty.
Listę połączeń można filtrować, korzystając z filtrów po lewej stronie. Połączenia można filtrować według typu źródła, bramy, przestrzeni i właściciela. Przycisk Wszystkie filtry nad listą połączeń pokazuje liczbę bieżących filtrów. Za pomocą tego przycisku można zamknąć lub otworzyć panel Filtry po lewej stronie. Aktualnie aktywne filtry widoczne są także nad listą dostępnych połączeń.
Możesz także posortować listę, wybierając opcję Ostatnia modyfikacja, Ostatnio utworzone lub Alfabetycznie z listy rozwijanej po prawej stronie. Aby zmienić kolejność sortowania, kliknij strzałkę po prawej stronie listy.
Po wybraniu połączenia ze źródłem danych opcjonalnie kliknij Testuj połączenie w prawym górnym rogu karty (zalecane), a następnie kliknij Dalej.
-
Na karcie Wybierz zestawy danych wybierz tabele i/lub widoki do uwzględnienia w zadaniu replikacji. Można także używać symboli wieloznacznych i tworzyć reguły wyboru zgodnie z opisem w temacie Selekcja danych z bazy danych.
-
Na karcie Wybierz połączenie z celem wybierz miejsce docelowe z listy dostępnych połączeń, a następnie kliknij Dalej. Pod względem funkcjonalnym ta karta nie różni się od opisanej wcześniej karty Wybierz połączenie źródłowe.
-
Na karcie Ustawienia opcjonalnie zmień następujące ustawienia, a następnie kliknij Dalej.
Tryb replikacji
InformacjaPodczas replikacji ze źródeł aplikacji SaaS tryb replikacji Pełne ładowanie jest domyślnie włączony i nie można go wyłączyć.- Pełne ładowanie: Ładuje dane z wybranych tabel źródłowych na platformę docelową i w razie potrzeby tworzy tabele docelowe. Pełne ładowanie następuje automatycznie w momencie rozpoczęcia zadania, ale w razie potrzeby można je wykonać także ręcznie.
-
Zastosuj zmiany: Zapewnia aktualność tabel docelowych względem wszelkich zmian wprowadzonych w tabelach źródłowych.
-
Zapisz zmiany: Przechowuje zmiany w tabelach źródłowych w tabelach zmian (po jednej na tabelę źródłową).
Więcej informacji zawiera temat Zapisz zmiany.
Częstotliwość przechwytywania zmian danych zależy od ustawień harmonogramu. Domyślny interwał przechwytywania zmian wynosi sześć godzin. Więcej informacji zawiera temat Planowanie zadań podczas pracy bez Brama danych ruchu danych.
Połączenie z obszarem tymczasowym
W przypadku replikacji do hurtowni danych wymienionych poniżej należy ustawić obszar tymczasowy. Dane są przetwarzane i przygotowywane w obszarze tymczasowym przed przesłaniem do hurtowni danych.
Wybierz istniejący obszar tymczasowy lub kliknij opcję Utwórz nowy, aby zdefiniować nowy obszar przejściowy, i postępuj zgodnie z instrukcjami w temacie Łączenie z pamięcią w chmurze.
Aby edytować ustawienia połączenia, kliknij Edytuj. Aby przetestować połączenie (zalecane), kliknij Testuj połączenie.
Aby uzyskać informacje o tym, które obszary tymczasowe są obsługiwane w których hurtowniach danych, zobacz kolumnę Obsługiwane jako obszar przejściowy w temacie Zastosowania platformy docelowej i obsługiwane wersje.
Schematy niestandardowe
- Schemat docelowego zestawu danych: Opcjonalnie wybierz schemat, w którym chcesz utworzyć zestawy danych w miejscu docelowym.
- Schemat tabeli kontrolnej: Opcjonalnie wybierz schemat, w którym chcesz utworzyć tabele kontrolne w miejscu docelowym.
Planista replikacji
-
Replikuj dane co: Można zaplanować częstotliwość przechwytywania zmian ze źródła danych oraz ustawić Godzinę rozpoczęcia i Datę rozpoczęcia. Jeśli źródłowe zestawy danych obsługują przechwytywanie zmian danych (CDC), tylko zmiany w danych źródłowych zostaną zreplikowane i zastosowane w odpowiednich tabelach docelowych. Jeśli źródłowe zestawy danych nie obsługują CDC (na przykład widoki), zmiany zostaną zastosowane przez ponowne załadowanie wszystkich danych źródłowych do odpowiednich tabel docelowych. Jeśli niektóre źródłowe zestawy danych obsługują CDC, a inne nie, zostaną utworzone dwa osobne zadania podrzędne (zakładając, że Zastosuj zmiany lub wybrano opcje replikacji Zapisz zmiany): jedno do przeładowania zestawów danych, które nie obsługują CDC, a drugie do przechwycenia zmian w zestawach danych, które obsługują CDC.
Kreator konfiguracji zadania umożliwia zaplanowanie interwału godzinowego. Po zakończeniu konfiguracji zadania możesz zapoznać się z różnymi opcjami planowania, jak opisano to w temacie Planowanie zadań podczas pracy bez Brama danych ruchu danych.
Ustawienia te można zmienić później, jak opisano to w temacie Ustawienia zadania replikacji danych.
-
Na karcie Podsumowanie wyświetlana jest wizualizacja potoku danych. Wybierz jedno z następujących działań Po utworzeniu potoku:
- Otwórz projekt <nazwa> (domyślnie)
-
Otwórz zadanie danych <name>
InformacjaJeśli niektóre z wybranych zestawów danych nie obsługują CDC, zostaną wyświetlone dwa potoki: jeden dla zadania CDC, a drugi dla zadania przeładowania.
Następnie kliknij Utwórz i uruchom (domyślnie) lub Utwórz, aby utworzyć zadanie bez jego uruchamiania.
Jeżeli klikniesz Utwórz i uruchom, zadanie zostanie utworzone i zacznie działać (co może potrwać kilka chwil).
-
Kliknięcie Utwórz będzie mieć jeden z następujących rezultatów zgodnie z wybranym wcześniej działaniem Po utworzeniu potoku:
- Zostanie otwarty projekt z nowo utworzonym zadaniem.
-
Zadanie zostanie otwarte na karcie Zestawy danych. Na karcie Zestawy danych jest wyświetlana struktura i metadane wybranych tabel źródłowych. Dotyczy to wszystkich jawnie wybranych tabel oraz tabel pasujących do reguł wyboru.
Jeśli chcesz dodać więcej tabel ze źródła danych, kliknij Wybierz źródło danych.
-
Możesz wykonywać transformacje na zestawach danych, filtrować dane lub dodawać kolumny.
Więcej informacji zawiera temat Zarządzanie zestawami danych.
-
Po dodaniu odpowiednich transformacji możesz zatwierdzić zestawy danych, klikając Zatwierdź zestawy danych. Jeśli walidacja się nie powiedzie, napraw błędy przed kontynuacją.
Więcej informacji zawiera temat Sprawdzanie poprawności i dostosowywanie zestawów danych.
-
Kiedy wszystko będzie gotowe, kliknij Przygotuj i uruchom, aby przygotować i uruchomić zadanie danych.
Informacje na temat odzyskiwania zadań i innych metod uruchamiania zadań zawiera temat Zaawansowane opcje uruchamiania.
-
Zadanie replikacji powinno się teraz rozpocząć, a jego przebieg możesz zobaczyć w menu Monitoruj. Więcej informacji zawiera temat Monitorowanie indywidualnego zadania danych
Replikowanie do pamięci w chmurze
W tej sekcji wyjaśniono, jak skonfigurować zadanie replikacji do pamięci w chmurze.
Wykonaj następujące czynności:
-
W Integracja danych> Strona główna kliknij Replikuj dane.
Zostanie otwarty kreator Replikuj dane.
-
Na karcie Ogólne wykonaj następujące czynności:
-
Nazwa zadania
Określ nazwę zadania.
-
Opis
Opcjonalnie wpisz opis zadania.
-
Projekt
Wykonaj jedną z poniższych czynności:
- Wybierz istniejący już projekt.
-
Określ nazwę nowego projektu, a następnie kliknij Dodaj nowy projekt: <nazwa-projektu> pod polem Projekt.
Nazwa projektu zostanie dodana do pola Projekt.
-
Przestrzeń
Wybierz przestrzeń danych do projektu replikacji. Jeżeli nie zostały jeszcze utworzone przestrzenie danych, wykonaj jedną z następujących czynności:
-
Wybierz Data-Space (domyślną przestrzeń danych dzierżawy)
InformacjaData-Space ma pełne uprawnienia dla wszystkich członków. Role i uprawnienia poszczególnych członków można edytować później, jak opisano to w temacie Role i uprawnienia w przestrzeni danych. -
Anuluj kreatora, utwórz własną przestrzeń danych zgodnie z opisem w temacie Tworzenie przestrzeni danych i uruchom kreatora ponownie.
Więcej informacji na temat przestrzeni danych zawiera temat Praca w przestrzeniach w Qlik Talend Data Integration.
-
-
-
Kliknij przycisk Dalej. Na karcie Wybierz połączenie źródłowe wybierz połączenie z danymi źródłowymi. Opcjonalnie możesz edytować ustawienia połączenia wybierając opcję Edytuj z menu w kolumnie Działania.
Jeśli nie utworzono jeszcze połączenia ze źródłem danych, musisz je utworzyć, klikając Utwórz połączenie w prawym górnym rogu karty.
Listę połączeń można filtrować, korzystając z filtrów po lewej stronie. Połączenia można filtrować według typu źródła, bramy, przestrzeni i właściciela. Przycisk Wszystkie filtry nad listą połączeń pokazuje liczbę bieżących filtrów. Za pomocą tego przycisku można zamknąć lub otworzyć panel Filtry po lewej stronie. Aktualnie aktywne filtry widoczne są także nad listą dostępnych połączeń.
Możesz także posortować listę, wybierając opcję Ostatnia modyfikacja, Ostatnio utworzone lub Alfabetycznie z listy rozwijanej po prawej stronie. Aby zmienić kolejność sortowania, kliknij strzałkę po prawej stronie listy.
Po wybraniu połączenia ze źródłem danych opcjonalnie kliknij Testuj połączenie w prawym górnym rogu karty (zalecane), a następnie kliknij Dalej.
-
Na karcie Wybierz zestawy danych wybierz tabele i/lub widoki do uwzględnienia w zadaniu replikacji. Można także używać symboli wieloznacznych i tworzyć reguły wyboru zgodnie z opisem w temacie Selekcja danych z bazy danych.
-
Na karcie Wybierz połączenie z celem wybierz miejsce docelowe z listy dostępnych połączeń, a następnie kliknij Dalej. Pod względem funkcjonalnym ta karta nie różni się od opisanej wcześniej karty Wybierz połączenie źródłowe.
-
Na karcie Ustawienia opcjonalnie zmień następujące ustawienia, a następnie kliknij Dalej.
Metoda aktualizacji
-
Przechwytywanie zmian danych (CDC): Zadania umieszczania w jeziorze danych rozpoczynają się od pełnego ładowania (podczas którego umieszczania są wszystkie wybrane tabele). Umieszczone dane są następnie aktualizowane przy użyciu technologii przechwytywania danych zmian (CDC).
InformacjaPrzechwytywanie zmian danych operacji DDL nie jest obsługiwane.Częstotliwość przechwytywania zmian danych zależy od ustawień harmonogramu. Domyślny interwał przechwytywania zmian wynosi sześć godzin. Więcej informacji zawiera temat Planowanie zadań podczas pracy bez Brama danych ruchu danych.
- Przeładuj: Wykonuje pełne ładowanie danych z wybranych tabel źródłowych na platformę docelową i w razie potrzeby tworzy tabele docelowe. Pełne ładowanie następuje automatycznie w momencie rozpoczęcia zadania, ale w razie potrzeby można je wykonać także ręcznie lub zaplanować tak, aby występowało okresowo, w miarę potrzeb.
Jeśli wybierzesz opcję Przechwytywanie zmian danych (CDC), a dane zawierają także tabele, które nie obsługują CDC, lub widoki, zostaną utworzone dwa potoki danych. Jeden potok ze wszystkimi tabelami obsługującymi CDC i drugi potok ze wszystkimi innymi tabelami i widokami używającymi Przeładuj.
Folder do użycia
Wybierz jedną z poniższych opcji w zależności od folderu zasobnika, w którym chcesz zapisywać pliki:
- Domyślny folder: Domyślny format folderu to <nazwa-projektu>/<nazwa-zadania>
- Folder główny: pliki zostaną zapisane bezpośrednio w zasobniku.
-
Folder: wprowadź nazwę folderu. Folder zostanie utworzony podczas zadania umieszczania w jeziorze danych, jeśli nie istnieje.
Informacja Nazwa folderu nie może zawierać znaków specjalnych (na przykład @, #, ! itd.).
Planista replikacji
-
Replikuj dane co: Można zaplanować częstotliwość przechwytywania zmian ze źródła danych oraz ustawić Godzinę rozpoczęcia i Datę rozpoczęcia. Jeśli źródłowe zestawy danych obsługują przechwytywanie zmian danych (CDC), tylko zmiany w danych źródłowych zostaną zreplikowane i zastosowane w odpowiednich tabelach docelowych. Jeśli źródłowe zestawy danych nie obsługują CDC (na przykład widoki), zmiany zostaną zastosowane przez ponowne załadowanie wszystkich danych źródłowych do odpowiednich tabel docelowych. Jeśli niektóre źródłowe zestawy danych obsługują CDC, a inne nie, zostaną utworzone dwa osobne zadania podrzędne (zakładając, że metodą aktualizacji Przechwytywania danych zmian (CDC) jest ): jedno do przeładowania zestawów danych, które nie obsługują CDC, a drugie do przechwycenia zmian w zestawach danych, które obsługują CDC.
Kreator konfiguracji zadania umożliwia zaplanowanie interwału godzinowego. Po zakończeniu konfiguracji zadania możesz zapoznać się z różnymi opcjami planowania, jak opisano to w temacie Planowanie zadań podczas pracy bez Brama danych ruchu danych.
Ustawienia zadania można zmienić później, zgodnie z opisem w temacie Ustawienia celów przechowywania w chmurze.
-
-
Na karcie Podsumowanie wyświetlana jest wizualizacja potoku danych. Wybierz jedno z następujących działań Po utworzeniu potoku:
- Otwórz projekt <nazwa> (domyślnie)
-
Otwórz zadanie danych <name>
InformacjaJeśli niektóre z wybranych zestawów danych nie obsługują CDC, zostaną wyświetlone dwa potoki: jeden dla zadania CDC, a drugi dla zadania przeładowania.
Następnie kliknij Utwórz i uruchom (domyślnie) lub Utwórz, aby utworzyć zadanie bez jego uruchamiania.
Jeżeli klikniesz Utwórz i uruchom, zadanie zostanie utworzone i zacznie działać (co może potrwać kilka chwil).
-
Kliknięcie Utwórz będzie mieć jeden z następujących rezultatów zgodnie z wybranym wcześniej działaniem Po utworzeniu potoku:
- Zostanie otwarty projekt z nowo utworzonym zadaniem.
-
Zadanie zostanie otwarte na karcie Zestawy danych. Na karcie Zestawy danych jest wyświetlana struktura i metadane wybranych tabel źródłowych. Dotyczy to wszystkich jawnie wybranych tabel oraz tabel pasujących do reguł wyboru.
Jeśli chcesz dodać więcej tabel ze źródła danych, kliknij Wybierz źródło danych.
-
Możesz wykonywać transformacje na zestawach danych, filtrować dane lub dodawać kolumny.
Więcej informacji zawiera temat Zarządzanie zestawami danych.
-
Po dodaniu odpowiednich transformacji możesz zatwierdzić zestawy danych, klikając Zatwierdź zestawy danych. Jeśli walidacja się nie powiedzie, napraw błędy przed kontynuacją.
Więcej informacji zawiera temat Sprawdzanie poprawności i dostosowywanie zestawów danych.
-
Kiedy wszystko będzie gotowe, kliknij Przygotuj i uruchom, aby przygotować i uruchomić zadanie danych.
Informacje na temat odzyskiwania zadań i innych metod uruchamiania zadań zawiera temat Zaawansowane opcje uruchamiania.
-
Zadanie replikacji powinno się teraz rozpocząć, a jego przebieg możesz zobaczyć w menu Monitoruj. Więcej informacji zawiera temat Monitorowanie indywidualnego zadania danych
Ustawianie priorytetu ładowania dla zestawów danych
Kolejność ładowania zestawów danych w zadaniu danych można kontrolować, przypisując każdemu z nich priorytet ładowania. Może się to przydać na przykład do ładowania mniejszych zestawów danych przed dużymi.
-
Kliknij Priorytet ładowania.
-
Wybierz priorytet ładowania dla każdego zestawu danych.
Domyślny priorytet ładowania to Normalny. Zestawy danych będą ładowane w następującej kolejności priorytetów:
-
Najwyższy
-
Wyższy
-
Wysoka
-
Normalny
-
Niska
-
Niższy
-
Najniższy
Zestawy danych z tym samym priorytetem będą ładowane w kolejności dowolnej.
-
-
Kliknij przycisk OK.
Odświeżanie metadanych
Możesz odświeżyć metadane w zadaniu, aby dostosować je do zmian w metadanych źródła w widoku Projekt zadania. W przypadku aplikacji SaaS korzystających z narzędzia Metadata manager należy odświeżyć Metadata manager, zanim będzie można odświeżyć metadane w zadaniu danych.
-
Możesz wybrać jedną z opcji:
-
Kliknij ..., a następnie Odśwież metadane, aby odświeżyć metadane dla wszystkich zestawów danych w zadaniu.
-
Kliknij ... na zestawie danych w obszarze Zestawy danych, a następnie Odśwież metadane, aby odświeżyć metadane dla pojedynczego zestawu danych.
Stan odświeżania metadanych można sprawdzić w obszarze Odśwież metadane w dolnej części ekranu. Datę ostatniego odświeżenia metadanych można zobaczyć, wskazując kursorem .
-
-
Przygotuj zadanie danych, aby zastosować zmiany
Po przygotowaniu zadania danych i zastosowaniu zmian zmiany zostaną usunięte z Odśwież metadane.
Należy przygotować zadania pamięci masowej, które wykorzystują to zadanie, aby propagować zmiany.
Jeśli kolumna zostanie usunięta, dodana zostanie transformacja z wartościami Null, aby zapewnić, że pamięć nie utraci danych historycznych.
Ograniczenia
-
Zmiana nazwy wcześniej usuniętej kolumny w tym samym przedziale czasowym zostanie zinterpretowana jako zmiana nazwy usuniętej kolumny, jeśli mają one ten sam typ i długość danych.
Przykład:
Przed: a b c d
Po: a c1 d
W tym przykładzie usunięto b i zmieniono nazwę c na c1, a b i c mają ten sam typ i długość danych.
Zostanie to zidentyfikowane jako zmiana nazwy b na c1 i usunięcie c.
-
Zmiana nazwy ostatniej kolumny nie jest rozpoznawana, nawet jeśli ostatnia kolumna została usunięta, a nazwa poprzedniej kolumny została zmieniona.
Przykład:
Przed: a b c d
Po: a b c1
W tym przykładzie usunięto d, a nazwę c zmieniono na c1.
Zostanie to zidentyfikowane jako usunięcie c i d oraz dodanie c1.
-
Zakłada się, że nowe kolumny będą dodawane na końcu. Jeśli w środku zostaną dodane kolumny z tym samym typem danych co w następnej kolumnie, może to zostać zinterpretowane jako usunięcie i zmiana nazwy.
Ograniczenia oraz kwestie do uwzględnienia podczas replikacji danych
Transformacje podlegają następującym ograniczeniom:
- Transformacje nie są obsługiwane w przypadku kolumn z tekstem w językach od prawej do lewej.
-
Nie można wykonywać transformacji na kolumnach, które mają w nazwie znaki specjalne (np. #, \, /, -).
- Jedyną obsługiwaną transformacją dla typów danych LOB/CLOB jest usunięcie kolumny w miejscu docelowym.
- Nie jest obsługiwane używanie transformacji polegającej na zmianie nazwy kolumny i dodaniu nowej kolumny o tej samej nazwie.
Zmiana dopuszczalności wartości null nie jest obsługiwana w przypadku kolumn przenoszonych, niezależnie od tego, czy są zmieniane bezpośrednio, czy też za pomocą reguły transformacji. W przypadku nowych kolumn utworzonych w zadaniu wartości null są jednak dopuszczalne domyślnie.