Ustawienia umieszczania
Możesz skonfigurować ustawienia dla zadania umieszczania danych.
-
Otwórz zadanie umieszczania i kliknij Ustawienia na pasku narzędzi.
Otworzy się okno dialogowe Ustawienia: <Nazwa-zadania>. Dostępne ustawienia opisano poniżej.
Ogólne
-
Baza danych
Baza danych do użycia w obiekcie docelowym.
InformacjaTa opcja nie jest dostępna podczas umieszczania danych w Qlik Cloud (przez Amazon S3). -
Schemat zadania
Możesz zmienić nazwę schematu zadania umieszczania danych. Domyślna nazwa to landing.
InformacjaTa opcja nie jest dostępna podczas umieszczania danych w Qlik Cloud (przez Amazon S3). -
Domyślne użycie wielkich liter w nazwie schematu
Możesz ustawić domyślne użycie wielkich liter dla wszystkich nazw schematów. Jeśli baza danych jest skonfigurowana tak, aby wymuszać użycie wielkich liter, ta opcja nie będzie miała wpływu.
-
Prefiks dla wszystkich tabel i widoków
Możesz ustawić prefiks dla wszystkich tabel i widoków utworzonych za pomocą tego zadania.
InformacjaTa opcja nie jest dostępna podczas umieszczania danych w Qlik Cloud (przez Amazon S3).InformacjaMusisz użyć unikalnego prefiksu, jeśli chcesz użyć schematu bazy danych w kilku zadaniach danych. -
Metoda aktualizacji
Zadanie umieszczania rozpoczyna się zawsze od pełnego ładowania. Po zakończeniu pełnego ładowania możesz zachować aktualność umieszczonych danych, stosując jedną z następujących metod:
InformacjaPo ukończeniu operacji przygotowania zadania umieszczania danych nie można zmienić metody aktualizacji.-
Przechwytywanie zmian danych (CDC)
Umieszczone dane są aktualizowane przy użyciu technologii przechwytywania danych zmian CDC. CDC może nie być obsługiwane przez wszystkie źródła danych. CDC nie rejestruje operacji DDL, takich jak zmiana nazwy kolumn czy zmiany w metadanych.
Jeśli dane zawierają także widoki lub tabele, które nie obsługują CDC, zostaną utworzone dwa potoki danych. Jeden potok ze wszystkimi tabelami obsługującymi CDC i drugi potok ze wszystkimi innymi tabelami i widokami przy użyciu metody aktualizacji Przeładuj i porównaj.
-
Przeładuj i porównaj
Wszystkie ładowane dane są przeładowywane ze źródła. Jest to przydatne, jeśli źródło nie obsługuje CDC, ale można używać tego trybu z dowolnym obsługiwanym źródłem danych.
Możesz zaplanować okresowe ponowne ładowania.
-
-
Metoda ładowania
Podczas replikacji do obiektu docelowego Snowflake możesz wybrać jedną z następujących metod ładowania:
-
Ładowanie zbiorcze (domyślnie)
Jeśli wybierzesz opcję Ładowanie zbiorcze, będzie można dostosować parametry ładowania na karcie Przesyłanie danych .
-
Snowpipe Streaming
InformacjaFunkcja Snowpipe Streaming będzie dostępna do wyboru tylko po spełnieniu następujących warunków:
- Metoda aktualizacji Przechwytywanie zmian danych (CDC) jest włączona.
- Mechanizm uwierzytelniania w łączniku Snowflake jest ustawiony na Para kluczy.
- W przypadku korzystania z Brama danych ruchu danych jest wymagana wersja 2024.11.45 lub nowsza.
Jeśli wybierzesz opcję Snowpipe Streaming, musisz znać ograniczenia i uwagi dotyczące korzystania z tej metody. Dodatkowo, jeśli wybierzesz opcję Snowpipe Streaming, a następnie przełączysz się na metodę aktualizacji Przeładuj i porównaj, metoda ładowania automatycznie przełączy się z powrotem na Ładowanie zbiorcze.
Główne powody, dla których warto wybrać Snowpipe Streaming zamiast Ładowania zbiorczego to:
-
Mniejsze koszty: ponieważ Snowpipe Streaming nie korzysta z hurtowni danych Snowflake, koszty operacyjne powinny być znacznie niższe, choć będzie to zależeć od konkretnego zastosowania.
-
Mniejsze opóźnienia: ponieważ dane są przesyłane strumieniowo bezpośrednio do tabel danych w miejscu docelowym (bez etapu przejściowego), replikacja ze źródła danych do miejsca docelowego powinna być szybsza.
WskazówkaW przypadku korzystania ze Snowpipe Streaming początkowe ładowanie pełne może być znacznie wolniejsze niż Ładowanie zbiorcze. Aby zoptymalizować wydajność ładowania, szczególnie w przypadku ładowania dużych zestawów danych, najlepszą praktyką jest użycie opcji Snowpipe Streaming wraz z funkcją ładowania równoległego. -
-
Folder do użycia w obszarze przejściowym
W przypadku platform danych, które wymagają obszaru przejściowego (na przykład Databricks i Azure Synapse Analytics), możesz wybrać folder, który ma być używany podczas umieszczania danych.
-
Folder domyślny
Spowoduje to utworzenie folderu o domyślnej nazwie: <nazwa projektu>/<nazwa zadania danych>.
-
Folder główny
Przechowuj dane w folderze głównym pamięci masowej.
InformacjaTa opcja jest dostępna tylko podczas umieszczania danych w Qlik Cloud (przez Amazon S3). -
Folder
Określ nazwę folderu do użycia.
-
-
Zmień interwał przetwarzania
Możesz ustawić interwał między przetwarzaniem zmian ze źródła.
InformacjaTa opcja jest dostępna tylko podczas umieszczania danych w Qlik Cloud (przez Amazon S3). -
Serwer proxy podczas korzystania z Data Movement gateway
InformacjaTa opcja jest dostępna tylko podczas uzyskiwania dostępu do obiektów docelowych za pośrednictwem Data Movement gateway.Możesz wybrać użycie serwera proxy, gdy brama Data Movement łączy się z hurtownią danych w chmurze i obszarem pamięci masowej.
Aby uzyskać więcej informacji na temat konfigurowania bramy Data Movement do korzystania z serwera proxy, zobacz Konfigurowanie dzierżawy Qlik Cloud i serwera proxy.
-
Użyj serwera proxy do połączenia z hurtownią danych w chmurze
InformacjaDostępne w przypadku korzystania z Snowflake, Google BigQuery i Databricks. -
Użyj serwera proxy do połączenia z pamięcią masową
InformacjaDostępne w przypadku korzystania z Azure Synapse Analytics, Amazon Redshift i Databricks.
-
Przesyłanie danych
Niektóre ustawienia na tej karcie mają zastosowanie tylko do określonych platform docelowych.
Dotyczy wszystkich platform danych z wyjątkiem Qlik Cloud i Snowflake
Maksymalny rozmiar plików (MB)
Maksymalny rozmiar, jaki może osiągnąć plik przed zamknięciem. Mniejsze pliki mogą być przesyłane szybciej (w zależności od sieci), a jeśli są używane w połączeniu z opcją wykonywania równoległego, może to poprawić wydajność. Ogólnie jednak zaśmiecanie bazy danych małymi plikami uważa się za złą praktykę.
Dotyczy tylko Google BigQuery
Użyj kompresji
Po zaznaczeniu tej opcji pliki CSV będą kompresowane (przy użyciu gzip) przed przesłaniem do Google BigQuery.
Wymaga Brama danych ruchu danych 2023.5.16 lub nowszej.
Dotyczy tylko Snowflake
Na karcie Ogólne możesz wybrać, czy dane mają być ładowane do Snowflake przy użyciu Ładowania zbiorczego czy Przesyłania strumieniowego Snowpipe. Po wybraniu opcji Przesyłanie strumieniowe Snowpipe karta Przesyłanie danych nie będzie wyświetlana. Po wybraniu opcji Ładowanie zbiorcze dostępne będą następujące ustawienia:
-
Maksymalny rozmiar pliku (MB): Dotyczy początkowego pełnego ładowania i CDC. Maksymalny rozmiar, jaki może osiągnąć plik przed załadowaniem do obiektu docelowego. Jeśli napotkasz problemy z wydajnością, spróbuj dostosować ten parametr.
-
Liczba plików do załadowania w partii: Dotyczy tylko początkowego pełnego ładowania. Liczba plików do załadowania w pojedynczej partii. Jeśli napotkasz problemy z wydajnością, spróbuj dostosować ten parametr.
Opis metod ładowania Ładowanie zbiorcze i Przesyłanie strumieniowe Snowpipe znajduje się w sekcji Ogólne.
Metadane
Kolumny LOB
Uwzględnij kolumny LOB i ogranicz rozmiar kolumny do (KB):
Możesz zdecydować się na uwzględnienie kolumn LOB w zadaniu i ustawić maksymalny rozmiar LOB. Obiekty LOB większe niż maksymalny rozmiar zostaną obcięte.
Tabele kontrolne
Wybierz, które z poniższych tabel kontrolnych mają zostać utworzone na platformie docelowej:
- Status umieszczania: Zawiera szczegółowe informacje o bieżącym zadaniu umieszczania, w tym status zadania, ilość pamięci zużytej przez zadanie, liczbę zmian jeszcze niezastosowanych na platformie danych oraz pozycję w punkcie końcowym źródła, z którego Brama danych ruchu danych obecnie odczytuje.
- Zawieszone tabele: Zawiera listę zawieszonych tabel i powód ich zawieszenia.
- Historia umieszczania: Zawiera informacje o historii zadania, w tym liczbę i wolumen rekordów przetworzonych podczas zadania umieszczania, opóźnienie na końcu zadania CDC i inne.
-
Historia DDL: Zawiera historię wszystkich obsługiwanych zmian DDL, które wystąpiły podczas zadania.
Tabela Historla DDL jest obsługiwana tylko w przypadku następujących platform docelowych:
-
Databricks
- Microsoft Fabric
- Amazon Redshift
- Jeśli używasz Brama danych ruchu danych, następujące elementy docelowe wymagają wersji 2024.11.14 lub nowszej:
- Amazon S3
- Google Cloud Storage
- Snowflake
- Kafka — W przypadku korzystania z Brama danych ruchu danych jest wymagana wersja 2025.5.42 lub nowsza.
- Jeśli używasz Brama danych ruchu danych, następujące elementy docelowe wymagają wersji 2025.11.1 lub nowszej:
- Google BigQuery
- Google Cloud Alloy DB for PostgreSQL (za pośrednictwem łącznika PostgreSQL)
- Google Cloud SQL for PostgreSQL (za pośrednictwem łącznika PostgreSQL)
- Microsoft Azure Database for PostgreSQL (za pośrednictwem łącznika PostgreSQL)
- PostgreSQL
-
Szczegółowy opis każdej z tabel kontrolnych znajduje się w sekcji Tabele kontrolne
Pełne ładowanie
Dostrajanie wydajności
- Maksymalna liczba tabel do równoległego ładowania: Wprowadź maksymalną liczbę tabel do jednoczesnego załadowania do obiektu docelowego. Wartość domyślna to 5.
-
Limit czasu spójności transakcji (w sekundach): Wprowadź liczbę sekund oczekiwania na zamknięcie otwartych transakcji przed rozpoczęciem operacji pełnego ładowania. Wartość domyślna to 600 (10 minut). Pełne ładowanie rozpocznie się po osiągnięciu wartości limitu czasu, nawet jeśli nadal istnieją otwarte transakcje.
InformacjaAby zreplikować transakcje, które były otwarte w momencie rozpoczęcia pełnego ładowania, ale zostały zatwierdzone dopiero po osiągnięciu wartości limitu czasu, należy ponownie załadować tabele docelowe. - Wskaźnik zatwierdzania podczas pełnego ładowania: Maksymalna liczba zdarzeń, które mogą być przesyłane razem. Wartość domyślna to 10000.
Po zakończeniu pełnego ładowania
Utwórz klucz podstawowy lub unikalny: Wybierz tę opcję, jeśli chcesz opóźnić utworzenie klucza podstawowego lub unikalnego indeksu na platformie danych do czasu zakończenia pełnego ładowania.
Dla ładowania początkowego
Podczas przenoszenia danych ze źródła aplikacji SaaS możesz ustawić sposób wykonywania początkowego pełnego ładowania:
| Użyj danych z pamięci podręcznej |
Ta opcja umożliwia korzystanie z buforowanych danych, które zostały odczytane podczas generowania metadanych z wybraną opcją Pełne skanowanie danych. Powoduje to mniejsze obciążenie związane z wykorzystaniem interfejsu API i limitami, ponieważ dane są już odczytywane ze źródła. Wszelkie zmiany od początkowego skanowania danych mogą zostać uwzględnione przez przechwytywanie zmian danych (CDC). |
| Załaduj dane ze źródła |
Ta opcja wykonuje nowe ładowanie ze źródła danych. Ta opcja jest przydatna, jeśli:
|
Obsługa błędów
Błędy danych
Obsługa błędów danych jest obsługiwana tylko w przypadku metody aktualizacji Change Data Capture (CDC).
W przypadku błędów obcinania danych: Wybierz, co ma się stać, gdy w jednym lub większej liczbie określonych rekordów nastąpi obcięcie. Możesz wybrać jedną z następujących opcji z listy:
- Ignoruj: Zadanie jest kontynuowane, a błąd jest ignorowany.
- Zawieś tabelę: Zadanie jest kontynuowane, ale dane z tabeli z rekordem z błędem są przenoszone do stanu błędu i nie są replikowane
- Zatrzymaj zadanie: Zadanie jest zatrzymywane i jest wymagana interwencja ręczna.
W przypadku innych błędów danych: Wybierz, co ma się stać, gdy w jednym lub większej liczbie określonych rekordów wystąpi błąd. Możesz wybrać jedną z następujących opcji z listy:
- Ignoruj: Zadanie jest kontynuowane, a błąd jest ignorowany.
- Zawieś tabelę: Zadanie jest kontynuowane, ale dane z tabeli z rekordem z błędem są przenoszone do stanu błędu i nie są replikowane
- Zatrzymaj zadanie: Zadanie jest zatrzymywane i jest wymagana interwencja ręczna.
Eskaluj obsługę błędów, kiedy inne błędy danych osiągną (na tabelę): Zaznacz to pole wyboru, aby eskalować obsługę błędów, gdy liczba błędów danych niespowodowanych przez obcięcia (na tabelę) osiągnie określoną wartość. Prawidłowe wartości są z zakresu 1–10 000.
Działanie eskalacji: Wybierz, co powinno się wydarzyć w przypadku eskalacji obsługi błędów. Należy pamiętać, że dostępne działania zależą od działania wybranego z listy rozwijanej W przypadku innych błędów danych opisanej powyżej.
-
Zawieś tabelę (domyślnie): Zadanie jest kontynuowane, ale dane z tabeli z rekordem z błędem są przenoszone do stanu błędu i nie są landed.
- Zatrzymaj zadanie: Zadanie jest zatrzymywane i jest wymagana interwencja ręczna.
Błędy tabeli
Liczba prób przed zwróceniem błędu tabeli
Ta opcja pozwala kontrolować, kiedy zasady obsługi błędów tabeli zostaną uruchomione. Po napotkaniu błędu tabeli tabela zostanie domyślnie zawieszona lub zadanie zostanie zatrzymane (zgodnie z wybranym działaniem) po trzech próbach. Czasami błąd tabeli może wystąpić z powodu planowanej konserwacji aplikacji SaaS. W takich przypadkach domyślna liczba ponownych prób może nie być wystarczająca, aby konserwacja została ukończona przed uruchomieniem polityki obsługi błędów tabeli. Zależy to również od interwału planowania zadania, ponieważ ponowna próba zostanie wykonana za każdym razem, gdy zadanie zostanie uruchomione. Jeżeli na przykład zaplanujesz zadanie uruchamiane co godzinę, a aplikacja SaaS zostanie przełączona w tryb offline w celu przeprowadzenia konserwacji w momencie rozpoczęcia wykonywania zadania, domyślne trzy próby pozwolą aplikacji SaaS być w trybie offline przez maksymalnie trzy godziny bez uruchamiania zasad obsługi błędów tabeli. Dłuższy przedział czasu konserwacji wymagałby zwiększenia liczby ponownych prób (lub zmiany harmonogramu), aby zapobiec uruchomieniu zasad obsługi błędów tabeli.
Podsumowując, jeśli wiesz, że aplikacja SaaS przechodzi okresową konserwację, najlepszą praktyką jest zwiększenie liczby ponownych prób zgodnie z harmonogramem, tak aby konserwacja mogła zostać zakończona bez uruchamiania polityki obsługi błędów tabeli.
-
Ta opcja będzie wyświetlana tylko w przypadku zadań skonfigurowanych z łącznikiem aplikacji SaaS w wersji Lite lub Standard.
-
W przypadku korzystania z Brama danych ruchu danych jest wymagana wersja 2024.11.70 lub nowsza.
W przypadku napotkania błędu tabeli: wybierz jedną z poniższych opcji z listy rozwijanej:
- Zawieś tabelę (domyślnie): zadanie jest kontynuowane, ale dane z tabeli z rekordem z błędem są przenoszone do stanu błędu i nie są replikowane.
- Zatrzymaj zadanie: zadanie jest zatrzymywane i jest wymagana interwencja ręczna.
Eskaluj obsługę błędów, kiedy inne błędy tabeli osiągną (na tabelę): zaznacz to pole wyboru, aby eskalować obsługę błędów, gdy liczba błędów tabeli (na tabelę) osiągnie określoną wartość. Prawidłowe wartości są z zakresu 1–10 000.
Działanie eskalacji: zasada eskalacji błędów tabeli jest ustawiona na Zatrzymaj zadanie i nie można jej zmienić.
Środowiskowe
-
Maksymalna liczba ponownych prób: Wybierz tę opcję, a następnie określ maksymalną liczbę prób ponawiania zadania w razie wystąpienia błędu środowiskowego umożliwiającego odzyskanie. Po określonej liczbie ponownych prób zadanie zostaje zatrzymane i wymagana jest ręczna interwencja.
Aby nigdy nie ponawiać wykonywania zadania, usuń zaznaczenie pola wyboru lub określ „0”.
Aby ponawiać zadanie nieskończoną liczbę razy, określ „-1”.
-
Interwał między kolejnymi próbami (w sekundach): Użyj licznika, aby wybrać lub wpisać liczbę sekund oczekiwania przez system pomiędzy kolejnymi próbami wykonania zadania.
Prawidłowe wartości są z zakresu 0–2000.
-
- Zwiększ interwał ponawiania prób w przypadku długich przestojów: Zaznacz to pole wyboru, aby zwiększyć interwał ponownych prób w przypadku długich przestojów. Gdy ta opcja jest włączona, odstęp między kolejnymi próbami jest podwajany aż do osiągnięcia Maksymalnego interwału ponownych prób (i próby są kontynuowane zgodnie z określonym maksymalnym interwałem).
- Maksymalny interwał ponownych prób (w sekundach): Użyj licznika, aby wybrać, lub wpisz liczbę sekund oczekiwania pomiędzy kolejnymi próbami wykonania zadania, gdy włączona jest opcja Zwiększ interwał ponawiania prób w przypadku długich przestojów. Prawidłowe wartości są z zakresu 0–2000.
Dostrajanie przetwarzania zmian
Dostrajanie odciążania transakcyjnego
-
Odciążaj transakcje w toku na dysk, jeśli:
Dane transakcji są zwykle przechowywane w pamięci, dopóki nie zostaną w pełni zatwierdzone w źródle lub obiekcie docelowym. Jednak transakcje, które są większe niż przydzielona pamięć lub które nie zostaną zatwierdzone w określonym limicie czasu, zostaną odciążone na dysk.
- Całkowity rozmiar pamięci dla wszystkich transakcji przekracza (MB): Maksymalny rozmiar, jaki wszystkie transakcje mogą zajmować w pamięci przed odciążeniem na dysk. Wartość domyślna to 1024.
- Czas trwania transakcji przekracza (w sekundach): Maksymalny czas, przez jaki każda transakcja może pozostać w pamięci przed odciążeniem na dysk. Czas trwania jest obliczany od momentu, gdy Qlik Talend Data Integration rozpoczął przechwytywanie transakcji. Wartość domyślna to 60.
Dostrajanie partii
Niektóre ustawienia na tej karcie mogą nie mieć zastosowania do wszystkich obiektów docelowych lub metod ładowania docelowego.
Ustawienia, które mają zastosowanie do wszystkich obiektów docelowych z wyjątkiem Qlik Cloud i Snowflake, gdy „Metoda ładowania” to „Przesyłanie strumieniowe Snowpipe”
- Zastosuj zmiany wsadowe w interwałach:
-
Więcej niż: Minimalny czas oczekiwania między każdym zastosowaniem zmian wsadowych. Wartość domyślna to 1.
Zwiększenie wartości Więcej niż zmniejsza częstotliwość, z jaką zmiany są stosowane do obiektu docelowego, jednocześnie zwiększając rozmiar partii. Może to poprawić wydajność podczas stosowania zmian w docelowych bazach danych, które są zoptymalizowane pod kątem przetwarzania dużych partii.
- Mniej niż: Maksymalny czas oczekiwania między każdym zastosowaniem zmian wsadowych (przed zadeklarowaniem limitu czasu). Innymi słowy, maksymalne dopuszczalne opóźnienie. Wartość domyślna to 30. Ta wartość określa maksymalny czas oczekiwania przed zastosowaniem zmian, po osiągnięciu wartości Więcej niż.
-
Wymuś zastosowanie partii, gdy pamięć przetwarzania przekroczy (MB): Maksymalna ilość pamięci do użycia do wstępnego przetwarzania. Wartość domyślna to 500 MB.
Aby uzyskać maksymalny rozmiar partii, ustaw tę wartość na najwyższą ilość pamięci, jaką możesz przydzielić do zadania danych. Może to poprawić wydajność podczas stosowania zmian w docelowych bazach danych, które są zoptymalizowane pod kątem przetwarzania dużych partii.
-
Zastosuj zmiany wsadowe do wielu tabel jednocześnie: Wybranie tej opcji powinno poprawić wydajność podczas stosowania zmian z wielu tabel źródłowych.
-
Maksymalna liczba tabel: Maksymalna liczba tabel, do których można jednocześnie zastosować zmiany wsadowe. Wartość domyślna to pięć.
InformacjaTa opcja nie jest obsługiwana w przypadku korzystania z Google BigQuery jako platformy danych. -
-
Ogranicz liczbę zmian stosowanych na instrukcję przetwarzania zmian do: Wybierz tę opcję, aby ograniczyć liczbę zmian stosowanych w pojedynczej instrukcji przetwarzania zmian. Wartość domyślna to 10 000.
InformacjaTa opcja jest obsługiwana tylko w przypadku korzystania z Google BigQuery jako platformy danych.
Ustawienia, które mają zastosowanie tylko do Qlik Cloud i Snowflake, gdy „Metoda ładowania” to „Przesyłanie strumieniowe Snowpipe”
-
Minimalna liczba zmian na transakcję: minimalna liczba zmian, które należy uwzględnić w każdej transakcji. Wartością domyślną jest 1000.
InformacjaZmiany są stosowane do miejsca docelowego, gdy liczba zmian jest równa lub większa od Minimalnej liczby zmian na transakcję LUB po osiągnięciu opisanej poniżej wartości Maksymalny czas dla transakcji wsadowych przed zastosowaniem (w sekundach) w zależności od tego, co nastąpi wcześniej. Ponieważ częstotliwość zmian stosowanych do miejsca docelowego jest kontrolowana przez te dwa parametry, zmiany w rekordach źródłowych mogą nie zostać natychmiast odzwierciedlone w rekordach docelowych.
- Maksymalny czas dla transakcji wsadowych przed zastosowaniem (w sekundach): maksymalny czas gromadzenia transakcji w partiach przed zadeklarowaniem upłynięcia limitu czasu. Wartością domyślną jest 1.
Interwał
Ustawienia podczas korzystania z łączników SAP ODP i aplikacji SaaS (Lite)
-
Odczytuj zmiany co (w minutach)
Interwał w minutach między odczytywaniem zmian ze źródła. Prawidłowy zakres wynosi od 1 do 1440.
InformacjaTa opcja jest dostępna tylko wtedy, gdy zadanie danych jest zdefiniowane za pomocą:
- Brama danych ruchu danych
- Dowolne z poniższych źródeł:
- Aplikacja SaaS tylko za pośrednictwem łączników Lite
- SAP ODP
- Metoda aktualizacji Przechwytywanie zmian danych (CDC)
Ustawienia podczas korzystania z łącznika SAP OData
Sprawdź zmiany
-
Zgodnie z interwałem ekstrakcji delty:Po wybraniu tej opcji zadanie danych sprawdza zmiany zgodnie z interwałem ekstrakcji delty.
InformacjaInterwał rozpocznie się po każdej „rundzie”. Runda może być zdefiniowana jako czas potrzebny zadaniu danych na odczytanie zmian z tabel źródłowych i wysłanie ich do celu (jako pojedyncza transakcja). Długość rundy różni się w zależności od liczby tabel i zmian. Jeśli więc określisz interwał 10 minut, a runda trwa 4 minuty, to rzeczywisty czas między sprawdzaniem zmian wyniesie 14 minut.-
Interwał ekstrakcji delty: Częstotliwość, z jaką delty będą wyodrębniane z Twojego systemu. Wartością domyślną jest co 60 sekund.
-
-
Zgodnie z harmonogramem: Po wybraniu tej opcji zadanie danych wyodrębni deltę raz, a następnie zostanie zatrzymane. Następnie będzie kontynuować działanie zgodnie z harmonogramem.
InformacjaTa opcja jest istotna tylko wtedy, gdy odstęp między cyklami CDC wynosi 24 godziny lub więcej.Informacje na temat planowania:
-
Zadania umieszczania w projekcie potoku danych, zobacz Harmonogramowanie zadań
-
Różne dostrajanie
- Rozmiar pamięci podręcznej instrukcji (liczba instrukcji): Maksymalna liczba przygotowanych instrukcji do przechowywania na serwerze w celu późniejszego wykonania (podczas stosowania zmian w obiekcie docelowym). Wartość domyślna to 50. Maksimum to 200.
-
DELETE i INSERT podczas aktualizacji kolumny klucza podstawowego: Ta opcja wymaga włączenia pełnego rejestrowania uzupełniającego w źródłowej bazie danych.
Ewolucja schematu
Wybierz sposób obsługi następujących typów zmian DDL w schemacie. Po zmianie ustawień ewolucji schematu należy ponownie przygotować zadanie. Poniższa tabela opisuje, jakie akcje są dostępne dla obsługiwanych zmian DDL.
| Zmiana DDL | Zastosuj do obiektu docelowego | Ignoruj | Zawieś tabelę | Zatrzymaj zadanie |
|---|---|---|---|---|
| Dodaj kolumnę | Tak | Tak | Tak | Tak |
| Zmień nazwę kolumny | Nie | Nie | Tak | Tak |
| Zmień nazwę tabeli | Nie | Nie | Tak | Tak |
| Zmień typ danych kolumny | Nie | Tak | Tak | Tak |
| Utwórz tabelę
Jeśli użyto Reguły wyboru do dodania zestawów danych pasujących do wzorca, nowe tabele spełniające ten wzorzec zostaną wykryte i dodane. |
Tak | Tak | Nie | Nie |
Podstawianie znaków
Możesz zastąpić lub usunąć znaki źródłowe w docelowej bazie danych i/lub znaki źródłowe, które nie są obsługiwane przez wybrany zestaw znaków.
-
Wszystkie znaki muszą być określone jako punkty kodu Unicode.
- Zastępowanie znaków będzie również wykonywane w tabelach kontrolnych.
-
Nieprawidłowe wartości zostaną oznaczone czerwonym trójkątem w prawym górnym rogu komórki tabeli. Wskazanie trójkąta kursorem myszy spowoduje wyświetlenie komunikatu o błędzie.
-
Wszelkie transformacje na poziomie tabeli lub globalne zdefiniowane dla zadania zostaną wykonane po zakończeniu zastępowania znaków.
-
Działania zastępowania zdefiniowane w tabeli Zastąp lub usuń znaki źródłowe są wykonywane przed działaniem zastępowania zdefiniowanym w tabeli Zastąp lub usuń znaki źródłowe nieobsługiwane przez wybrany zestaw znaków.
- Zastępowanie znaków nie obsługuje typów danych LOB.
Zastępowanie lub usuwanie znaków źródłowych
Użyj tabeli Zastąp lub usuń znaki źródłowe, aby zdefiniować zamienniki dla określonych znaków źródłowych. Może to być przydatne na przykład wtedy, gdy reprezentacja znaku w Unicode jest inna na platformie źródłowej i docelowej. Na przykład w systemie Linux znak minus w zestawie znaków Shift_JIS jest reprezentowany jako U+2212, ale w systemie Windows jest reprezentowany jako U+FF0D.
| Cel | Działanie |
|---|---|
|
Zdefiniowanie działań zastępowania |
|
|
Edytowanie określonego znaku źródłowego lub docelowego |
Kliknij |
|
Usunięcie wpisów z tabeli |
Kliknij |
Zastępowanie lub usuwanie znaków źródłowych nieobsługiwanych przez wybrany zestaw znaków
Użyj tabeli Nieobsługiwane znaki źródłowe według zestawu znaków, aby zdefiniować pojedynczy znak zastępczy dla wszystkich znaków nieobsługiwanych przez wybrany zestaw znaków.
| Cel | Działanie |
|---|---|
|
Zdefiniowanie lub edycja działania zastępowania |
|
|
Wyłączenie działania zastępowania. |
Wybierz pusty wpis z listy rozwijanej Zestaw znaków. |
Więcej opcji
Te opcje nie są widoczne w interfejsie, ponieważ dotyczą tylko określonych wersji lub środowisk. W związku z tym nie należy ustawiać tych opcji, chyba że zostanie to wyraźnie zalecone przez Pomoc techniczną Qlik lub dokumentację produktu.
Aby ustawić opcję, po prostu skopiuj ją do pola Dodaj nazwę cechy i kliknij Dodaj. Następnie ustaw wartość lub włącz opcję zgodnie z otrzymaną instrukcją.
Równoległe ładowanie segmentów zestawu danych
Podczas pełnego ładowania można przyspieszyć ładowanie dużych zestawów danych, dzieląc zestaw danych na segmenty, które będą ładowane równolegle. Tabele można podzielić według zakresów danych, wszystkich partycji, wszystkich podpartycji lub określonych partycji.
Więcej informacji znajduje się w sekcji Równoległe umieszczanie segmentów zestawu danych.
Harmonogramowanie zadań
W następujących przypadkach użycia należy zdefiniować interwał harmonogramu, aby dane docelowe były aktualne:
- Uzyskiwanie dostępu do źródła danych bez Brama danych ruchu danych
- Korzystanie z łącznika aplikacji SaaS, który nie obsługuje ustawienia Odczytuj zmiany co
- Podczas przechwytywania zmian ze źródła SAP OData przy użyciu opcji Zgodnie z harmonogramem.
Harmonogram określa, jak często docelowe zestawy danych będą aktualizowane o zmiany w źródłowych zestawach danych. Podczas gdy harmonogram określa częstotliwość aktualizacji, typ zestawu danych określa metodę aktualizacji. Jeśli źródłowe zestawy danych obsługują CDC (Change data capture), tylko zmiany w danych źródłowych zostaną zreplikowane i zastosowane do odpowiednich tabel docelowych. Jeśli źródłowe zestawy danych nie obsługują CDC (na przykład widoki), zmiany zostaną zastosowane poprzez ponowne załadowanie wszystkich danych źródłowych do odpowiednich tabel docelowych. Jeśli niektóre źródłowe zestawy danych obsługują CDC, a inne nie, zostaną utworzone dwa oddzielne podzadania: jedno do ponownego ładowania zestawów danych, które nie obsługują CDC, a drugie do przechwytywania zmian w zestawach danych, które obsługują CDC. W takim przypadku, aby zapewnić spójność danych, zdecydowanie zaleca się, aby nie utrzymywać tego samego interwału harmonogramu dla obu zadań (jeśli w przyszłości zdecydujesz się zmienić częstotliwość aktualizacji).
Informacje na temat minimalnych interwałów planowania według typu źródła danych i poziomu subskrypcji zawiera temat Minimalne dozwolone interwały planowania.
Aby zmienić harmonogram:
-
Otwórz projekt potoku, a następnie wykonaj jedną z następujących czynności:
- W widoku zadań kliknij
na zadaniu danych i wybierz Harmonogramowanie.
- W widoku potoku kliknij
na zadaniu danych i wybierz Harmonogramowanie.
- Otwórz zadanie umieszczania i kliknij przycisk Harmonogramowanie na pasku narzędzi.
- W widoku zadań kliknij
- Zmień ustawienia harmonogramu w razie potrzeby, a następnie kliknij OK.
Wykonywanie pominiętego uruchomienia dla zadania opartego na Brama danych ruchu danych
Czasami problem z siecią może spowodować utratę połączenia z bramą Brama danych ruchu danych. Jeśli połączenie z bramą Brama danych ruchu danych nie zostanie przywrócone przed następnym zaplanowanym uruchomieniem, nie będzie można uruchomić zadania danych zgodnie z harmonogramem. W takich przypadkach można wybrać, czy uruchomienie ma zostać wykonane bezpośrednio po przywróceniu połączenia.
Domyślne ustawienia dla wszystkich Brama danych ruchu danych są zdefiniowane w centrum aktywności Administrowanie. Możesz zastąpić te ustawienia dla poszczególnych zadań, jak opisano poniżej.
Aby to zrobić
-
Otwórz swój projekt, a następnie wykonaj jedną z następujących czynności:
-
W widoku zadań kliknij
na zadaniu danych i wybierz Harmonogramowanie.
-
W widoku potoku kliknij
na zadaniu danych i wybierz Harmonogramowanie.
-
Otwórz zadanie danych i kliknij przycisk Harmonogramowanie na pasku narzędzi.
Otworzy się okno dialogowe Harmonogramowanie - <zadanie>.
-
-
Włącz opcję Użyj ustawień niestandardowych dla tego zadania.
-
Na dole okna dialogowego wybierz jedną z następujących opcji Uruchom pominięte zaplanowane zadania.
-
Jak najszybciej, a następnie zgodnie z harmonogramem, jeśli ważne jest uruchomienie zadania przed następnym zaplanowanym wystąpieniem
-
Zgodnie z harmonogramem, aby uruchomić zadanie w następnym zaplanowanym wystąpieniu
-
-
Zapisz swoje ustawienia.
Zobacz również: Wykonywanie uruchomienia zadania po pominiętym harmonogramie.