Przekształcanie danych
Możesz tworzyć transformacje danych wielokrotnego użytku i oparte na regułach w ramach swojego potoku danych. Możesz wykonywać transformacje jako część procesu wprowadzania danych lub tworzyć zadania danych transformacji wielokrotnego użytku. Możesz wykonywać transformacje na poziomie wiersza i tworzyć zestawy danych zmaterializowanych, takich jak tabele, lub w postaci widoków, w których przekształcenia odbywają się na bieżąco.
Możesz wykonywać jawne transformacje dla każdego zestawu danych lub tworzyć globalne reguły do transformacji wielu zestawów danych. W razie potrzeby można filtrować zestawy danych, aby utworzyć podzestaw wierszy.
Tworzenie zasobu danych transformacji
Najprostszym sposobem utworzenia zadania danych transformacji jest kliknięcie ... na zadaniu danych pamięci masowej, a następnie wybranie opcji Transformacja danych.
Możesz także kliknąć Dodaj nowy w projekcie danych i wybrać Tranformacja danych. W tym przypadku musisz określić, które zadanie danych źródłowych ma zostać użyte.
-
Zdefiniuj swoje dane źródłowe w polu Transformacja zestawu danych.
Wybierz źródłowe zestawy danych i kliknij Dodaj, aby dodać je do Wyjścia.
Możesz dodać zestaw danych oparty na SQL, wybierając zestaw danych i klikając Dodaj zestaw danych oparty na SQL.
Dodawanie zestawów danych opartych na SQL
WskazówkaMożesz także dodać kolejne zestawy danych z innych zasobów danych pamięci masowej, klikając Wybierz dane źródłowe. -
Dokonaj wszystkich wymaganych zmian w dołączonych zestawach danych, takich jak transformacje, filtrowanie danych czy dodawanie kolumn.
Aby uzyskać więcej informacji, zobacz temat Zarządzanie zestawami danych.
-
Po dodaniu odpowiednich transformacji możesz zatwierdzić zestawy danych, klikając Zatwierdź zestawy danych. Jeśli walidacja wykaże błędy, należy je naprawić przed kontynuacją.
Aby uzyskać więcej informacji, zobacz temat Sprawdzanie poprawności i dostosowywanie zestawów danych.
-
Utwórz model danych
Kliknij Model, aby ustawić relacje między dołączonymi zestawami danych.
Aby uzyskać więcej informacji, zobacz temat Tworzenie modelu danych.
-
Kliknij Przygotuj, aby przygotować zadanie danych i wszystkie wymagane artefakty. Może to trochę potrwać.
-
Gdy na ekranie pojawi się komunikat Przygotowany, możesz uruchomić zadanie danych.
Kliknij ... a następnie Uruchom.
Zadanie danych zacznie teraz tworzyć zestawy danych do transferu danych.
Dodawanie zestawów danych opartych na SQL
W sekcji Transfer zestawów danych wybierz zestawy danych, które mają zostać włączone do zapytania, i kliknij Dodaj tabelę opartą na SQL.
-
W polu Nazwa zestawu danych wpisz nazwę zestawu.
W polu Opis możesz dodać dłuższy opis.
-
W polu Zapytanie SELECT wpisz zapytanie, które zwróci tabelę opartą na SQL.
Zapytanie może być odczytane tylko ze źródłowych zestawów danych. W tym zasobie danych nie można odwoływać się do innych dodanych tabel opartych na SQL ani tabel wyjściowych.
Możesz wybierać opcje Zestawy danych i Kolumny.
InformacjaUnikaj używania SELECT z *, ponieważ może to powodować zwracanie różnych kolumn przy każdym uruchomieniu zapytania. Jeśli nastąpiła zmiana w schemacie, zmień odpowiednio zapytanie i ponownie wykonaj operację Opisz tabelę. Następnie możesz edytować kolumny i dostosowywać tabele. -
Kliknij Analizuj, aby przeanalizować parametry zapytania SELECT.
WskazówkaMożesz zastąpić parametr referencją, aby uzyskać łatwiejsze do odczytania zapytanie. Zmień wartość w polu Parametr, a zmieni się także odwołanie w polu Zapytanie SELECT. -
Kliknij Opisz tabelę, aby uzyskać podgląd metadanych wyjściowych zapytania.
-
Jeśli wyniki zapytania będą zadowalające, kliknij OK. Zestaw danych jest teraz dodany do listy zestawów danych i możesz go podejrzeć.
Gdy dodajesz zestawy danych oparte na SQL, klucz główny nie jest definiowany automatycznie. Dodaj klucz do zestawu danych w zakładce Zestaw danych.

Planowanie zadania transformacji
Możesz zaplanować okresową aktualizację zadania transformacji. Możesz ustawić harmonogram oparty na czasie lub ustawić uruchamianie zadania po zakończeniu wykonywania zadań danych wejściowych.
Kliknij ... na zadaniu danych i wybierz Planowanie, aby utworzyć harmonogram. Domyślne ustawienie planowania jest dziedziczone z ustawień w projekcie danych. Więcej informacji na temat ustawień domyślnych zawiera temat Wartości domyślne transformacji.
Aby włączyć harmonogram, należy zawsze ustawić opcję Planowanie na Wł.
Harmonogramy oparte na czasie
Harmonogramu opartego na czasie można użyć, aby uruchomić zadanie niezależnie od tego, kiedy zostaną zaktualizowane różne źródła danych wejściowych.
-
Wybierz O określonym czasie w Uruchom zadanie danych.
Możesz ustawić harmonogram godzinowy, dzienny, tygodniowy lub miesięczny.
Harmonogramy oparte na zdarzeniach
Harmonogramu opartego na zdarzeniach można użyć, aby uruchomić zadanie po zakończeniu wykonywania zadań danych wejściowych.
-
Wybierz Po wystąpieniu określonego zdarzenia w Uruchom zadanie danych.
Możesz wybrać, czy chcesz uruchomić zadanie, gdy którekolwiek z zadań wejściowych zakończy się pomyślnie, czy też gdy zostanie pomyślnie zakończone dowolne z wybranych zadań wejściowych.
Monitorowanie zadania transformacji
Możesz monitorować stan i postęp zadania transformacji, klikając Monitoruj.
Aby uzyskać więcej informacji, zobacz temat Monitorowanie zadań dotyczących danych.
Ustawienia transformacji
Możesz ustawić właściwości zadania danych transformacji.
-
Kliknij Ustawienia.
Ustawienia ogólne
-
Baza danych
Baza danych, która ma być użyta w źródle danych.
-
Schemat zasobu danych
Możesz zmienić nazwę schematu zasobu danych pamięci masowej. Domyślną nazwą jest store.
-
Schemat wewnętrzny
Możesz zmienić nazwę schematu wewnętrznej pamięci masowej. Domyślną nazwą jest store__internal.
-
Zmaterializowane
Możesz wybrać tworzenie tabel (zmaterializowanych) lub tylko tworzenie widoków, które wykonują transformacje w czasie rzeczywistym (niematerializowanych).
-
Historia
Aby łatwo odtworzyć dane w postaci z konkretnego momentu, można zachować dane historyczne zmian. Do wyświetlania danych historycznych służą widoki historii i widoki historii na żywo.
Ustawienia czasu działania
-
Wykonanie równoległe
Możesz ustawić maksymalną liczbę połączeń danych dla pełnego ładowania w zakresie od 1 do 5.
-
Hurtownia
Nazwa hurtowni danych w chmurze.
Ograniczenia
-
Nie jest możliwa zmiana typów danych w zadaniach danych transformacji, gdy wybrana jest opcja Niezmaterializowane.
-
Zestawy danych oparte na SQL zapewniają obecnie obsługę tylko pełnego ładowania. Oznacza to, że każde wykonanie zadania transformacji spowoduje ponowne przeładowanie danych. Zbiory danych oparte na języku SQL również dostarczają tylko aktualnych danych i nie przechowują danych historycznych.