Tworzenie sprintu rozwiązywania z pliku CSV
Możesz utworzyć sprint rozwiązywania z pliku CSV zawierającego dane do walidacji.
Wymagania wstępne
Zanim utworzysz sprint, potrzebujesz:
-
Przestrzeni do użycia podczas tworzenia sprintu.
Właściciele/twórcy Sprintu muszą mieć następujące uprawnienia w przestrzeni: Może zarządzać, Może edytować, Może wyświetlać, Może wyświetlać dane
Opiekun danych musi mieć następujące uprawnienia w przestrzeni: Może edytować, Może wyświetlać, Może wyświetlać dane
-
Połączenie z hurtownią danych Snowflake, którego chcesz użyć do przechowywania danych sprintu. Nie używaj bramy danych dla połączenia.
Wszyscy użytkownicy sprintu muszą mieć następujące uprawnienia w przestrzeni połączenia: Może edytować, Może wyświetlać, Może wyświetlać dane
Możesz utworzyć połączenie w Connections w centrum aktywności Qlik Talend Data Integration.
Więcej informacji o połączeniach Snowflake zawiera temat Snowflake.
Tworzenie sprintu
Aby utworzyć sprint rozwiązania, kliknij Utwórz sprint w Opieka nad danymi w centrum aktywności Qlik Talend Data Integration.
Ogólne ustawienia sprintu
-
Nazwa
Dodaj nazwę dla sprintu.
-
Przestrzeń
Wybierz przestrzeń, w której chcesz utworzyć sprint.
-
Opis
Dodaj opis sprintu.
-
Źródło populacji sprintu
Wybierz Plik.
Zaimportuj plik CSV zawierający dane, które chcesz zweryfikować.
Kliknij Dalej, gdy będziesz gotowy, aby przejść do definiowania schematu danych.
Zdefiniuj schemat danych
Możesz teraz zweryfikować schemat danych używany do walidacji danych i dostosować go do swoich wymagań. Wskaźniki jakości danych są wyświetlane dla każdej kolumny, a potencjalnie nieprawidłowe dane są podświetlone. Odbywa się to na podstawie próbki danych.
Zablokuj kolumny
Kliknij ... w kolumnie i wybierz Zablokuj, aby zablokować kolumnę do edycji w sprincie. Dane kolumny będą nadal widoczne, ale nie mogą być edytowane przez opiekunów danych.
Wyklucz kolumny
Kliknij ... w kolumnie i wybierz Wyklucz, aby wykluczyć kolumnę ze sprintu. Dane kolumny nie będą widoczne dla opiekunów danych.
Zastosuj typ semantyczny do kolumny
Kolumna będzie domyślnie używać swojego natywnego typu danych. Możesz zastosować typ semantyczny do kolumny, aby pomóc opiekunom podczas walidacji danych.
-
Wybierz kolumnę i kliknij
obok Typ danych. Możesz teraz wybrać typ semantyczny do zastosowania w kolumnie.
Możesz również zmienić nazwę i opis dla każdej kolumny.
Kliknij Dalej, gdy będziesz gotowy, aby przejść do definiowania magazynu danych.
Dodaj regułę walidacji do kolumny
Możesz zastosować reguły walidacji do kolumny, aby łatwiej było wykryć nieprawidłowe dane. Nieprawidłowe dane zostaną podświetlone w kolumnie.
-
Wybierz kolumnę i kliknij Zastosuj regułę sprawdzania poprawności. Możesz wybrać istniejącą regułę sprawdzania poprawności lub utworzyć nową regułę sprawdzania poprawności.
Więcej informacji o tworzeniu reguł sprawdzania poprawności zawiera temat Creating a validation rule.
Połącz z magazynem danych
Musisz połączyć się z hurtownią danych w chmurze, której chcesz użyć do przechowywania danych sprintu. Snowflake jest obecnie jedyną obsługiwaną hurtownią danych.
-
Wybierz połączenie z hurtownią danych.
-
Wybierz bazę danych, której chcesz użyć.
-
Wybierz, czy chcesz użyć istniejącego schematu bazy danych, czy nowego schematu bazy danych.
Jeśli wybierzesz Nowy schemat bazy danych, ustaw nazwę nowego schematu.
-
Ustaw nazwę tabeli, która ma być używana dla rozwiązanych danych sprintu w Nazwa tabeli dla rozwiązanych rekordów.
Kliknij Dalej, gdy będziesz gotowy, aby przejść do definiowania ról i innych ustawień dla przepływu pracy sprintu.
Zdefiniuj role i ustawienia dla przepływu pracy sprintu
Ostatnim krokiem jest zdefiniowanie ról i innych ustawień.
-
Dodaj właścicieli
Dodaj wszystkich użytkowników, którzy powinni być właścicielami sprintu.
-
Dodaj opiekunów
Dodaj wszystkich opiekunów danych dla tego sprintu.
-
Przepływ pracy rekordów
Możesz wybrać, czy chcesz dodać drugi krok walidacji przez właścicieli sprintu.
InformacjaJeśli użytkownik, który jest zarówno właścicielem sprintu, jak i zarządcą danych, zatwierdzi rekord, drugi krok walidacji jest pomijany. -
Przypisanie rekordu
Wybierz, czy chcesz automatycznie przypisywać rekordy, czy też chcesz przypisywać rekordy ręcznie zarządcom danych.
-
Autom.
Rekordy są przypisywane automatycznie zarządcom danych z równomiernym rozłożeniem. Rekordy nie zostaną przypisane właścicielom sprintów, którzy nie są również zarządcami danych.
-
Ręcznie
Rekordy początkowo nie zostaną przypisane zarządcy danych. Właściciele Sprintu i zarządcy danych mogą przypisywać rekordy z Nieprzypisane.
-
-
Priorytet
Możesz ustawić priorytet dla sprintu.
Kliknij Zapisz, gdy wszystko będzie gotowe do utworzenia sprintu.
Sprint został utworzony, a przypisani zarządcy danych mogą rozpocząć walidację danych.