Tworzenie sprintu rozwiązywania z pliku CSV
Możesz utworzyć sprint rozwiązywania z pliku CSV zawierającego dane do walidacji.
Wymagania wstępne
Zanim utworzysz sprint, potrzebujesz:
-
Przestrzeni do użycia podczas tworzenia sprintu.
Właściciele/twórcy Sprintu muszą mieć następujące uprawnienia w przestrzeni: Może zarządzać, Może edytować, Może wyświetlać, Może wyświetlać dane
Opiekunowie danych muszą mieć następujące uprawnienia w przestrzeni: Może edytować, Może wyświetlać, Może wyświetlać dane
-
Połączenie z hurtownią danych Snowflake, której chcesz użyć do przechowywania danych sprintu. Nie używaj bramy danych dla połączenia.
Wszyscy użytkownicy sprintu muszą mieć następujące uprawnienia w obszarze połączenia: Może edytować, Może wyświetlać, Może wyświetlać dane
Połączenie można utworzyć w Połączeniach w centrum aktywności Qlik Talend Data Integration.
Więcej informacji o połączeniach Snowflake zawiera temat Snowflake.
Tworzenie sprintu
Aby utworzyć sprint rozwiązania, kliknij Utwórz sprint w Opieka nad danymi w centrum aktywności Qlik Talend Data Integration.
Ogólne ustawienia sprintu
-
Nazwa
Dodaj nazwę sprintu.
-
Przestrzeń
Wybierz przestrzeń, w której chcesz utworzyć sprint.
-
Opis
Dodaj opis sprintu.
-
Źródło populacji sprintu
Wybierz Plik.
Zaimportuj plik CSV zawierający dane, które chcesz zweryfikować.
Kliknij Dalej, gdy będziesz gotowy, aby przejść do definiowania schematu danych.
Zdefiniuj schemat danych
Możesz teraz zweryfikować schemat danych używany do walidacji danych i dostosować go do swoich wymagań. Wskaźniki jakości danych są wyświetlane dla każdej kolumny, a potencjalnie nieprawidłowe dane są podświetlone. Odbywa się to na podstawie próbki danych.
Zablokuj kolumny
Kliknij ... w kolumnie i wybierz Zablokuj, aby zablokować kolumnę do edycji w sprincie. Dane kolumny będą nadal widoczne, ale nie mogą być edytowane przez opiekunów danych.
Wyklucz kolumny
Kliknij ... w kolumnie i wybierz Wyklucz, aby wykluczyć kolumnę ze sprintu. Dane kolumny nie będą widoczne dla opiekunów danych.
Zastosuj typ semantyczny do kolumny
Kolumna będzie domyślnie używać swojego natywnego typu danych. Możesz zastosować typ semantyczny do kolumny, aby pomóc opiekunom podczas walidacji danych.
-
Wybierz kolumnę i kliknij
obok Typ danych. Możesz teraz wybrać typ semantyczny do zastosowania w kolumnie.
Możesz również zmienić nazwę i opis dla każdej kolumny.
Kliknij Dalej, gdy będziesz gotowy, aby przejść do definiowania magazynu danych.
Dodaj regułę walidacji do kolumny
Możesz zastosować reguły walidacji do kolumny, aby łatwiej było wykryć nieprawidłowe dane. Nieprawidłowe dane zostaną podświetlone w kolumnie.
-
Wybierz kolumnę i kliknij Zastosuj regułę sprawdzania poprawności. Możesz wybrać istniejącą regułę sprawdzania poprawności lub utworzyć nową regułę sprawdzania poprawności.
Więcej informacji o tworzeniu reguł sprawdzania poprawności zawiera temat Creating a validation rule.
Połącz się z magazynem danych
Musisz połączyć się z hurtownią danych w chmurze, której chcesz użyć do przechowywania danych sprintu. Snowflake jest obecnie jedyną obsługiwaną hurtownią danych.
-
Wybierz połączenie z hurtownią danych.
-
Wybierz, której bazy danych użyć.
-
Wybierz, czy chcesz użyć istniejącego schematu bazy danych, czy nowego schematu bazy danych.
Jeśli wybierzesz Nowy schemat bazy danych, ustaw nazwę nowego schematu.
-
Ustaw nazwę tabeli do użycia dla rozwiązanych danych sprintu w Nazwa tabeli dla rozwiązanych rekordów.
Kliknij Dalej, gdy będziesz gotowy, aby przejść do definiowania ról i innych ustawień dla przepływu pracy sprintu.
Zdefiniuj role i ustawienia dla przepływu pracy sprintu
Ostatnim krokiem jest zdefiniowanie ról i innych ustawień.
-
Dodaj właścicieli
Dodaj wszystkich użytkowników, którzy powinni być właścicielami sprintu.
-
Dodaj opiekunów danych
Dodaj wszystkich opiekunów danych dla tego sprintu.
-
Przepływ pracy rekordów
Możesz wybrać, czy chcesz dodać drugi etap walidacji przez właścicieli sprintu.
InformacjaJeśli użytkownik, który jest zarówno właścicielem sprintu, jak i opiekunem danych, zatwierdzi rekord, drugi etap walidacji zostanie pominięty. -
Przypisanie rekordu
Wybierz, czy chcesz automatycznie przypisywać rekordy, czy chcesz przypisywać rekordy ręcznie do opiekunów danych.
-
Autom.
Rekordy są przypisywane automatycznie opiekunom danych z równomiernym rozłożeniem. Rekordy nie zostaną przypisane właścicielom sprintów, którzy nie są również opiekunami danych.
-
Ręcznie
Rekordy początkowo nie zostaną przypisane opiekunowi danych. Właściciele sprintów i opiekunowie danych mogą przypisywać rekordy z Nieprzypisane.
-
-
Priorytet
Możesz ustawić priorytet dla sprintu. Priorytet jest używany do sortowania sprintów na liście sprintów.
Kliknij Zapisz, gdy będziesz gotowy utworzyć sprint.
Sprint został utworzony, a przypisani zarządcy danych mogą rozpocząć walidację danych.