Tworzenie sprintu rozwiązywania z pliku CSV

Możesz utworzyć sprint rozwiązywania z pliku CSV zawierającego dane do walidacji.

Wymagania wstępne

Zanim utworzysz sprint, potrzebujesz:

Przestrzeni do użycia podczas tworzenia sprintu.

Właściciele/twórcy Sprintu muszą mieć następujące uprawnienia w przestrzeni: Może zarządzać, Może edytować, Może wyświetlać, Może wyświetlać dane

Opiekunowie danych muszą mieć następujące uprawnienia w przestrzeni: Może edytować, Może wyświetlać, Może wyświetlać dane
Połączenie z hurtownią danych Snowflake, której chcesz użyć do przechowywania danych sprintu. Nie używaj bramy danych dla połączenia.

Wszyscy użytkownicy sprintu muszą mieć następujące uprawnienia w obszarze połączenia: Może edytować, Może wyświetlać, Może wyświetlać dane

Połączenie można utworzyć w Połączeniach w centrum aktywności Qlik Talend Data Integration.

Więcej informacji o połączeniach Snowflake zawiera temat Snowflake.

Tworzenie sprintu

Aby utworzyć sprint rozwiązania, kliknij Utwórz sprint w Opieka nad danymi w centrum aktywności Qlik Talend Data Integration.

Ogólne ustawienia sprintu

Nazwa

Dodaj nazwę sprintu.
Przestrzeń

Wybierz przestrzeń, w której chcesz utworzyć sprint.
Opis

Dodaj opis sprintu.
Źródło populacji sprintu

Wybierz Plik.

Zaimportuj plik CSV zawierający dane, które chcesz zweryfikować.

Kliknij Dalej, gdy będziesz gotowy, aby przejść do definiowania schematu danych.

Zdefiniuj schemat danych

Możesz teraz zweryfikować schemat danych używany do walidacji danych i dostosować go do swoich wymagań. Wskaźniki jakości danych są wyświetlane dla każdej kolumny, a potencjalnie nieprawidłowe dane są podświetlone. Odbywa się to na podstawie próbki danych.

Zablokuj kolumny

Kliknij ... w kolumnie i wybierz Zablokuj, aby zablokować kolumnę do edycji w sprincie. Dane kolumny będą nadal widoczne, ale nie mogą być edytowane przez opiekunów danych.

Wyklucz kolumny

Kliknij ... w kolumnie i wybierz Wyklucz, aby wykluczyć kolumnę ze sprintu. Dane kolumny nie będą widoczne dla opiekunów danych.

Zastosuj typ semantyczny do kolumny

Kolumna będzie domyślnie używać swojego natywnego typu danych. Możesz zastosować typ semantyczny do kolumny, aby pomóc opiekunom podczas walidacji danych.

Wybierz kolumnę i kliknij obok Typ danych. Możesz teraz wybrać typ semantyczny do zastosowania w kolumnie.

Możesz również zmienić nazwę i opis dla każdej kolumny.

Kliknij Dalej, gdy będziesz gotowy, aby przejść do definiowania magazynu danych.

Dodaj regułę walidacji do kolumny

Możesz zastosować reguły walidacji do kolumny, aby łatwiej było wykryć nieprawidłowe dane. Nieprawidłowe dane zostaną podświetlone w kolumnie.

Wybierz kolumnę i kliknij Zastosuj regułę sprawdzania poprawności. Możesz wybrać istniejącą regułę sprawdzania poprawności lub utworzyć nową regułę sprawdzania poprawności.

Więcej informacji o tworzeniu reguł sprawdzania poprawności zawiera temat Creating a validation rule.

Połącz się z magazynem danych

Musisz połączyć się z hurtownią danych w chmurze, której chcesz użyć do przechowywania danych sprintu. Snowflake jest obecnie jedyną obsługiwaną hurtownią danych.

Wybierz połączenie z hurtownią danych.
Wybierz, której bazy danych użyć.
Wybierz, czy chcesz użyć istniejącego schematu bazy danych, czy nowego schematu bazy danych.

Jeśli wybierzesz Nowy schemat bazy danych, ustaw nazwę nowego schematu.
Ustaw nazwę tabeli do użycia dla rozwiązanych danych sprintu w Nazwa tabeli dla rozwiązanych rekordów.

Kliknij Dalej, gdy będziesz gotowy, aby przejść do definiowania ról i innych ustawień dla przepływu pracy sprintu.

Zdefiniuj role i ustawienia dla przepływu pracy sprintu

Ostatnim krokiem jest zdefiniowanie ról i innych ustawień.

Dodaj właścicieli

Dodaj wszystkich użytkowników, którzy powinni być właścicielami sprintu.
Dodaj opiekunów danych

Dodaj wszystkich opiekunów danych dla tego sprintu.
Przepływ pracy rekordów

Możesz wybrać, czy chcesz dodać drugi etap walidacji przez właścicieli sprintu.

InformacjaJeśli użytkownik, który jest zarówno właścicielem sprintu, jak i opiekunem danych, zatwierdzi rekord, drugi etap walidacji zostanie pominięty.
Przypisanie rekordu

Wybierz, czy chcesz automatycznie przypisywać rekordy, czy chcesz przypisywać rekordy ręcznie do opiekunów danych.
- Autom.
  
  Rekordy są przypisywane automatycznie opiekunom danych z równomiernym rozłożeniem. Rekordy nie zostaną przypisane właścicielom sprintów, którzy nie są również opiekunami danych.
- Ręcznie
  
  Rekordy początkowo nie zostaną przypisane opiekunowi danych. Właściciele sprintów i opiekunowie danych mogą przypisywać rekordy z Nieprzypisane.
Priorytet

Możesz ustawić priorytet dla sprintu. Priorytet jest używany do sortowania sprintów na liście sprintów.

Kliknij Zapisz, gdy będziesz gotowy utworzyć sprint.

Sprint został utworzony, a przypisani zarządcy danych mogą rozpocząć walidację danych.

Czy ta strona była pomocna?

Jeżeli natkniesz się na problemy z tą stroną lub jej zawartością — literówkę, brakujący krok lub błąd techniczny — daj nam znać!

Przekaż tu opinię