Przeskocz do zawartości głównej Przejdź do treści uzupełniającej

Tworzenie sprintu rozwiązywania z pliku CSV

Możesz utworzyć sprint rozwiązywania z pliku CSV zawierającego dane do walidacji.

Wymagania wstępne

Zanim utworzysz sprint, potrzebujesz:

  • Przestrzeni do użycia podczas tworzenia sprintu.

    Właściciele/twórcy Sprintu muszą mieć następujące uprawnienia w przestrzeni: Może zarządzać, Może edytować, Może wyświetlać, Może wyświetlać dane

    Opiekun danych musi mieć następujące uprawnienia w przestrzeni: Może edytować, Może wyświetlać, Może wyświetlać dane

  • Połączenie z hurtownią danych Snowflake, którego chcesz użyć do przechowywania danych sprintu. Nie używaj bramy danych dla połączenia.

    Wszyscy użytkownicy sprintu muszą mieć następujące uprawnienia w przestrzeni połączenia: Może edytować, Może wyświetlać, Może wyświetlać dane

    Możesz utworzyć połączenie w Connections w centrum aktywności Qlik Talend Data Integration.

    Więcej informacji o połączeniach Snowflake zawiera temat Snowflake.

Tworzenie sprintu

Aby utworzyć sprint rozwiązania, kliknij Utwórz sprint w Opieka nad danymi w centrum aktywności Qlik Talend Data Integration.

Ogólne ustawienia sprintu

  1. Nazwa

    Dodaj nazwę dla sprintu.

  2. Przestrzeń

    Wybierz przestrzeń, w której chcesz utworzyć sprint.

  3. Opis

    Dodaj opis sprintu.

  4. Źródło populacji sprintu

    Wybierz Plik.

    Zaimportuj plik CSV zawierający dane, które chcesz zweryfikować.

Kliknij Dalej, gdy będziesz gotowy, aby przejść do definiowania schematu danych.

Zdefiniuj schemat danych

Możesz teraz zweryfikować schemat danych używany do walidacji danych i dostosować go do swoich wymagań. Wskaźniki jakości danych są wyświetlane dla każdej kolumny, a potencjalnie nieprawidłowe dane są podświetlone. Odbywa się to na podstawie próbki danych.

Zablokuj kolumny

Kliknij ... w kolumnie i wybierz Zablokuj, aby zablokować kolumnę do edycji w sprincie. Dane kolumny będą nadal widoczne, ale nie mogą być edytowane przez opiekunów danych.

Wyklucz kolumny

Kliknij ... w kolumnie i wybierz Wyklucz, aby wykluczyć kolumnę ze sprintu. Dane kolumny nie będą widoczne dla opiekunów danych.

Zastosuj typ semantyczny do kolumny

Kolumna będzie domyślnie używać swojego natywnego typu danych. Możesz zastosować typ semantyczny do kolumny, aby pomóc opiekunom podczas walidacji danych.

  • Wybierz kolumnę i kliknij Edytuj obok Typ danych. Możesz teraz wybrać typ semantyczny do zastosowania w kolumnie.

Możesz również zmienić nazwę i opis dla każdej kolumny.

Kliknij Dalej, gdy będziesz gotowy, aby przejść do definiowania magazynu danych.

Dodaj regułę walidacji do kolumny

Możesz zastosować reguły walidacji do kolumny, aby łatwiej było wykryć nieprawidłowe dane. Nieprawidłowe dane zostaną podświetlone w kolumnie.

  • Wybierz kolumnę i kliknij Zastosuj regułę sprawdzania poprawności. Możesz wybrać istniejącą regułę sprawdzania poprawności lub utworzyć nową regułę sprawdzania poprawności.

Więcej informacji o tworzeniu reguł sprawdzania poprawności zawiera temat Creating a validation rule.

Połącz z magazynem danych

Musisz połączyć się z hurtownią danych w chmurze, której chcesz użyć do przechowywania danych sprintu. Snowflake jest obecnie jedyną obsługiwaną hurtownią danych.

  1. Wybierz połączenie z hurtownią danych.

  2. Wybierz bazę danych, której chcesz użyć.

  3. Wybierz, czy chcesz użyć istniejącego schematu bazy danych, czy nowego schematu bazy danych.

    Jeśli wybierzesz Nowy schemat bazy danych, ustaw nazwę nowego schematu.

  4. Ustaw nazwę tabeli, która ma być używana dla rozwiązanych danych sprintu w Nazwa tabeli dla rozwiązanych rekordów.

Kliknij Dalej, gdy będziesz gotowy, aby przejść do definiowania ról i innych ustawień dla przepływu pracy sprintu.

Zdefiniuj role i ustawienia dla przepływu pracy sprintu

Ostatnim krokiem jest zdefiniowanie ról i innych ustawień.

  1. Dodaj właścicieli

    Dodaj wszystkich użytkowników, którzy powinni być właścicielami sprintu.

  2. Dodaj opiekunów

    Dodaj wszystkich opiekunów danych dla tego sprintu.

  3. Przepływ pracy rekordów

    Możesz wybrać, czy chcesz dodać drugi krok walidacji przez właścicieli sprintu.

    InformacjaJeśli użytkownik, który jest zarówno właścicielem sprintu, jak i zarządcą danych, zatwierdzi rekord, drugi krok walidacji jest pomijany.
  4. Przypisanie rekordu

    Wybierz, czy chcesz automatycznie przypisywać rekordy, czy też chcesz przypisywać rekordy ręcznie zarządcom danych.

    • Autom.

      Rekordy są przypisywane automatycznie zarządcom danych z równomiernym rozłożeniem. Rekordy nie zostaną przypisane właścicielom sprintów, którzy nie są również zarządcami danych.

    • Ręcznie

      Rekordy początkowo nie zostaną przypisane zarządcy danych. Właściciele Sprintu i zarządcy danych mogą przypisywać rekordy z Nieprzypisane.

  5. Priorytet

    Możesz ustawić priorytet dla sprintu.

Kliknij Zapisz, gdy wszystko będzie gotowe do utworzenia sprintu.

Sprint został utworzony, a przypisani zarządcy danych mogą rozpocząć walidację danych.

 

Czy ta strona była pomocna?

Jeżeli natkniesz się na problemy z tą stroną lub jej zawartością — literówkę, brakujący krok lub błąd techniczny — daj nam znać!