Создание спринта по разрешению из файла CSV
Вы можете создать спринт по разрешению из файла CSV, содержащего данные для проверки.
Необходимые условия
Прежде чем создать спринт, вам необходимо:
-
Пространство для использования при создании спринта.
Владельцы/создатели спринта должны иметь следующие разрешения в пространстве: Может управлять, Может редактировать, Может просматривать, Может просматривать данные
Кураторы данных должны иметь следующие разрешения в пространстве: Может редактировать, Может просматривать, Может просматривать данные
-
Подключение к хранилищу данных Snowflake, которое вы хотите использовать для хранения данных спринта. Не используйте шлюз данных для подключения.
Все пользователи спринта должны иметь следующие разрешения в пространстве подключения: Может редактировать, Может просматривать, Может просматривать данные
Вы можете создать подключение в Подключениях в Qlik Talend Data Integration центре активности.
Для получения дополнительной информации о подключениях Snowflake см. Snowflake.
Создание спринта
Чтобы создать спринт разрешения, нажмите Создать спринт в разделе Курирование данных в центре активности Qlik Talend Data Integration.
Общие настройки спринта
-
Имя
Добавьте имя для спринта.
-
Пространство
Выберите пространство для создания спринта.
-
Описание
Добавьте описание спринта.
-
Источник для заполнения спринта
Выберите Файл.
Импортируйте CSV-файл, содержащий данные, которые вы хотите проверить.
Нажмите Далее, когда будете готовы перейти к определению схемы данных.
Определить схему данных
Теперь вы можете проверить схему данных, используемую для проверки данных, и адаптировать ее к вашим требованиям. Индикаторы качества данных отображаются для каждого столбца, а потенциально недействительные данные выделяются. Это основано на выборке данных.
Заблокировать столбцы
Нажмите ... на столбце и выберите Заблокировать, чтобы заблокировать столбец для редактирования в спринте. Данные столбца по-прежнему будут видны, но не могут быть отредактированы распорядителями данных.
Исключить столбцы
Нажмите ... на столбце и выберите Исключить, чтобы исключить столбец из спринта. Данные столбца не будут видны ответственным за данные.
Применить семантический тип к столбцу
Столбец будет использовать свой собственный тип данных по умолчанию. Вы можете применить семантический тип к столбцу, чтобы помочь ответственным за данные при проверке данных.
-
Выберите столбец и нажмите
рядом с Тип данных. Теперь вы можете выбрать семантический тип для применения к столбцу.
Вы также можете изменить имя и описание для каждого столбца.
Нажмите Далее, когда будете готовы перейти к определению хранилища данных.
Добавить правило проверки к столбцу
Вы можете применять правила проверки к столбцу, чтобы упростить обнаружение недопустимых данных. Недопустимые данные будут выделены в столбце.
-
Выберите столбец и нажмите Применить правило проверки. Вы можете выбрать существующее правило проверки или создать новое правило проверки.
Для получения дополнительной информации о создании правил проверки см. Creating a validation rule.
Подключение к хранилищу данных
Вы должны подключиться к облачному хранилищу данных, которое вы хотите использовать для хранения данных спринта. Snowflake в настоящее время является единственным поддерживаемым хранилищем данных.
-
Выберите подключение к хранилищу данных.
-
Выберите, какую базу данных использовать.
-
Выберите, хотите ли вы использовать существующую схему базы данных или новую схему базы данных.
Если вы выберете Новая схема базы данных, задайте имя новой схемы.
-
Задайте имя таблицы, используемой для данных разрешенных спринтов, в поле Имя таблицы для разрешенных записей.
Нажмите Далее, когда будете готовы перейти к определению ролей и других настроек для рабочего процесса спринта.
Определение ролей и настроек для рабочего процесса спринта
Последний шаг — определение ролей и других настроек.
-
Добавить владельцев
Добавьте всех пользователей, которые должны быть владельцами спринта.
-
Добавить кураторов данных
Добавьте всех кураторов данных для этого спринта.
-
Запись рабочего процесса
Вы можете выбрать, хотите ли вы добавить второй этап проверки владельцами спринта.
Примечание к информацииЕсли пользователь, являющийся одновременно владельцем спринта и распорядителем данных, проверяет запись, второй этап проверки пропускается. -
Назначение записей
Выберите, хотите ли вы автоматически назначать записи или хотите ли вы назначать записи вручную распорядителям данных.
-
Авто
Записи назначаются автоматически распорядителям данных с равномерным распределением. Записи не будут назначаться владельцам спринтов, которые не являются также распорядителями данных.
-
Вручную
Записи изначально не будут назначаться распорядителю данных. Владельцы Sprint и ответственные за данные могут назначать записи из Неназначенные.
-
-
Приоритет
Вы можете установить приоритет для спринта.
Нажмите Сохранить, когда будете готовы создать спринт.
Спринт теперь создан, и назначенные ответственные за данные могут начать проверку данных.