Управление наборами данных

Управляйте наборами данных, содержащимися в задачах данных Промежуточное хранение, Хранилище, Преобразование, Киоск данных и Репликация, создавая преобразования, фильтруя данные и добавляя столбцы.

Наборы данных, содержащиеся в ресурсах данных, доступны в разделе Наборы данных» в виде Дизайн. Можно выбрать отображаемые столбцы с помощью инструмента «Управление столбцами» ().

Наборы данных в виде Дизайн в задаче данных

Правила преобразования и явные преобразования

Приложение позволяет выполнять как глобальные, так и явные преобразования.

Правила преобразования

Можно выполнять глобальные преобразования, создавая правило преобразования, которое использует % в качестве подстановочного знака в области для применения ко всем соответствующим наборам данных.

Нажмите Правила и выберите Добавить правило, чтобы создать новое правило преобразования.

Для получения дополнительной информации см. раздел Создание правил для преобразования наборов данных.

Правила преобразования помечены темно-фиолетовым уголком на соответствующем атрибуте.

Явные преобразования

Явные преобразования создаются:

при использовании функции Изменить, чтобы изменить атрибут столбца;
при использовании функции Переименовать, чтобы переименовать набор данных;
при добавлении столбца.

Явные преобразования переопределяют глобальные преобразования и помечены светло-фиолетовым уголком на соответствующем атрибуте.

Модели набора данных

Наборы данных могут быть основаны как на источнике, так и на цели, в зависимости от типа задачи и операций в ней. Используемая модель набора данных влияет на поведение конвейера при изменении источника и на доступные операции.

Наборы данных на основе источника

Набор данных основан на исходных наборах данных и будет содержать только изменения в метаданных. Изменение исходных данных применяется автоматически, что может привести к изменениям во всех последующих задачах. Невозможно изменить порядок столбцов или исходный набор данных.

В следующих типах задач всегда используется модель набора данных на основе источника: промежуточное хранение, хранилище, зарегистрированные данные, репликация и промежуточное хранение в озере данных.
Наборы данных, основанные на цели

Набор данных основан на метаданных цели. Если столбец добавлен из источника или удален, он не будет автоматически применен к нижестоящей задаче. Также можно изменить порядок столбцов и исходный набор данных. Это означает, что задача является более автономной и позволяет контролировать последствия изменений в источнике.

Следующие типы задач могут использовать модель набора данных на основе цели: преобразование, киоск данных. В некоторых случаях модель на основе источника используется для задач преобразования, основанных на операции.
- Если преобразование SQL или поток преобразования выполняет выбор столбца, набор данных будет основан на цели. Например, если в преобразовании SQL используется SELECT A, B, C from XYZ или в потоке преобразования применяете процессор Выбрать столбцы.
- Если сохраняются столбцы по умолчанию, то набор данных основан на источнике. Например, если используется SELECT * from XYZ в преобразовании SQL.

Обновление проектов путем перехода с модели, основанной на источнике, на модель, основанную на цели

При необходимости существующие проекты обновляются до модели набора данных на основе цели. При первом открытии проекта будут предложены инструкции по процессу обновления. При импорте и экспорте проектов с разными моделями наборов данных необходимо учитывать некоторые аспекты.

Проект с моделью на основе источника невозможно импортировать в проект с моделью на основе цели.

Импортируйте проект с моделью на основе источника в новый проект, обновите новый проект и экспортируйте полученный проект. Теперь можно повторно импортировать этот проект в проект с моделью, основанной на цели.
Проект с моделью на основе цели невозможно импортировать в проект с моделью на основе источника.

Обновите проект, выбрав модель, основанную на цели, а затем импортируйте в него проект с моделью, основанной на цели.

Фильтрация набора данных

Возможность фильтрации набора данных доступна для задач промежуточного хранения данных, с помощью которых данные помещаются на промежуточное хранение через Qlik Data Gateway — Data Movement, а также для задач хранения и преобразования данных.

При необходимости можно отфильтровать данные для создания подмножества строк.

Нажмите Фильтр.

Для получения дополнительной информации см. раздел Фильтрация набора данных.

Переименование набора данных

Набор данных можно переименовать.

Щелкните на наборе данных, затем выберите Изменить.

Добавление столбцов

При необходимости можно добавить столбцы с преобразованиями на уровне строк.

Нажмите Добавить столбец.

Для получения дополнительной информации см. раздел Добавление столбцов в набор данных.

Изменение столбца

Изменить свойства столбцов можно, выбрав столбец и нажав Изменить.

Имя
Ключ

Задайте столбец в качестве первичного ключа. Ключи также можно задавать путем выбора или отмены выбора в столбце Ключ.
Допускает значение NULL
Тип данных

Задайте тип данных для столбца. Для некоторых типов данных можно задать дополнительное свойство, например, Длина.

Примечание к информацииПри изменении типа данных или размера типа данных столбца это может иметь последствия для задач, использующих набор данных. Для получения дополнительной информации см. раздел Управление типами данных.

Удаление столбцов

Из набора данных можно удалить один или несколько столбцов.

Выберите столбцы для удаления и нажмите Удалить.

Если необходимо просмотреть удаленные столбцы, нажмите Показать удаленные столбцы. Удаленные столбцы отображаются зачеркнутым текстом. Удаленный столбец можно восстановить, выбрав его и нажав «Вернуть».

Чтобы удалить добавленный столбец, выберите его и нажмите «Вернуть».

Отмена явных изменений в столбцах

Все явные изменения в одном или нескольких столбцах можно отменить.

Выберите столбцы, в которых необходимо отменить изменения, и нажмите «Вернуть».

Изменения, внесенные правилами глобального преобразования, не будут отменены.

Если вернуть добавленную колонку, она будет удалена.

Параметры набора данных

Параметры набора данных можно изменить. Параметр по умолчанию наследуется от ресурса данных, но его также можно изменить так, чтобы значение было явно Вкл. или Выкл.

Нажмите на наборе данных и выберите Параметры.

Просмотр данных

Можно открыть образец данных, чтобы посмотреть и проверить форму данных в процессе проектирования конвейера данных.

Должны соблюдаться следующие требования:

Просмотр данных включается на уровне клиента в Администрирование центре активности.

Чтобы включить его, перейдите на страницу Настройки, выберите вкладку Управление функциями и включите Просмотр данных в Интеграция данных.
Вам назначена роль Может просматривать данные в пространстве, где находится подключение.
Вам назначена роль Может просматривать в пространстве, где находится проект.

Когда проекты и подключения создаются в личном пространстве, владелец всегда может просматривать данные.

Чтобы просмотреть образец данных на вкладке Наборы данных в виде Дизайн, выполните следующие действия.

Щелкните Просмотреть данные в разделе Физические объекты.

Отображается образец данных. Параметр Количество строк позволяет настроить, сколько строк требуется включить в образец.

Чтобы переключаться между наборами данных и таблицами, выполните следующие действия.

Выберите Наборы данных, чтобы отобразить логическое представление данных.
Выберите Физические объекты, чтобы просмотреть физическое представление в базе данных в форме таблиц и видов.

Примечание к новостямЭтот вариант недоступен, если физическое представление еще не создано.

Можно фильтровать данные образца двумя способами:

Используйте для ограничения объема извлекаемых данных образца.

Например, если используется фильтр ${OrderYear}>2023 и параметру Количество строк задано значение 10, будет отображен образец, содержащий 10 заказов за 2024 год.
Фильтруйте данные образца по конкретному столбцу.

Это затронет только существующие данные образца. Если использовать , чтобы включить только заказы за 2024 год, а фильтр столбцов настроен для отображения заказов за 2022 год, будет возвращен пустой образец.

Также можно сортировать образец данных по конкретному столбцу. Сортировка затронет только существующие данные образца. Если использовать фильтр , чтобы включить только заказы за 2024 год, и инвертировать порядок сортировки, данные образца будут содержать только заказы за 2024 год.

Можно скрывать столбцы в виде данных:

Чтобы скрыть один столбец, щелкните на столбце и выберите Скрыть столбец.
Чтобы скрыть несколько столбцов, щелкните на столбце и выберите Отобразить столбцы. Это позволяет управлять видимостью всех столбцов в виде.

Проверка и исправление наборов данных

Все наборы данных, содержащиеся в задаче данных, можно проверить.

Разверните раздел Проверить и исправить, чтобы просмотреть все ошибки проверки и изменения дизайна.

Проверка наборов данных

Нажмите Проверить наборы данных, чтобы проверить наборы данных.

Проверка выполняется по следующим критериям:

у всех ли таблиц есть первичный ключ;
все ли атрибуты на месте;
есть ли дублирующиеся имена таблиц или столбцов.

Кроме того, будет представлен список изменений в дизайне по сравнению с исходным дизайном:

добавленные таблицы и столбцы;
удаленные таблицы и столбцы;
переименованные таблицы и столбцы;
измененные первичные ключи и типы данных.

Разверните раздел Проверить и исправить, чтобы просмотреть все ошибки проверки и изменения дизайна.

Исправьте ошибки проверки, а затем снова выполните проверку наборов данных.
Большинство изменений в дизайне могут быть исправлены автоматически, за исключением измененных первичных ключей или типов данных. В этом случае необходимо выполнить синхронизацию наборов данных.

Подготовка наборов данных

Наборы данных можно подготовить к корректировке изменений в дизайне без потери данных, если это возможно. Если есть изменения в дизайне, которые невозможно скорректировать без потери данных, появится возможность воссоздать таблицы из источника с потерей данных.

Для этого необходимо остановить задачу.

Нажмите и выберите Подготовка.

По завершении подготовки наборов данных проверьте их, прежде чем перезапускать задачу хранения.

Воссоздание наборов данных

Можно воссоздать наборы данных из источника. При повторном создании набора данных происходит потеря данных. Пока имеются исходные данные, их можно перезагрузить из источника.

Если возникли проблемы с отдельными таблицами, рекомендуется сначала попробовать перезагрузить таблицы, а не создавать их заново. Воссоздание таблиц может привести к потере исторических данных. При наличии существенных изменений необходимо также подготовить нижестоящие задачи данных, потребляющие воссозданные задачи данных, для перезагрузки данных.

Для этого необходимо остановить задачу.

Нажмите и выберите Воссоздать таблицы.

Ограничения

При удалении или переименовании столбца в Google BigQuery таблица будет воссоздана, что приведет к потере данных.

Помогла ли вам эта страница?

Если вы обнаружили какую-либо проблему на этой странице или с ее содержанием — будь то опечатка, пропущенный шаг или техническая ошибка, сообщите нам об этом!

Оставьте свой отзыв здесь