Мониторинг отдельной задачи данных
Вы можете отслеживать статус и ход выполнения задач данных, выбрав Мониторинг в раскрывающемся меню в левом верхнем углу окна задачи данных.
Вы также можете создавать представления мониторинга для отслеживания нескольких задач данных. Для получения дополнительной информации см. Мониторинг и управление задачами данных.
Общий обзор мониторинга
Представление мониторинга доступно для всех типов задач и позволяет отслеживать статус и метрики задачи:
-
Вкладки
Переключайтесь между доступными вкладками, такими как Информация, Полная загрузка и Обработка изменений, Пакет или Потоковая передача, в зависимости от типа задачи. Подробные сведения о каждой вкладке см. в соответствующем разделе задач ниже.
-
Фильтр статуса набора данных
Линейчатая диаграмма над таблицей наборов данных показывает, сколько наборов данных находится в каждом статусе: В очереди, Загрузка, Завершено и Ошибка. Диаграмма обновляется динамически при изменении статусов наборов данных. Щелкните сегмент статуса, чтобы отфильтровать таблицу наборов данных и показать только наборы данных в этом статусе.
-
Скрыть виджеты
Нажмите Скрыть виджеты, чтобы свернуть виджеты метрик. Это освободит больше места для просмотра таблицы наборов данных ниже.
-
Дата начала
Дата и время начала текущего запуска задачи.
-
Дата окончания
Дата и время окончания запуска задачи. Отображается только для завершенных запусков задач.
-
История запусков
Нажмите История запусков, чтобы просмотреть список предыдущих запусков задач и их результаты.
Мониторинг задач перемещения данных
Доступные параметры мониторинга определяются как типом задачи, так и типом коннектора. Поскольку некоторые коннекторы не поддерживают CDC (например, Epicor), параметры мониторинга, относящиеся к CDC, для этих коннекторов отображаться не будут. Аналогично, поскольку некоторые коннекторы не поддерживают полную загрузку (например, коннекторы Preview), параметры мониторинга, относящиеся к полной загрузке, для этих коннекторов отображаться не будут.
Вариант использования конвейера данных: задачи промежуточного хранения
Все задачи промежуточного хранения должны начинаться с полной загрузки исходных данных в целевой объект. После завершения первоначальной полной загрузки целевые данные обновляются с учетом изменений в исходных данных. Это можно сделать с помощью функции Перезагрузить и сравнить или Захват измененных данных (CDC) в соответствии с определением задачи.
Для получения дополнительной информации о задачах промежуточного хранения см. Промежуточное хранение данных из источников данных.
Вариант использования репликации: задачи «Replicate data»
Задачи «Replicate data» обычно начинаются с полной загрузки исходных данных в целевой объект. В следующей таблице обобщены варианты использования полной загрузки.
| Вариант использования | Полная загрузка |
|---|---|
| Репликация из приложений SaaS, доступ к которым осуществляется через Lite-коннекторы | Обязательно |
| Репликация из приложений SaaS, доступ к которым осуществляется через коннекторы Preview. | Не применимо, так как коннекторы Preview не поддерживают полную загрузку. |
| Репликация из баз данных | Необязательно |
При репликации из баз данных, если исходные данные уже существуют в целевом объекте и вы хотите только применить изменения источника к целевому объекту (или сохранить их для применения позже), режимом репликации может быть Применить изменения, Сохранить изменения или оба варианта. Оба этих режима репликации отображаются в мониторинге CDC.
Для получения дополнительной информации о задачах «Replicate data» см. следующие разделы:
Репликация данных при использовании подписки Standard, Premium или Enterprise
Репликация данных с использованием подписки Qlik Talend Cloud Starter
Вариант использования репликации: задачи «Land data in data lake»
Задачи «Land data in data lake» аналогичны задачам промежуточного хранения тем, что они должны начинаться с полной загрузки. После завершения первоначальной полной загрузки целевые данные обновляются с учетом изменений в исходных данных. Это можно сделать с помощью функции Перезагрузить или Захват измененных данных (CDC). Несмотря на сходство с задачами промежуточного хранения, задачи «Land data in data lake» считаются задачами репликации, поскольку они состоят только из репликации из источника в целевой объект. Они не предлагают возможности дальнейшей обработки данных на последующих этапах (например, с использованием преобразований и витрин данных), которая доступна в конвейере данных.
For more information on "Land data in data lake" tasks, see Промежуточное хранилище данных в озере данных при использовании подписки Standard, Premium или Enterprise.
Сведения о мониторинге
Доступны следующие сведения о мониторинге:
-
Информация
-
Полная загрузка
-
Обработка изменений
-
Потоковая передача
Доступно только для потоковых задач промежуточного хранения.
Сведения о мониторинге Информация
Вы можете просмотреть общую информацию о задаче, Идентификатор запуска и время обновления данных. Для задач CDC на этой вкладке также доступна информация о расписании.
Сведения о мониторинге Полная загрузка
как в диалоговом окне Создать подключение, так и в онлайн-справке.Вы можете просмотреть следующую статистику для задачи данных в разделе Полная загрузка:
-
Всего наборов данных
Количество загруженных наборов данных.
-
Наборы данных с ошибками
Количество наборов данных с ошибками.
-
Общая задержка
Текущая задержка задачи (чч:мм:сс). Эта длительность представляет собой время с момента появления изменения в источнике до момента его применения и доступности в целевом объекте или промежуточном хранении.
-
Общая пропускная способность
Пропускная способность целевого объекта в килобайтах в секунду. Это указывает на то, насколько быстро записи изменений загружаются в целевую конечную точку.
Вы можете просмотреть следующие сведения для каждого набора данных в задаче данных:
-
Имя
Имя целевого набора данных.
-
Состояние
Состояние таблицы будет одним из следующих: В очереди, Загрузка, Завершено или Ошибка.
-
Время начала
Время начала загрузки.
-
Время окончания
Время окончания загрузки.
-
Длительность
Длительность загрузки в формате чч:мм:сс.
-
Записи
Количество записей, которые были записаны в целевой объект во время загрузки.
Примечание к информацииПри фильтрации исходных наборов данных раздел Записи будет заменен следующими разделами:
-
Прочитанные записи: Количество записей, прочитанных из исходных наборов данных перед фильтрацией.
-
Записанные записи (после фильтрации): Количество записей, фактически записанных в целевой объект после фильтрации.
Для получения информации о фильтрации наборов данных см. Фильтрация набора данных.
-
-
Сообщение
Отображает сообщение об ошибке, если загрузка не была успешно обработана.
Сведения о мониторинге Обработка изменений
В разделе Обработка изменений отображается количество изменений, примененных ко всем таблицам во время последнего запуска CDC или во время текущего запуска, если он еще не завершен. Чтобы просмотреть количество изменений, примененных к отдельным наборам данных с момента запуска задачи, см. таблицу Наборы данных.
Вы можете просмотреть следующую статистику обработки изменений:
-
Всего наборов данных
Количество загруженных наборов данных.
-
Наборы данных с ошибками
Количество наборов данных с ошибками.
-
Общая задержка
Текущая задержка задачи (чч:мм:сс). Эта длительность представляет собой время с момента появления изменения в источнике до момента его применения и доступности в целевом объекте или промежуточном хранении.
-
Общая пропускная способность
Пропускная способность целевого объекта в килобайтах в секунду. Это указывает на то, насколько быстро записи изменений загружаются в целевую конечную точку.
-
Всего входящих изменений
Количество изменений, присутствующих в источнике и ожидающих обработки. Вы можете просмотреть, сколько изменений накопилось в источнике и сколько применяется.
-
Всего примененных изменений
Количество изменений, примененных к целевому объекту или промежуточному хранению. Вы можете просмотреть количество добавлений, удалений и обновлений.
Вы можете просмотреть следующие сведения для каждой таблицы в задаче данных:
как в диалоговом окне Создать подключение, так и в онлайн-справке.-
Имя
Имя целевой таблицы в ресурсе данных промежуточного хранения.
-
Состояние
Состояние таблицы будет одним из следующих: Накопление изменений, Ошибка или Завершено (для запланированных задач CDC).
-
Последняя обработка
Дата и время внесения последних изменений в таблицу.
-
Вставки, Обновления и Удаления
Примечание к информацииПри фильтрации исходных наборов данных столбцы Вставки, Обновления и Удаления будут сгруппированы следующим образом:
-
Прочитано: Количество изменений (вставок, обновлений и удалений), прочитанных из исходных наборов данных перед фильтрацией.
-
Записано (после фильтрации): Количество изменений (вставок, обновлений и удалений), фактически записанных в целевой объект после фильтрации.
Для получения информации о фильтрации наборов данных см. Фильтрация набора данных.
-
Вставки
Количество операций вставки.
-
Обновления
Количество операций обновления.
Примечание к информацииОбновления обрабатываются как вставки для источников приложений SaaS. -
Удаления
Количество операций удаления.
-
-
DML (вставки/обновления)
Примечание к информацииЭтот столбец отображается только для задач, определенных с помощью коннектора Preview приложения SaaS. Коннекторы Preview обозначаются кнопкой
как в диалоговом окне Создать подключение, так и в онлайн-справке.Примечание к информацииПри фильтрации исходных наборов данных столбцы Вставки, Обновления и Удаления будут сгруппированы следующим образом:
-
Прочитанные DML (вставки/обновления): Количество DML (вставок и обновлений), прочитанных из исходных наборов данных перед фильтрацией.
-
Записанные DML (вставки/обновления): Количество DML (вставок и обновлений), фактически записанных в целевой объект после фильтрации.
Для получения информации о фильтрации наборов данных см. Фильтрация набора данных.
-
-
Операции DDL
Количество операций DDL
Примечание к информацииДоступно только для задач «Replicate data». -
Сообщение
Отображает сообщение об ошибке, если изменения в таблице не удались и не были обработаны.
Если вы выполняете промежуточное хранение данных из локального источника и выбрали режим Полная загрузка, таблицы будут автоматически перезагружены при выполнении действия Запуск для ресурса данных промежуточного хранения.
Если вы выполняете промежуточное хранение данных из локального источника и выбрали режим Полная загрузка и CDC, таблицы будут непрерывно обновляться новыми данными после первоначальной полной загрузки.
Перезагрузка выбранных таблиц
Вы можете вручную перезагрузить выбранные таблицы из источника. Это полезно, когда требуется восстановить отдельные таблицы с ошибками. Перезагрузка таблиц не повлияет на временную шкалу CDC, которая сбрасывается при использовании функции Пересоздать таблицы. Изменения метаданных не распространяются при перезагрузке таблиц.
-
Чтобы перезагрузить выбранные таблицы, выберите их в нижней половине вкладки Мониторинг и нажмите Перезагрузить таблицы.
Вам требуются те же разрешения, которые необходимы для запуска задачи данных, то есть роль Владелец или Может управлять.
Кнопка Перезагрузить таблицы доступна после первого запуска задачи данных. Если методом обновления является Перезагрузить и сравнить, кнопка Перезагрузить таблицы недоступна во время выполнения задачи данных.
Задачи данных последующего хранения будут синхронизированы при следующем запуске. Если для задачи хранения включена история, она будет сохранена.
Если восстановление путем перезагрузки таблиц невозможно, следующим шагом является исправление задачи данных.
Перезагрузка всех таблиц в целевой объект
Вы можете перезагрузить все таблицы в целевой объект, если возникнут проблемы с CDC, которые невозможно решить путем перезагрузки отдельных таблиц. Примерами проблем являются пропущенные события, проблемы, вызванные реорганизацией исходной базы данных, или сбой при чтении событий исходной базы данных.
- Остановите задачу данных и все задачи, которые ее используют.
-
Откройте задачу данных и перейдите вкладку Мониторинг.
-
Щелкните ..., а затем Перезагрузить цель.
В результате этого все таблицы будут перезагружены в цель с использованием операции «Отбросить-Создать» (Drop-Create), а также будут перезапущены все процессы захвата изменений данных с этого момента.
-
Задачи хранения, которые используют эту задачу промежуточного хранения, будут перезагружены в режиме «Сравнить и применить» для синхронизации при следующем запуске. Существующая история будет сохранена. История типа 2 будет обновлена с учетом изменений после выполнения процесса «Перезагрузка и сравнение».
Метка времени для начальной даты в истории типа 2 будет отражать дату перезагрузки, а не фактическую дату внесения изменения в источник.
-
Виды хранения в реальном времени не будут надежными во время операции перезагрузки цели и до окончания синхронизации. Хранилище полностью синхронизируется, когда:
-
все таблицы перезагружаются в режиме «Сравнить и применить»,
-
один цикл изменений выполняется для каждой таблицы.
-
Мониторинг задач хранения, преобразования, витрины данных, зеркалирования, и витрины знаний
Вы можете отслеживать статус и ход выполнения задачи хранения, преобразования, витрины данных, зеркалирования, или витрины знаний.
Доступны следующие сведения о мониторинге:
-
Информация
-
Полная загрузка
-
Пакет
Сведения о мониторинге Информация
Вы можете просмотреть общую информацию о задаче, Идентификатор запуска и время обновления данных.
Сведения о мониторинге Полная загрузка
как в диалоговом окне Создать подключение, так и в онлайн-справке.Вы можете просмотреть следующую статистику для задачи данных в разделе Полная загрузка:
-
Всего наборов данных
Количество загруженных наборов данных.
-
Наборы данных с ошибками
Количество наборов данных с ошибками.
-
Общая пропускная способность
Пропускная способность целевого объекта в килобайтах в секунду. Это указывает на то, насколько быстро записи изменений загружаются в целевую конечную точку.
Сведения о мониторинге Пакет
Вы можете просмотреть статистику для пакетов изменений:
-
Всего наборов данных
Количество загруженных наборов данных.
-
Наборы данных с ошибками
Количество наборов данных с ошибками.
-
Общая задержка
Текущая задержка задачи (чч:мм:сс). Эта длительность представляет собой время с момента появления изменения в источнике до момента его применения и доступности в целевом объекте или промежуточном хранении.
-
Общая пропускная способность
Пропускная способность целевого объекта в килобайтах в секунду. Это указывает на то, насколько быстро записи изменений загружаются в целевую конечную точку.
-
Источник
Задержка и пропускная способность в источнике.
-
Целевой объект
Задержка и пропускная способность в целевом объекте.
-
Всего входящих изменений
Количество изменений, присутствующих в источнике и ожидающих обработки. Вы можете просмотреть, сколько изменений накопилось в источнике и сколько применяется.
-
Всего примененных изменений
Количество изменений, примененных к целевому объекту или промежуточному хранению. Вы можете просмотреть количество добавлений, удалений и обновлений.
Просмотр статуса и хода выполнения
Вы можете просмотреть следующие сведения для каждого набора данных или изменения в разделе Наборы данных:
-
Имя
Имя целевого набора данных.
-
Состояние
Состояние таблицы будет одним из следующих: В очереди, Загрузка, Завершено или Ошибка.
-
Время начала
Время начала загрузки.
-
Время окончания
Время окончания загрузки.
-
Длительность
Длительность загрузки в формате чч:мм:сс.
-
Записи
Количество записей, которые были записаны в целевой объект во время загрузки.
Примечание к информацииПри фильтрации исходных наборов данных раздел Записи будет заменен следующими разделами:
-
Прочитанные записи: Количество записей, прочитанных из исходных наборов данных перед фильтрацией.
-
Записанные записи (после фильтрации): Количество записей, фактически записанных в целевой объект после фильтрации.
Для получения информации о фильтрации наборов данных см. Фильтрация набора данных.
-
-
Сообщение
Отображает сообщение об ошибке, если загрузка не была успешно обработана.
Данные из всех исходных транзакций до времени, указанного в поле Задача данных обновлена по состоянию на, доступны для использования из этой задачи данных. Эта информация становится доступной для задачи данных после загрузки всех таблиц и применения первого набора изменений. Если вы выбрали создание динамических представлений, вы также можете просматривать время обновления динамических представлений.
Если пакет изменений поступает до завершения первоначальной загрузки, значение поля Задача данных обновлена по состоянию на не будет обновлено до тех пор, пока не завершится первоначальная загрузка и не будет применен первый пакет изменений. Например, предположим, что вы загружаете ресурс данных, который содержит набор данных заказов, содержащий 1 миллион заказов, и набор данных сведений о заказах, содержащий 10 миллионов сведений о заказах. Выполнение полной загрузки этих наборов данных занимает 10 и 20 минут соответственно. Сначала загружается набор данных заказов, а затем набор данных сведений о заказах. Во время загрузки набора данных заказов был вставлен новый заказ. Таким образом, когда загружаются сведения о заказе, они могут содержать сведения о новом заказе, которого еще нет в наборе данных заказов. Наборы данных заказов и сведений о заказах будут синхронизированы и полностью обновлены на одно и то же время только после применения первого пакета изменений.
Просмотр подробной информации
Вы можете просмотреть подробную информацию на уровне инструкций SQL.
-
Выберите наборы данных для подробного мониторинга.
-
Нажмите Сведения о мониторинге.
Отобразится раздел Сведения о мониторинге, и вы сможете просмотреть команды, выполняемые для каждого шага процесса загрузки или изменения. Вы можете нажать на команду, чтобы просмотреть полные инструкции SQL, которые были выполнены.
-
Нажмите Экспорт в CSV, чтобы экспортировать текстовый файл с полными инструкциями SQL для всех перечисленных команд.
Поле Задача данных обновлена по состоянию на для представлений
Поле Задача данных обновлена по состоянию на показывает время, на которое обновлено самое старое представление.
-
Стандартные представления
Поле Задача данных обновлена по состоянию на показывает время, на которое обновлено самое старое стандартное представление.
Например, предположим, что у задачи есть две таблицы: Orders и Order details. Таблица Orders обновлена до 10:01 записями от 10:00 и 10:01, а таблица Order details содержит записи только от 10:00. В этом случае задача данных обновлена по состоянию на 10:00. Это не следует путать со временем начала и окончания загрузки задачи данных, которое может быть с 10:02 до 10:03.
-
Динамические представления (задачи данных хранения)
Поле Задача данных обновлена по состоянию на показывает время, на которое обновлено самое старое динамическое представление.
Например, предположим, что у задачи есть таблица Orders. Таблица Orders в промежуточном хранении обновлена до 10:01 записями от 10:00 и 10:01, но таблица Orders в хранилище обновлена записями только от 10:00. В этом случае динамические представления для Orders обновлены до 10:01, а стандартные представления — до 10:00.
Просмотр истории запусков
Вы можете просмотреть историю запусков задачи, чтобы выявить первопричины и понять закономерности с течением времени.
-
Нажмите История запусков в представлении Мониторинг для задачи.
-
Нажмите История запусков в меню ... задачи в Представления мониторинга.
В истории запусков отображается до 100 выполнений в зависимости от выбранных фильтров. Уточните критерии фильтрации, чтобы просмотреть другие выполнения. Можно настроить фильтр по дате окончания выполнения и статусу задачи. Информация о запусках хранится в течение 13 месяцев. Метаданные набора данных в запусках хранятся в течение 30 дней.