Анализ происхождения в Аналитика
Происхождение отслеживает данные и преобразование данных в обратном направлении до первоначального источника. Qlik Cloud предоставляет подробное визуальное представление истории этого потока, где можно в интерактивном режиме изучить восходящее происхождение аналитического контента. Происхождение доступно для такого контента, как приложения, скрипты, потоки данных, рецепты таблиц, эксперименты машинного обучения, развертывания машинного обучения и наборы данных.
Бизнес-пользователи, изучающие заданное поле, имеют представление о происхождении для этого поля, которое обобщает его наиболее важные зависимости:
- Поля, которые используются для его получения
- Прямые ассоциации и зависимости, включая владельца и пространство
- Первоначальный источник (первый известный источник)
Чтобы просмотреть нисходящие или перспективные зависимости, можно исследовать, на какие элементы повлияет изменение объекта, просмотрев Анализ влияния. См. Анализ влияния в Аналитика.
Для визуальной демонстрации того, как использовать происхождение, см.:
Чтобы использовать происхождение, также необходимо, чтобы для параметра Просмотр происхождения было установлено значение Разрешено с помощью User Default или пользовательской роли безопасности.
График происхождения
График Происхождение показывает поток данных через аналитический контент на интерактивной графической диаграмме. Ресурс, таблица или поле называются узлом на графике происхождения. Когда узел является базовым узлом, который исследуется, говорят, что он находится в фокусе, и он отображается как последний элемент на графике. На самом детальном уровне графики происхождения на уровне полей показывают источники данных и преобразования, из которых получен узел или от которых он зависит.
Графики происхождения полезны для:
-
Экспертов по данным, работающих с данными
-
Бизнес-специалистов, создающих приложения
-
Продвинутых бизнес-пользователей, использующих приложения
-
Пользователей, которые работают с моделями машинного обучения
Каждый узел представляет собой шаг в происхождении выбранного контента. Эта информация о происхождении компилируется всякий раз, когда аналитический ресурс обновляет свои данные. Если приложение, скрипт, поток данных или рецепт таблицы не обновлялись в последнее время, происхождение может быть неполным или неточным.
Происхождение доступно для поддерживаемых типов контента из плитки или строки в том виде, в котором они отображаются в каталоге. Можно проанализировать происхождение для следующего аналитического контента:
-
Набор данных: Наборы данных — это источники данных, такие как данные, загруженные из коннекторов или файлов данных. Наборы данных могут быть таблицами в базе данных, данными, которые загружаются в хранилище данных, или данными, которые генерируются из приложения, например файлом qvd. Наборы данных обычно имеют по одной таблице, но некоторые, например файлы Excel, могут иметь несколько таблиц.
Наборы данных, которые были опубликованы из Talend Studio, обозначаются значком
. Можно перейти к заданию Talend Management Console, которое использовалось для создания набора данных, нажав Открыть задание TMC в меню набора данных .... Для получения дополнительной информации см. Публикация наборов данных и происхождения в Qlik Cloud. -
Приложение: Узлы приложений представляют собой аналитические приложения Qlik Sense, которые используют источники данных в происхождении. Узлы приложений отображают имя приложения и местоположение приложения как Qlik Sense.
-
Скрипт: Узлы скриптов представляют собой скрипты, созданные в интерфейсе Скрипт.
-
Поток данных: Потоки данных можно проверять для лучшего понимания источников данных, которые они используют и преобразуют.
-
Рецепт таблицы: Рецепты таблиц можно проверять для лучшего понимания источника данных, который они используют и преобразуют.
-
Эксперимент МО: Можно понять происхождение эксперимента машинного обучения, которое состоит из источников данных, объединенных для создания данных для обучения моделей машинного обучения.
-
Развертывание МО: Можно понять происхождение развертывания МО и то, как оно используется в прогнозах. Происхождение для развертываний МО обычно состоит из экспериментов МО, версий экспериментов, моделей и наборов данных.
Типичные входные узлы включают источники данных, которые используются базовым узлом, или приложения, которые создают наборы данных. Происхождение на уровне полей позволяет детально исследовать, как были вычислены поля и их конкретное происхождение в преобразованиях и приложениях.
Узлы, доступные на графике происхождения, являются входными данными для выбранного контента. Выберите элемент, чтобы назначить его базовым узлом. Входные узлы — это узлы, которые находятся выше базового узла.
График происхождения на уровне полей

Узлы, доступные на графике происхождения, являются входными данными для выбранного базового узла, другими словами, узла в фокусе. Базовый узел — это единственный узел, для которого требуется получить происхождение; например, это может быть приложение, поток данных, эксперимент МО, набор данных, файл, таблица или поле.
Он будет самым правым узлом на экране и обведен синим цветом. Он находится в центре внимания исследования, и будут представлены только входные данные для этого базового узла.
Во время изучения происхождения можно в интерактивном режиме изменить базовый узел на другую таблицу, приложение, поле или другой элемент на экране, чтобы сфокусировать исследование.
Базовый узел происхождения

Линии, соединяющие узлы, являются ребрами. Ребра представляют собой отношение одного узла к другому узлу. Они представляют собой отношения, указывающие на ассоциации, такие как набор данных, который используется приложением. Они также могут представлять данные, которые производятся как побочный продукт приложения. Совокупность узлов и ребер вместе образует график происхождения.
Ребра происхождения представляют отношения

Узлы сворачиваются или разворачиваются, чтобы показать уровни иерархии от грубой до более мелкой детализации, начиная с группы наборов данных более высокого уровня или приложения и заканчивая самым детальным уровнем, которым является уровень полей.
На этом изображении узла показаны следующие уровни иерархии, от самого высокого (самого грубого) до самого низкого (самого детального): Ресурс данных (приложение), ресурс (набор данных), таблица и поля.

Открытие графика происхождения
Выполните следующие действия.
-
Откройте центр активности Наблюдения или Аналитика.
-
Выберите Инструменты > Происхождение в контекстном меню
элемента, который поддерживает происхождение.
Также можно получить доступ к графику происхождения некоторого контента, когда открыт элемент. Нажмите и Происхождение.
Сведения об узле
Сведения ограничены доступом к этому объекту. Сведения могут предоставлять следующую информацию:
-
Имя
-
Описание
-
Теги
-
Местоположение
-
Пространство
-
Владелец
-
Создатель
-
Последнее изменение
Навигация по графику происхождения
Нажмите и перетащите график, чтобы перемещаться и центрировать график происхождения. Также можно использовать кнопки навигации. Выберите «Домой» , чтобы центрировать график происхождения на базовом узле. Нажимайте «Назад» и «Вперед», чтобы перемещаться по выборкам.
Навигация по графику происхождения
График Происхождение показывает восходящие зависимости для аналитического контента, который представлен как узел по умолчанию при открытии графика для него. Можно получить доступ к происхождению (восходящему) или анализу влияния (нисходящему) для других узлов, которые появляются на графике, выбрав и Происхождение (новый базовый узел) или Анализ влияния. Выберите узел, чтобы назначить его базовым узлом.
Разверните или сверните
узлы, чтобы развернуть или свернуть группы объектов на том же уровне.
Пункт меню для анализа различных узлов

Сводное представление происхождения в приложении
Сводное представление происхождения в приложении может дать бизнес-пользователям общий обзор восходящих зависимостей в приложении. Для получения дополнительной информации см. Вид сводки происхождения в приложении.
Анализ происхождения для контента машинного обучения
Можно использовать график Происхождение для анализа происхождения контента машинного обучения, включая эксперименты МО, развертывания МО и наборы данных. Используйте график для целостного представления о том, как были созданы модели машинного обучения, на каких данных они обучались и для чего они используются в производственных сценариях.
Эксперименты, развертывания и наборы данных также отображаются как узлы при анализе другого контента на графике Происхождение, например нисходящих приложений.
Ресурсы машинного обучения также показаны в Анализе влияния для всестороннего анализа нисходящего контента. Для получения дополнительной информации см. Анализ влияния в Аналитика.
Открытие Происхождения для контента машинного обучения
Выполните одно из следующих действий:
-
В центре активности нажмите
рядом с экспериментом МО, развертыванием МО или набором данных и выберите Инструменты > Происхождение.
-
В эксперименте МО или развертывании МО нажмите
на панели навигации и выберите Происхождение.
Навигация по Происхождению для контента машинного обучения
Узлы машинного обучения исследуются так же, как и другой контент. Обзоры интерфейса см. в разделах:
Распознавание элементов машинного обучения на графике Происхождение
В следующей таблице описаны общие элементы, связанные с машинным обучением, которые появляются на графике Происхождение.
| Элемент | Значок(и) | Объяснение |
|---|---|---|
| Хранилище файлов |
|
Не уникально для контента машинного обучения. Показывает местоположение, где хранится набор данных (в большинстве случаев в пространстве). Актуально для набора данных для обучения, экспорта из встроенной аналитики в эксперименте, наборов данных применения, используемых для прогнозов, и наборов данных вывода прогнозов. |
| Набор данных | Много (например, |
Не уникально для контента машинного обучения. Используется для представления наборов данных для обучения, экспорта из встроенной аналитики в эксперименте, наборов данных применения и наборов данных вывода прогнозов. |
| Эксперимент МО |
|
Эксперимент МО, в котором обучаются модели. |
| Версия эксперимента МО |
|
Версия в рамках эксперимента МО, в которой была обучена одна или несколько моделей. |
| Модель МО |
|
Модель МО, обученная в рамках версии эксперимента. Используется для представления обученных моделей в эксперименте МО и развернутых моделей в развертывании МО. |
| Развертывание МО |
|
Развертывание МО, которое содержит одну или несколько развернутых моделей. |
| Нет значка | - | Узлы вывода прогнозов в рамках развертывания МО не имеют значков. Поля, включенные в набор данных вывода прогнозов, также не имеют значков. |
Происхождение и эксперименты МО
Эксперименты МО представлены в сгруппированном виде. Они разворачиваются следующим образом:
-
Эксперимент МО разворачивается в одну или несколько версий эксперимента.
-
Версия эксперимента разворачивается в одну или несколько моделей МО.
Когда модель, обученная в эксперименте, развертывается в развертывании МО, она появляется на графике происхождения, когда нисходящий контент (например, прогнозы или развертывания МО) выбран в качестве базового узла.
Происхождение и развертывания МО
Развертывания МО представлены в сгруппированном виде. Они разворачиваются следующим образом:
-
Развертывание МО разворачивается в одну или несколько развернутых моделей.
-
Если модель в развертывании использовалась в пакетных прогнозах, модель разворачивается, чтобы показать каждый вывод пакетного прогноза.
Происхождение на уровне полей доступно для наборов данных применения и наборов данных вывода прогнозов, которые относятся к развертыванию МО.
Развернутые модели, используемые для прогнозов, связаны обратно с экспериментом, в котором они были обучены.
Пример сценария
Пример сценария см. в разделе Пример: Исследование происхождения контента машинного обучения.
Ограничения
Диаграмма происхождения имеет следующие ограничения:
-
Приложения, которые не были перезагружены после выпуска происхождения в Qlik Cloud, могут не иметь полной информации о происхождении до тех пор, пока они не будут перезагружены. Сведения для некоторых узлов могут быть ограничены, если они не были загружены после включения происхождения для клиента.
-
Сведения об узлах для наборов данных за пределами клиента, таких как подключения SQL Server или Google Drive, ограничены типом набора данных и именем. Подключения REST отображают только то, что это данные REST.
-
Если элемент удален, он все равно может отображаться в Происхождении при анализе других узлов.
Разрешения
Необходимо иметь возможность просматривать элемент, чтобы просматривать его происхождение из центров активности. Если можно видеть график происхождения для базового узла, можно видеть основные сведения и метаданные для восходящих объектов происхождения.
Безопасность
-
Пользователь может переключиться только на базовый узел, к которому у него есть доступ; в противном случае контекстное меню недоступно.
-
Если у пользователя есть доступ к базовому узлу, у него будет доступ для просмотра всего восходящего происхождения.
Примеры вариантов использования для анализа происхождения
Пошаговое руководство по анализу происхождения см. в разделе Варианты использования происхождения на уровне полей.
Пример: Изучение того, откуда берется информация, с помощью сводного представления происхождения
Как потребитель аналитики, просматривающий линейчатую диаграмму в приложении cars-data4-app, вы хотели бы знать, откуда берется информация. Убедитесь, что для диаграммы включены параметры Показать сведения и Показать выражения в разделе Вид > Общие свойств, затем выберите переключение в режим анализа листа. Щелкните диаграмму правой кнопкой мыши или используйте меню и выберите Показать сведения, чтобы показать представление потребителя происхождения. Нажмите Показать зависимости.
Вы видите, что измерение Car_ID зависит от поля Car_ID, которое находится в трех перечисленных источниках CSV. Выберите меню в записи поля и выберите Происхождение - Car_ID / Cars, чтобы открыть график происхождения для поля Car_ID в приложении.
Выберите источник или поле, чтобы просмотреть происхождение для этого объекта

График происхождения просматривается справа налево и показывает, что поле Car_ID находится в таблице Cars, которая была загружена в приложение cars-data4-app. Разверните узлы, отслеживая историю поля до исходного файла, который был загружен в Qlik Cloud. Вы видите, что первый переход назад показывает, что CSV cars-data.csv, содержащий поле Car_ID, был загружен в приложение cars-data4-app. Следующий узел назад — это приложение cars-data3-app, из которого был сгенерирован cars-data.csv. Вернувшись еще на один переход назад и развернув узел, вы видите, что исходным файлом источника был файл CSV cars-data3.csv, и он содержал поле ID.
Разворачивая таблицы и просматривая поля, можно определить исходный файл источника, таблицу и поле измерения линейчатой диаграммы Car_id-ID.
Разверните узлы, чтобы отследить историю поля до исходного файла

Пример: Исследование происхождения набора данных и того, как он был создан
Как разработчик приложения, вы рассматриваете возможность использования существующего набора данных current_customers_analytics.xlsx для своего приложения. Вы исследуете происхождение этого набора данных, чтобы понять, откуда берутся данные. На плитке или в строке набора данных выберите Происхождение в меню , чтобы открыть график происхождения. На графике происхождения вы просматриваете метаданные для набора данных, выбрав меню
в XLSX current_customers_analytics.xlsx и Открыть обзор.
Открытие обзора набора данных из графика происхождения

Просмотр тегов, классификаций и других технических метаданных на вкладке обзора набора данных

Профиль данных доступен на вкладке Профиль

Нажмите стрелку назад в браузере, чтобы вернуться к графику происхождения для изучения графика происхождения для набора данных. Разверните узел current_customers_analytics.xlsx и нажмите Выбрать все, чтобы просмотреть доступные поля. Сделайте то же самое для всех узлов. Обратите внимание, что каждое поле предоставляет возможность сделать его базовым узлом в фокусе, выбрав Происхождение (новый базовый узел), или выбрать Анализ влияния для просмотра прямого происхождения и зависимых объектов, на которые повлияют изменения в наборе данных.
Развернутый график Происхождение для набора данных. Каждое поле в каждом узле будет иметь параметры для открытия приложения или данных, просмотра анализа влияния или изменения узла в фокусе

Следуя по происхождению в обратном направлении и разворачивая узлы, можно увидеть, что этот набор данных XLSX является выводом приложения Prep Current Customers Sales - Analytics. Вернувшись еще на один переход назад и развернув узел Хранилище файлов, вы видите, что в приложение для анализа продаж был загружен файл CSV: rgb_customers.csv. Анализ на уровне полей показывает, что поле Tags в исходном файле источника было переименовано в rgb_customers.Tags в приложении для анализа продаж. Исходный файл CSV можно открыть для обзора, чтобы показать ценные метаданные, такие как владелец, создатель, метрики использования, теги, классификации, профиль поля и анализ влияния.
Пример: Исследование происхождения контента машинного обучения
Обычный бизнес-пользователь или эксперт по машинному обучению может использовать график Происхождение для проверки происхождения определенных прогнозируемых значений. Если базовый узел установлен на набор данных прогноза, этот пользователь может видеть:
-
Данные для обучения, включая их источники и преобразования
-
Эксперимент, версию эксперимента и модель
-
Где была развернута модель и как она использовалась
График происхождения со всеми развернутыми узлами. График показывает сквозной поток от подготовки данных для обучения до набора данных прогноза.

На изображении выше показан следующий процесс:
-
Поток данных
загружает и преобразует данные из набора данных CSV
, хранящегося в личном пространстве
. Вывод сохраняется в набор данных Parquet
в том же пространстве.
-
Набор данных Parquet
используется в версии 1
эксперимента МО
. Эта версия эксперимента обучает модель МО
.
-
Модель МО
развертывается в развертывании МО
.
-
Используя набор данных CSV
в личном пространстве
в качестве набора данных применения, развертывание МО
генерирует набор данных прогноза в формате Parquet
.
Происхождение в Интеграция данных
График Происхождение также доступен в Интеграция данных. Для получения дополнительной информации см. Анализ происхождения в Интеграция данных.