Анализ происхождения в Аналитика | Qlik Cloud Справка
Перейти к основному содержимому Перейти к дополнительному содержимому

Анализ происхождения в Аналитика

Происхождение отслеживает данные и преобразование данных в обратном направлении до первоначального источника. Qlik Cloud предоставляет подробное визуальное представление истории этого потока, где можно в интерактивном режиме изучить восходящее происхождение аналитического контента. Происхождение доступно для такого контента, как приложения, скрипты, потоки данных, рецепты таблиц, эксперименты машинного обучения, развертывания машинного обучения и наборы данных.

Примечание к информацииЧтобы просмотреть происхождение для аналитического контента, базовые данные должны храниться в Qlik Cloud как каталогизированный источник.

Бизнес-пользователи, изучающие заданное поле, имеют представление о происхождении для этого поля, которое обобщает его наиболее важные зависимости:

  • Поля, которые используются для его получения
  • Прямые ассоциации и зависимости, включая владельца и пространство
  • Первоначальный источник (первый известный источник)

Чтобы просмотреть нисходящие или перспективные зависимости, можно исследовать, на какие элементы повлияет изменение объекта, просмотрев Анализ влияния. См. Анализ влияния в Аналитика.

Для визуальной демонстрации того, как использовать происхождение, см.:

Использование происхождения

Примечание к информации

Чтобы использовать происхождение, также необходимо, чтобы для параметра Просмотр происхождения было установлено значение Разрешено с помощью User Default или пользовательской роли безопасности.

График происхождения

График Происхождение показывает поток данных через аналитический контент на интерактивной графической диаграмме. Ресурс, таблица или поле называются узлом на графике происхождения. Когда узел является базовым узлом, который исследуется, говорят, что он находится в фокусе, и он отображается как последний элемент на графике. На самом детальном уровне графики происхождения на уровне полей показывают источники данных и преобразования, из которых получен узел или от которых он зависит.

Графики происхождения полезны для:

  • Экспертов по данным, работающих с данными

  • Бизнес-специалистов, создающих приложения

  • Продвинутых бизнес-пользователей, использующих приложения

  • Пользователей, которые работают с моделями машинного обучения

Каждый узел представляет собой шаг в происхождении выбранного контента. Эта информация о происхождении компилируется всякий раз, когда аналитический ресурс обновляет свои данные. Если приложение, скрипт, поток данных или рецепт таблицы не обновлялись в последнее время, происхождение может быть неполным или неточным.

Происхождение доступно для поддерживаемых типов контента из плитки или строки в том виде, в котором они отображаются в каталоге. Можно проанализировать происхождение для следующего аналитического контента:

  • Набор данных: Наборы данных — это источники данных, такие как данные, загруженные из коннекторов или файлов данных. Наборы данных могут быть таблицами в базе данных, данными, которые загружаются в хранилище данных, или данными, которые генерируются из приложения, например файлом qvd. Наборы данных обычно имеют по одной таблице, но некоторые, например файлы Excel, могут иметь несколько таблиц.

    Наборы данных, которые были опубликованы из Talend Studio, обозначаются значком . Можно перейти к заданию Talend Management Console, которое использовалось для создания набора данных, нажав Открыть задание TMC в меню набора данных .... Для получения дополнительной информации см. Публикация наборов данных и происхождения в Qlik Cloud.

  • Приложение: Узлы приложений представляют собой аналитические приложения Qlik Sense, которые используют источники данных в происхождении. Узлы приложений отображают имя приложения и местоположение приложения как Qlik Sense.

  • Скрипт: Узлы скриптов представляют собой скрипты, созданные в интерфейсе Скрипт.

  • Поток данных: Потоки данных можно проверять для лучшего понимания источников данных, которые они используют и преобразуют.

  • Рецепт таблицы: Рецепты таблиц можно проверять для лучшего понимания источника данных, который они используют и преобразуют.

  • Эксперимент МО: Можно понять происхождение эксперимента машинного обучения, которое состоит из источников данных, объединенных для создания данных для обучения моделей машинного обучения.

  • Развертывание МО: Можно понять происхождение развертывания МО и то, как оно используется в прогнозах. Происхождение для развертываний МО обычно состоит из экспериментов МО, версий экспериментов, моделей и наборов данных.

Типичные входные узлы включают источники данных, которые используются базовым узлом, или приложения, которые создают наборы данных. Происхождение на уровне полей позволяет детально исследовать, как были вычислены поля и их конкретное происхождение в преобразованиях и приложениях.

Узлы, доступные на графике происхождения, являются входными данными для выбранного контента. Выберите элемент, чтобы назначить его базовым узлом. Входные узлы — это узлы, которые находятся выше базового узла.

График происхождения на уровне полей

График происхождения на уровне полей

Узлы, доступные на графике происхождения, являются входными данными для выбранного базового узла, другими словами, узла в фокусе. Базовый узел — это единственный узел, для которого требуется получить происхождение; например, это может быть приложение, поток данных, эксперимент МО, набор данных, файл, таблица или поле.

Он будет самым правым узлом на экране и обведен синим цветом. Он находится в центре внимания исследования, и будут представлены только входные данные для этого базового узла.

Во время изучения происхождения можно в интерактивном режиме изменить базовый узел на другую таблицу, приложение, поле или другой элемент на экране, чтобы сфокусировать исследование.

Базовый узел происхождения

Узел в фокусе, также называемый базовым узлом, будет находиться в правой части экрана

Линии, соединяющие узлы, являются ребрами. Ребра представляют собой отношение одного узла к другому узлу. Они представляют собой отношения, указывающие на ассоциации, такие как набор данных, который используется приложением. Они также могут представлять данные, которые производятся как побочный продукт приложения. Совокупность узлов и ребер вместе образует график происхождения.

Ребра происхождения представляют отношения

Ребра представляют отношения между объектами

Узлы сворачиваются или разворачиваются, чтобы показать уровни иерархии от грубой до более мелкой детализации, начиная с группы наборов данных более высокого уровня или приложения и заканчивая самым детальным уровнем, которым является уровень полей.

На этом изображении узла показаны следующие уровни иерархии, от самого высокого (самого грубого) до самого низкого (самого детального): Ресурс данных (приложение), ресурс (набор данных), таблица и поля.

Узел с уровнями ресурса, ресурса, таблицы и поля

Открытие графика происхождения

  1. Откройте центр активности Наблюдения или Аналитика.

  2. Выберите ИнструментыПроисхождение в контекстном меню Дополнительно элемента, который поддерживает происхождение.

Также можно получить доступ к графику происхождения некоторого контента, когда открыт элемент. Нажмите Дополнительно и Происхождение.

Сведения об узле

Сведения ограничены доступом к этому объекту. Сведения могут предоставлять следующую информацию:

  • Имя

  • Описание

  • Теги

  • Местоположение

  • Пространство

  • Владелец

  • Создатель

  • Последнее изменение

Навигация по графику происхождения

Нажмите и перетащите график, чтобы перемещаться и центрировать график происхождения. Также можно использовать кнопки навигации. Выберите «Домой» Домой, чтобы центрировать график происхождения на базовом узле. Нажимайте «Назад» и «Вперед», чтобы перемещаться по выборкам.

Навигация по графику происхождения

Кнопки навигации для графика происхождения.

График Происхождение показывает восходящие зависимости для аналитического контента, который представлен как узел по умолчанию при открытии графика для него. Можно получить доступ к происхождению (восходящему) или анализу влияния (нисходящему) для других узлов, которые появляются на графике, выбрав Дополнительно и Происхождение (новый базовый узел) или Анализ влияния. Выберите узел, чтобы назначить его базовым узлом.

Разверните Стрелка вниз или сверните Стрелка вверх узлы, чтобы развернуть или свернуть группы объектов на том же уровне.

Пункт меню для анализа различных узлов

Пункт меню для анализа различных узлов

Сводное представление происхождения в приложении

Сводное представление происхождения в приложении может дать бизнес-пользователям общий обзор восходящих зависимостей в приложении. Для получения дополнительной информации см. Вид сводки происхождения в приложении.

Анализ происхождения для контента машинного обучения

Можно использовать график Происхождение для анализа происхождения контента машинного обучения, включая эксперименты МО, развертывания МО и наборы данных. Используйте график для целостного представления о том, как были созданы модели машинного обучения, на каких данных они обучались и для чего они используются в производственных сценариях.

Эксперименты, развертывания и наборы данных также отображаются как узлы при анализе другого контента на графике Происхождение, например нисходящих приложений.

Ресурсы машинного обучения также показаны в Анализе влияния для всестороннего анализа нисходящего контента. Для получения дополнительной информации см. Анализ влияния в Аналитика.

Открытие Происхождения для контента машинного обучения

  • В центре активности нажмите Дополнительно рядом с экспериментом МО, развертыванием МО или набором данных и выберите ИнструментыПроисхождение.

  • В эксперименте МО или развертывании МО нажмите Дополнительно на панели навигации и выберите Происхождение.

Навигация по Происхождению для контента машинного обучения

Узлы машинного обучения исследуются так же, как и другой контент. Обзоры интерфейса см. в разделах:

Распознавание элементов машинного обучения на графике Происхождение

В следующей таблице описаны общие элементы, связанные с машинным обучением, которые появляются на графике Происхождение.

Общие элементы происхождения для машинного обучения
Элемент Значок(и) Объяснение
Хранилище файлов Папка

Не уникально для контента машинного обучения. Показывает местоположение, где хранится набор данных (в большинстве случаев в пространстве). Актуально для набора данных для обучения, экспорта из встроенной аналитики в эксперименте, наборов данных применения, используемых для прогнозов, и наборов данных вывода прогнозов.

Набор данных Много (например, Тип файла QVD для QVD) Не уникально для контента машинного обучения. Используется для представления наборов данных для обучения, экспорта из встроенной аналитики в эксперименте, наборов данных применения и наборов данных вывода прогнозов.
Эксперимент МО Эксперимент МО Эксперимент МО, в котором обучаются модели.
Версия эксперимента МО Ветвление Версия в рамках эксперимента МО, в которой была обучена одна или несколько моделей.
Модель МО Модель МО Модель МО, обученная в рамках версии эксперимента. Используется для представления обученных моделей в эксперименте МО и развернутых моделей в развертывании МО.
Развертывание МО Развертывание МО Развертывание МО, которое содержит одну или несколько развернутых моделей.
Нет значка - Узлы вывода прогнозов в рамках развертывания МО не имеют значков. Поля, включенные в набор данных вывода прогнозов, также не имеют значков.

Происхождение и эксперименты МО

Эксперименты МО представлены в сгруппированном виде. Они разворачиваются следующим образом:

  • Эксперимент МО разворачивается в одну или несколько версий эксперимента.

  • Версия эксперимента разворачивается в одну или несколько моделей МО.

Когда модель, обученная в эксперименте, развертывается в развертывании МО, она появляется на графике происхождения, когда нисходящий контент (например, прогнозы или развертывания МО) выбран в качестве базового узла.

Происхождение и развертывания МО

Развертывания МО представлены в сгруппированном виде. Они разворачиваются следующим образом:

  • Развертывание МО разворачивается в одну или несколько развернутых моделей.

  • Если модель в развертывании использовалась в пакетных прогнозах, модель разворачивается, чтобы показать каждый вывод пакетного прогноза.

Происхождение на уровне полей доступно для наборов данных применения и наборов данных вывода прогнозов, которые относятся к развертыванию МО.

Развернутые модели, используемые для прогнозов, связаны обратно с экспериментом, в котором они были обучены.

Пример сценария

Пример сценария см. в разделе Пример: Исследование происхождения контента машинного обучения.

Ограничения

Диаграмма происхождения имеет следующие ограничения:

  • Приложения, которые не были перезагружены после выпуска происхождения в Qlik Cloud, могут не иметь полной информации о происхождении до тех пор, пока они не будут перезагружены. Сведения для некоторых узлов могут быть ограничены, если они не были загружены после включения происхождения для клиента.

  • Сведения об узлах для наборов данных за пределами клиента, таких как подключения SQL Server или Google Drive, ограничены типом набора данных и именем. Подключения REST отображают только то, что это данные REST.

  • Если элемент удален, он все равно может отображаться в Происхождении при анализе других узлов.

Разрешения

Необходимо иметь возможность просматривать элемент, чтобы просматривать его происхождение из центров активности. Если можно видеть график происхождения для базового узла, можно видеть основные сведения и метаданные для восходящих объектов происхождения.

Безопасность

  • Пользователь может переключиться только на базовый узел, к которому у него есть доступ; в противном случае контекстное меню недоступно.

  • Если у пользователя есть доступ к базовому узлу, у него будет доступ для просмотра всего восходящего происхождения.

Примеры вариантов использования для анализа происхождения

Пошаговое руководство по анализу происхождения см. в разделе Варианты использования происхождения на уровне полей.

Пример: Изучение того, откуда берется информация, с помощью сводного представления происхождения

Как потребитель аналитики, просматривающий линейчатую диаграмму в приложении cars-data4-app, вы хотели бы знать, откуда берется информация. Убедитесь, что для диаграммы включены параметры Показать сведения и Показать выражения в разделе Вид > Общие свойств, затем выберите переключение в режим анализа листа. Щелкните диаграмму правой кнопкой мыши или используйте меню значок дополнительных действий и выберите Показать сведения, чтобы показать представление потребителя происхождения. Нажмите Показать зависимости.

Вы видите, что измерение Car_ID зависит от поля Car_ID, которое находится в трех перечисленных источниках CSV. Выберите меню значок дополнительных действий в записи поля и выберите Происхождение - Car_ID / Cars, чтобы открыть график происхождения для поля Car_ID в приложении.

Выберите источник или поле, чтобы просмотреть происхождение для этого объекта

Выберите меню, а затем параметр для просмотра происхождения для источника в сводном представлении происхождения потребителя

График происхождения просматривается справа налево и показывает, что поле Car_ID находится в таблице Cars, которая была загружена в приложение cars-data4-app. Разверните Стрелка вниз узлы, отслеживая историю поля до исходного файла, который был загружен в Qlik Cloud. Вы видите, что первый переход назад показывает, что CSV cars-data.csv, содержащий поле Car_ID, был загружен в приложение cars-data4-app. Следующий узел назад — это приложение cars-data3-app, из которого был сгенерирован cars-data.csv. Вернувшись еще на один переход назад и развернув узел, вы видите, что исходным файлом источника был файл CSV cars-data3.csv, и он содержал поле ID.

Разворачивая таблицы и просматривая поля, можно определить исходный файл источника, таблицу и поле измерения линейчатой диаграммы Car_id-ID.

Разверните узлы, чтобы отследить историю поля до исходного файла

Начните с узла в фокусе и отследите историю происхождения до первоначального источника

Пример: Исследование происхождения набора данных и того, как он был создан

Как разработчик приложения, вы рассматриваете возможность использования существующего набора данных current_customers_analytics.xlsx для своего приложения. Вы исследуете происхождение этого набора данных, чтобы понять, откуда берутся данные. На плитке или в строке набора данных выберите Происхождение в меню Дополнительно, чтобы открыть график происхождения. На графике происхождения вы просматриваете метаданные для набора данных, выбрав меню значок дополнительных действий в XLSX current_customers_analytics.xlsx и Открыть обзор.

Открытие обзора набора данных из графика происхождения

Обзор набора данных можно открыть из графика происхождения

Просмотр тегов, классификаций и других технических метаданных на вкладке обзора набора данных

Доступ к обзорам наборов данных можно получить из графика происхождения

Профиль данных доступен на вкладке Профиль

Вкладка профиля полей доступна из графика происхождения

Нажмите стрелку назад в браузере, чтобы вернуться к графику происхождения для изучения графика происхождения для набора данных. Разверните Стрелка вниз узел current_customers_analytics.xlsx и нажмите Выбрать все, чтобы просмотреть доступные поля. Сделайте то же самое для всех узлов. Обратите внимание, что каждое поле предоставляет возможность сделать его базовым узлом в фокусе, выбрав Происхождение (новый базовый узел), или выбрать Анализ влияния для просмотра прямого происхождения и зависимых объектов, на которые повлияют изменения в наборе данных.

Развернутый график Происхождение для набора данных. Каждое поле в каждом узле будет иметь параметры для открытия приложения или данных, просмотра анализа влияния или изменения узла в фокусе

Просмотр происхождения для набора данных

Следуя по происхождению в обратном направлении и разворачивая узлы, можно увидеть, что этот набор данных XLSX является выводом приложения Prep Current Customers Sales - Analytics. Вернувшись еще на один переход назад и развернув узел Хранилище файлов, вы видите, что в приложение для анализа продаж был загружен файл CSV: rgb_customers.csv. Анализ на уровне полей показывает, что поле Tags в исходном файле источника было переименовано в rgb_customers.Tags в приложении для анализа продаж. Исходный файл CSV можно открыть для обзора, чтобы показать ценные метаданные, такие как владелец, создатель, метрики использования, теги, классификации, профиль поля и анализ влияния.

Пример: Исследование происхождения контента машинного обучения

Обычный бизнес-пользователь или эксперт по машинному обучению может использовать график Происхождение для проверки происхождения определенных прогнозируемых значений. Если базовый узел установлен на набор данных прогноза, этот пользователь может видеть:

  • Данные для обучения, включая их источники и преобразования

  • Эксперимент, версию эксперимента и модель

  • Где была развернута модель и как она использовалась

График происхождения со всеми развернутыми узлами. График показывает сквозной поток от подготовки данных для обучения до набора данных прогноза.

График происхождения, показывающий сквозной поток от подготовки данных для обучения до набора данных прогноза

На изображении выше показан следующий процесс:

  1. Поток данных Поток данных загружает и преобразует данные из набора данных CSV Тип файла Parquet, хранящегося в личном пространстве Папка. Вывод сохраняется в набор данных Parquet Тип файла Parquet в том же пространстве.

  2. Набор данных Parquet Тип файла Parquet используется в версии 1 Ветвление эксперимента МО Эксперимент МО. Эта версия эксперимента обучает модель МО Модель МО.

  3. Модель МО Модель МО развертывается в развертывании МО Развертывание МО.

  4. Используя набор данных CSV Тип файла Parquet в личном пространстве Папка в качестве набора данных применения, развертывание МО Развертывание МО генерирует набор данных прогноза в формате Parquet Тип файла Parquet.

Происхождение в Интеграция данных

График Происхождение также доступен в Интеграция данных. Для получения дополнительной информации см. Анализ происхождения в Интеграция данных.

Помогла ли вам эта страница?

Если вы обнаружили какую-либо проблему на этой странице или с ее содержанием — будь то опечатка, пропущенный шаг или техническая ошибка, сообщите нам об этом!