Перейти к основному содержимому Перейти к дополнительному содержимому

Структура вида киоска данных

В этом разделе описываются внутренние столбцы заголовков (идентифицируются по префиксу hdr__) для видов киоска данных. Конвейеры данных часто достигают кульминации в киосках данных, что приводит к денормализации данных, которые преобразуются в схему типа «звезда». Факты представляют собой удобную структуру для использования аналитиками при моделировании с измерениями. Поэтому понимание роли столбцов заголовков позволяет создавать более сфокусированные отчеты для аналитики и для использования целевыми приложениями.

Вид фактов

Формат имени вида: <DATA_ASSET_SCHEMA>.[<PREFIX>]<FACT>

В структуру вида добавляются следующие столбцы заголовков.

Поля заголовков таблицы

Столбец

Тип

Описание

hdr__deleted Булево значение

Указывает, удалена ли запись из таблицы фактов.

hdr_{dimension-name}_key_id int64

Ссылка на измерения Type 1 и Type 2. Вид факта содержит отдельный столбец для каждого измерения в факте.

Пример:

hdr__EMPLOYEES_key_id

Вид измерения Type 1

Формат имени вида: <DATA_ASSET_SCHEMA>.[<PREFIX>]<DIMENSION>

В структуру вида добавляются следующие столбцы заголовков.

Поля заголовков таблицы

Столбец

Тип

Описание

hdr_{dimension-name}_key_id int64

Последовательность увеличивается на запись.

hdr__deleted Булево значение

Указывает, удалена ли запись из таблицы измерений.

Вид измерения Type 2

Формат имени вида: <INTERNAL_SCHEMA>.[<PREFIX>]<DIMENSION>

В структуру вида добавляются следующие столбцы заголовков.

Поля заголовков таблицы

Столбец

Тип

Описание

hdr_{dimension-name}_key_id

int64

Последовательность увеличивается на запись.

hdr__from_timestamp timestamp

Метка времени начала UTC для этой версии записи. Например, столбец может указывать дату, когда клиент переехал на новое место жительства.

Этот столбец позволяет выполнять следующее:

  • Анализ данных на основе исторической информации. Например, можно определить, в течение какого времени заказ находился в состоянии ожидания или как изменение адреса клиента влияет на продажи по сравнению с данными за прошлый год.
  • Анализ данных по дате, но с учетом имеющейся на данный момент информации. Напротив, описанный ниже столбец hdr__was_current_from_timestamp позволяет анализировать данные по определенной дате с учетом только той информации, которая имелась на тот момент.

Для измерения Type 2 с денормализованными объектами это метка времени из обновленного набора данных в ресурсе данных хранилища или преобразования.

hdr__to_timestamp timestamp

Метка времени окончания UTC для версии записи. Столбец используется для разграничения диапазонов дат для данной версии записи. Например, столбец может указывать дату, когда клиент переехал на новое место жительства.

См. также описание столбца hdr_from_timestamp выше.

hdr__operation varchar(1)

Операции полной загрузки:

  • L: Вставляется при полной загрузки

Операции обработки изменений (с использованием таблиц изменений):

  • D: Удалено
  • U: Обновлено
  • I: Вставлено

Действия в результате операций сравнения и применения:

  • d: Удалено
  • u: Обновлено
  • i: Вставлено
hdr__was_current_from_timestamp timestamp

Временная метка (UTC) последнего обновления, примененного к записи.

Этот столбец вместе с hdr__was_current_to_timestamp позволяет анализировать данные по определенной дате с учетом только той информации, которая имелась на тот момент. Например, ежедневно в 02:00 рассчитывается итог по заказам за предыдущий день. Таким образом, на 1 декабря итоговая сумма по заказам за предыдущий день составляет $1 000 000. Однако 2 декабря вставляется запись с информацией о том, что 30 ноября был размещен заказ на сумму $500 000. Таким образом, сумма заказов за 30 ноября на самом деле составила $1 500 000! Однако если создается отчет по итоговой сумме заказов за 30 ноября на основе данных по состоянию на 02:00 1 декабря, результат все равно будет $1 000 000.

hdr__was_current_to_timestamp timestamp

Этот столбец заполняется, когда существующая запись заменяется более новой. Он показывает метку времени (UTC) обработки записи, которая поэтому больше не является самой последней.

См. также описание столбца hdr__was_current_from_timestamp выше.

Помогла ли вам эта страница?

Если вы обнаружили какую-либо проблему на этой странице и с ее содержанием — будь то опечатка, пропущенный шаг или техническая ошибка, сообщите нам об этом, чтобы мы смогли ее исправить!