Перейти к основному содержимому Перейти к дополнительному содержимому

Данные для анализа

Метрика «Данные для анализа» показывает, сколько ресурсов использовано. В этом разделе объясняется, как подсчитывается использование данных и что не учитывается при подсчете. Кроме того, описывается, как рассчитывается использование. Понимание этих деталей поможет разобраться, как расходуются ресурсы Qlik Cloud, и оптимизировать управление данными.

Данные, которые включены в метрику

Метрика «Данные для анализа» измеряет общий объем данных, загруженных и хранящихся в вашей среде.

Учитываемые данные

Метрика включает:

  • Данные, загруженные в Qlik Cloud из внешних источников

    • Перезагрузки увеличивают объем данных, если добавляются новые инкрементные данные. Если перезагрузка содержит меньше данных, чем раньше, количество данных соответственно уменьшается.

    • Данные, загружаемые в несколько клиентов, учитываются отдельно для каждого клиента.

    • Данные, загружаемые один раз и используемые в нескольких приложениях, но в пределах одного клиента, учитываются только один раз.

  • Файлы данных, загружаемые или создаваемые в Qlik Cloud

    • Учитывается размер загруженных или созданных файлов.

    • Копирование файла данных в Qlik Cloud добавляет в метрику новый файл.

    • Дублирование приложения в общем пространстве без перезагрузки не увеличивает объем данных.

Как рассчитывается метрика

Метрика «Данные для анализа» рассчитывается следующим образом:

  • Объем внешних данных, введенных в Qlik Cloud через приложение Qlik Sense.

  • Размер полученного файла QVD из внешних данных, загружаемых в Qlik Cloud через Шлюз данных Qlik — движение данных.

  • Размер файлов данных, загруженных в Qlik Cloud.

  • Размер файла приложения, выгружаемого в виде QVF, измеряется как объем, занимаемый в ОЗУ приложением.

Данные не учитываются

В метрике не учитываются:

  • Приложения и данные в личном пространстве пользователя. Сюда входят любые приложения или данные, загруженные из любого источника или сгенерированные в личном пространстве с использованием механизма генерации приложений по запросу (ODAG).

    • Метрика зависит от местоположения приложения, а не местоположения подключения к данным: приложения в личных пространствах не учитываются, даже если они используют подключение в общем пространстве; приложения в общих пространствах всегда учитываются.

  • Приложения, которые загружают двоичными данными другое приложение, хранящееся в Qlik Cloud. Исходное приложение уже учтено, поэтому загружаемое приложение не добавляется к метрике.

  • Приложения, которые загружают данные только из файлов, хранящихся в Qlik Cloud (например, QVD). Исходные файлы учитываются отдельно.

  • Приложения и данные, опубликованные в управляемых пространствах. Учитываются перезагрузки приложений в управляемых пространствах.

  • Данные, загружаемые через Direct Query.

Подписка на объем «Данные для анализа»

Вы подписываетесь на пакеты данных в зависимости от потребностей в анализе данных.

Помимо объема, выделяемому по подписке, каждый пользователь получает определенный объем в своем личном пространстве. Этот объем не учитывается в метрике «Данные для анализа».

Версия Qlik Cloud Analytics Starter имеет фиксированный объем данных; стоимость подписки зависит от числа пользователей.

Перемещение данных в Qlik Cloud

Доступны следующие варианты перемещения данных:

  • Прямые подключения к данным из Qlik Sense

  • Шлюз данных Qlik — прямой доступ

  • Перемещение данных в Qlik Cloud с помощью Qlik Talend Data Integration

    Версии Qlik Cloud Analytics Premium и Enterprise позволяют перемещать данные в Qlik Cloud из любого источника. Версия Standard позволяет перемещать данные из любого источника, кроме SAP, мейнфреймов и устаревших источников.

Расчет объема «Данные для анализа»

Понимание того, как рассчитывается объем данных в метрике «Данные для анализа», поможет более эффективно использовать имеющиеся ресурсы. В этом разделе объясняется, как выполняются измерения месячных пиков, загрузок данных, перезагрузок приложений и создания данных.

Месячные и дневные пики

При покупке подписки «Данные для анализа» использованный объем измеряется в сравнении с приобретенным объемом. Ежедневно система регистрирует использованный объем; день с самым высоким использованием в течение месяца становится месячным пиком (контрольная отметка). Например, если было куплено 250 ГБ и месячный пик превысил это значение, может взиматься дополнительная плата.

Как отслеживается ежедневное использование

Использование отслеживается ежедневно. Каждый день система рассчитывает дневной пик как сумму, которая складывается из следующих компонентов:

  • Общий размер хранящихся файлов

  • Объем данных, поступающих во время перезагрузки приложения

  • Количество производных или созданных данных

В использование включаются приложения, которые были загружены ранее, но не перезагружались. Система переносит их данные с последней перезагрузки до тех пор, пока не произойдет новая перезагрузка или приложение не будет удалено.

Перенос остатков

Если приложение не перезагружается в течение дня, система сохраняет данные, полученные после последней успешной перезагрузки. Данные приложения учитываются при расчете дневного пика до тех пор, пока не будет произведена новая перезагрузка: при новой перезагрузке обновляется учитываемое использование.

В начале нового месяца месячный пик сбрасывается. Однако дневной пик на первый день нового месяца может принимать значение, перенесенное с последней перезагрузки в предшествующем месяце. Это может привести к тому, что зарегистрированное использование будет выше, чем данные, отображаемые в приложении.

Пример:

  • День 1: клиент хранит 70 ГБ в файлах данных и загружает 40 ГБ через перезагрузку приложения. Ежедневный пик составляет 110 ГБ.

  • День 2: клиент хранит 70 ГБ в файлах данных, перезагрузка не происходит (загружено 0 ГБ). Ежедневный пик по-прежнему составляет 110 ГБ, потому что ранее загруженные 40 ГБ переносятся. Только новая перезагрузка, которая загружает менее 40 ГБ, уменьшит это значение.

Месячный пик и контрольная отметка

Месячный пик — это самая большая величина в день, зарегистрированная в течение месяца. Она служит в качестве контрольной отметки и показывает день, когда суммарное использование данных было максимальным. Месячный пик сравнивается с приобретенным объемом, чтобы определить, есть ли перерасход и связанные с ним дополнительные расходы.

Пример. Определение месячного пика на основе ежедневного использования

Чтобы продемонстрировать, как определяется месячный пик, в этом примере используется упрощенный сценарий, включающих только четыре дня, при условии, что изначально было приобретено 250 ГБ. Величины использования помогают проиллюстрировать, как наибольший ежедневный пик становится месячным пиком.

В таблице представлены данные за четыре дня с разбивкой по типам:

День Сохранено Перезагрузка Создано Дневной пик
1 50 ГБ 30 ГБ 15 ГБ 95 ГБ
2 70 ГБ 40 ГБ 30 ГБ 140 ГБ
3 60 ГБ 0 ГБ 20 ГБ 120 ГБ
4 80 ГБ 50 ГБ 40 ГБ 170 ГБ

Объяснение данных в таблице:

  • В день 3 не было перезагрузки данных. Часть перезагрузки со второго дня (40 ГБ) переносится на следующий день и вносит свой вклад в дневной пик (120 ГБ).

  • На 4-й день приходится самый высокий дневной пик (170 ГБ), который становится месячным пиком.

Поскольку месячный пик не превышает 250 ГБ, дополнительных расходов не будет. Если в какой-то день объем использования превысит 250 ГБ, может возникнуть плата за превышение или потребуется увеличение объема.

Дневное использование в течение четырех дней, показывающее сохраненные, введенные и созданные данные. Зеленая линия соответствует приобретенному объему.

Линейчатая диаграмма, показывающая использование данных в течение четырех дней

Загрузка данных в Qlik Cloud

Данные, загруженные в Qlik Cloud из внешних источников, также учитываются при расчете дневного пика.

  • Если один и тот же набор данных загружается в несколько независимых приложений, учитываются загрузки во все приложения.

  • Данные, загруженные один раз в клиент, могут многократно использоваться несколькими приложениями в пределах клиента; в этом случае эти данные учитываются только один раз. Чтобы не учитывать одни и те же данные несколько раз, рекомендуется один раз загрузить их в файл QVD и читать данные в разных приложениях из файла QVD.

  • Данные, загружаемые в несколько клиентов, учитываются отдельно для каждого клиента.

Как данные влияют на дневной пик:

  • Данные, загружаемые приложениями через файлы: по размеру файла.

  • Перезагрузки приложений с использованием запросов или коннекторов: учитывается максимальное количество байтов, введенных из источника данных. Если в один и тот же день происходит несколько перезагрузок, при расчете дневного пика учитывается только самая большая перезагрузка.

    Пример: Приложение перезагружается три раза в день с 0,75 ГБ, 1,25 ГБ и 1 ГБ. Дневной пик равен 1,25 ГБ.

    Примечание к информацииПосле того как перезагрузка учтена, она остается частью дневного пика, даже если приложение будет удалено в тот же день. Максимальный объем введенных данных в байтах будет учитываться, пока приложение существует в клиенте.
  • Данные, загружаемые в Qlik Cloud через Шлюз данных Qlik — движение данных, измеряются по размеру итогового файла QVD.

  • Приложения, отправляемые или загружаемые посредством импорта файлов (в центре активности Аналитика или с помощью qlik-cli), измеряются по статическому размеру приложения в байтах.

  • Выгруженные файлы QVD измеряются по размеру файла.

Данные можно загрузить в Qlik Cloud разными способами: посредством приложений, перемещением данных или импортом через центр активности Аналитика или qlik-cli.

Иллюстрация разных способов загрузки данных в Qlik Cloud.

В следующих ситуациях данные не включаются в расчет дневного пика:

  • Данные, загруженные в личное пространство пользователя, не засчитываются, если их использование ограничено только этим пространством. Если пользователь перемещает данные в общее пространство для совместной работы с другими пользователями, то объем таких данных будет засчитываться.

  • Если перезагрузка завершается ошибкой, введенные байты не засчитываются. Однако итоговые файлы QVD засчитываются.

  • Когда загружается приложение с данными, которые уже находятся в Qlik Cloud, такая загрузка данных не засчитывается. Например, скопированные или двоичные загруженные приложения (загрузка данных из другого приложения Qlik Sense), не влияют на дневной пик, если не выполняется их перезагрузка из внешнего источника.

Перезагрузки приложений из внутренних источников не влияют на дневной пик.

Иллюстрация перезагрузок приложений, которые не учитываются при расчете дневного пика.

Измерение байтов, введенных для перезагрузок приложений

Следующее применяется, когда приложение Qlik Sense перезагружается из внешнего источника:

  • Приложение может перезагружаться несколько раз из одного и того же исходного набора данных, не увеличивая дневной пик, если объем данных остается неизменным.

  • Если размер исходного набора данных увеличивается, дневной пик тоже меняется. Каждый дополнительный гигабайт данных, добавляемый в набор данных, приводит к равнозначному увеличению объема данных, вводимых при перезагрузке.

  • И наоборот, если размер исходного набора данных уменьшается, это также отражается в размере дневного пика.

    Пример: Если размер набора данных уменьшается на 0,25 ГБ, размер перезагрузки уменьшается на такой же объем. Однако, если раньше в этот же день была перезагрузка размером 1 ГБ, пик за этот день составит 1 ГБ. Уменьшение будет отражено только в пике на следующий день.

  • Изменения содержимого в исходном наборе данных, не приводящие к изменению его размера, не влияют на дневной пик. Дневной пик зависит только от объема данных.

Измерение введенных байтов, если меняется размер или содержимое исходного набора данных.

Иллюстрация перезагрузок приложений из наборов данных разного размера.
  • Если один и тот же набор данных запрашивается несколько раз в одном скрипте загрузки, каждый запрос учитывается отдельно. Общий объем данных является суммой всех запросов.

    Пример: Если есть скрипт загрузки, который включает три запроса по 1 ГБ каждый из одного и того же набора данных, все три запроса учитываются по отдельности. Поэтому общий объем данных, учитываемый при расчете дневного пика, составляет 3 ГБ.

  • Загрузка приложения и последующее исключение таблицы не приводят к уменьшению дневного пика, так как он рассчитывается с учетом максимального размера перезагрузки приложения за день.

  • Если загрузить приложение и удалить его в тот же день, оно все равно будет учитываться при расчете пика за этот день. Приложение уже не будет существовать на следующий день и поэтому не будет влиять на дневной пик.

Измерение байтов, введенных для различных сценариев перезагрузки приложения

Иллюстрация различных сценариев перезагрузки.

Измерение данных, загруженных в файлы QVD с помощью Qlik Talend Data Integration

Следующее применяется, когда данные загружаются в файл QVD из внешнего источника с помощью Шлюз данных Qlik — движение данных:

  • Можно загружать, импортировать или создавать набор данных несколько раз — это не будет влиять на дневной пик, если объем данных остается неизменным.

  • Если размер исходного набора данных увеличивается, дневной пик тоже меняется. Каждый дополнительный гигабайт данных, добавляемый в набор данных, приводит к соответствующему увеличению размера итогового файла QVD.

  • Если размер файла QVD меняется в течение дня, учитывается наибольший размер. Ежедневный пик всегда соответствует наибольшему размеру, зарегистрированному в этот день.

  • Если размер исходного набора данных уменьшается, это также повлияет на размер дневного пика.

    Пример: Уменьшение набора данных на 0,25 ГБ уменьшает размер файла QVD на ту же величину.

  • Изменения содержимого в наборе данных, не приводящие к изменению его размера, не влияют на дневной пик. Дневной пик зависит только от объема данных.

Измерение размера файла QVD, когда меняется размер или содержимое исходного набора данных.

Иллюстрация загрузок QVD из наборов данных разного размера.

Загрузка приложений из внешних и внутренних источников

Как данные, загружаемые в приложения, влияют на ежедневный пик, зависит от источника. Следующие примеры показывают, какой вклад вносят различные типы данных.

  • Приложение загружается из внешнего источника

    Если данные загружаются из внешнего источника, учитывается объем загружаемых данных в байтах.

    Пример: Если загружено 10 ГБ, приложение добавляет 10 ГБ в дневной пик.

  • Приложение загружается из файла QVD, хранящегося в Qlik Cloud

    Загрузка данных из файла QVD, хранящегося в Qlik Cloud, не считается вводом данных извне для приложения.

    Пример: При загрузке в приложение 10 ГБ из файла QVD учитывается 0 ГБ. 10 ГБ файла QVD учитывается отдельно.

  • Новый файл QVD создается из QVD, хранящегося в Qlik Cloud

    Если приложение-генератор QVD загружает данные из существующего QVD, находящегося в Qlik Cloud, учитывается 0 ГБ. Учитывается итоговый файл QVD.

    Пример: Если QVD размером 10 ГБ преобразуется в новый QVD размером 5 ГБ, общий вклад в ежедневный пик составляет 15 ГБ.

  • Приложение загружается как из внешнего, так из внутреннего источника.

    Если приложение загружает 10 ГБ из внешнего источника и 5 ГБ из QVD в Qlik Cloud, для этого приложения учитывается только 10 ГБ, поступивших извне. 5 ГБ файла QVD учитываются отдельно, поэтому общий вклад в ежедневный пик составляет 15 ГБ.

Измерение общего объема файлов данных и данных, поступающих в результате загрузки из внутренних и внешних источников.

Иллюстрация примеров расчета общего объема загруженных данных.

Создание данных в Qlik Cloud

Любые новые данные в Qlik Cloud — полученные путем копирования файлов данных или в результате объединения и обработки существующих данных — учитываются при расчете дневного пика. Учитывается общий объем файлов, сгенерированных в процессе создания данных. Созданные данные регистрируются только один раз независимо от того, сколько приложений их используют.

Примеры:

  • Создание файла QVD размером 1 ГБ с использованием оператора STORE, прибавляет 1 ГБ к дневному пику.

  • Копирование файла QVD размером 1 ГБ добавляет 1 ГБ к дневному пику, при этом учитываются обе копии.

  • Создание файла QVD размером 0,5 ГБ путем преобразования, прибавляет 0,5 ГБ к дневному пику. Засчитывается только итоговый файл QVD; приложение, генерирующее QVD, не засчитывается, так как оно загружает данные, которые уже находятся в Qlik Cloud.

Измерение файлов данных, созданных в Qlik Cloud.

Иллюстрация примеров расчета общего объема созданных данных.

Рекомендации по управлению данными

Эффективно управляя данными, вы сможете лучше использовать ресурсы, предоставляемые в версии «Данные для анализа». Ниже приводятся рекомендации по оптимизации загрузки данных, сокращению ненужного хранения и управлению устаревшим или неактивным содержимым в Qlik Cloud.

Создание файлов QVD для повторного использования данных

Используйте файлы QVD, если данные используются несколькими приложениями. Загрузите внешние данные один раз и сохраните их в формате QVD, чтобы уменьшить число загрузок данных и ежедневный пиковый объем. Если одни и те же данные используются многократно, использование файлов QVD через Шлюз данных Qlik — движение данных более эффективно, чем перезагрузка данных непосредственно через приложения.

Пример:

Если загрузить 10 ГБ внешних данных один раз и сохранить их в файле QVD размером 5 ГБ, общий объем данных, учитываемый при расчете пикового объема, составляет 15 ГБ. Приложения, которые загружают QVD 5 ГБ, повторно не принимают данные из исходных 10 ГБ. Если те же 10 ГБ внешних данных загружать прямо в два приложения, ввод данных происходит дважды и учитываться будет 20 ГБ.

Более эффективно создать файл QVD и загружать данные в несколько приложений через этот файл, чем загружать внешние данные непосредственно в несколько приложений.

Иллюстрация, демонстрирующая общее количество данных при использовании файла QVD для загрузки приложений и при загрузке непосредственно в приложения.

Использование эффективных методов загрузки данных

Применяйте фильтрацию и преобразования на источнике данных (SQL pushdown), чтобы уменьшить объем передаваемых данных во время перезагрузок.

Пример:

Select * from my-external-database-table where my_column = 10

В этом запросе фильтр применяется к данным в источнике, поэтому передается только подмножество данных.

Примечание к информацииЕсли загрузка происходит из файлов QVD, Excel или CSV, фильтры применяются уже после считывания файла из источника, и в этом случае учитывается полный размер файла.

Использование приложений по запросу для больших наборов данных

Генерация приложений по запросу (ODAG) позволяет работать с большими наборами данных; в этом случае сначала загружаются агрегированные данные, и более точные подмножества извлекаются только при необходимости.

Для получения дополнительной информации см. раздел Приложения On-demand.

Управление большими наборами данных с помощью Direct Query и динамических представлений

Direct Query и динамические представления позволяют запрашивать большие наборы данных по требованию, не загружая все данные в память. Запрашивая только необходимые данные, можно уменьшить объем вводимых данных и оптимизировать расход ресурсов в пределах подписки.

Для получения дополнительной информации см.:

Управление старыми или неиспользуемыми приложениями

Приложения в клиенте расходуют объем Data for Analysis в зависимости от последней успешной перезагрузки. Приложение с загруженными данными будет учитываться в отчетах об использованном объеме.

Чтобы избежать ненужного использования:

Сократите или удалите ненужные данные

Удалите данные из приложений, если в приложении не нужны полные наборы данных, или создавайте приложения без данных, если достаточно только структуры. Перезагрузка приложения с меньшим набором данных позволяет обновить метрику использования.

Избегайте ненужного дублирования

Копируйте приложения только при необходимости. Каждая копия рассматривается как отдельное приложение и влияет на использование ресурсов.

Используйте общие пространства только целенаправленно

Общие пространства в некоторых случаях позволяют контролировать, где и как происходят перезагрузки.

Удалите приложения, которые больше не нужны

Регулярно выполняйте очистку, чтобы не добавлять в объем устаревшие ресурсы.

  • Определите неиспользуемые объекты в каталоге, отметив их как Последнее обновление, Просмотренои Используется в.

  • Используйте анализ влияния и происхождения, чтобы понять, где используются файлы данных.

  • Удаляйте приложения и файлы данных через центры активности. Администраторы также могут удалять приложения из раздела «Администрирование».

Для получения дополнительной информации см.:

Сокращение потребления, связанного с перезагрузкой

В отчете учитывается меньший размер перезагрузки приложения только в том случае, если перезагрузка приводит к уменьшению набора данных. Чтобы уменьшить учитываемый размер, перезагрузите приложение с меньшим объемом данных.

Поведение приложения при перезагрузке

  • Перезагрузка без новых данных:

    Если в процессе перезагрузки приложения новые данные не добавляются, учитывается только прежний объем данных.

    Пример: Приложение перезагружается с тем же набором данных, который был у него ранее. Использование не меняется, потому что не были загружены дополнительные или меньшие по объему данные.

  • Приложение было очищено от данных после загрузки данных:

    Даже если приложение удаляет все таблицы, оставляя модель данных пустой, в дневном расходе будет учитываться последняя успешная загрузка данных.

    Пример: Приложение загружает 10 ГБ внешних данных, генерирует файлы QVD и удаляет все таблицы в конце скрипта. Приложение теперь пусто, но загруженные 10 ГБ по-прежнему учитываются в дневном расходе.

  • Копирование приложений в другое пространство:

    При копировании приложения в другое пространство его копия рассматривается как отдельное приложение, поэтому приложение учитывается дважды.

Методы перезагрузки, позволяющие уменьшить расход

Потребление данных, связанное с перезагрузкой, можно сократить одним из следующих способов. В обоих случаях данные из приложения следует удалить.

  • Ранняя остановка скрипта загрузки: вставьте в начало скрипта загрузки оператор Exit script;, чтобы перезагрузить приложение без данных. Если требуются полные данные, закомментируйте оператор или примените условие, чтобы он выполнялся только в определенных сценариях (например, когда приложение находится в определенном пространстве).

  • Повторное создание приложения без данных: загрузите приложение без данных и импортируйте данные как в новое приложение. После проверки новой версии удалите исходное приложение.

Помогла ли вам эта страница?

Если вы обнаружили какую-либо проблему на этой странице или с ее содержанием — будь то опечатка, пропущенный шаг или техническая ошибка, сообщите нам об этом!