Ограничения и возможности Qlik Predict
На этой странице перечислены общие ограничения и возможности для функциональности Qlik Predict. Для возможностей, характерных для отдельных подписок Qlik Cloud, обратитесь к Qlik Pricing и Qlik Cloud® Subscriptions или свяжитесь с представителем вашей учетной записи Qlik.
Общие ограничения
-
Производительность API-интерфейса Qlik Predict ограничена 300 запросами в минуту.
-
Максимальное количество столбцов в наборе данных: 500
Это относится как к обучению, так и к применению наборов данных. Для обучающих наборов данных ограничением является количество столбцов, используемых в качестве признаков в версии эксперимента. В исходном наборе данных может быть больше столбцов. Например, у вас может быть набор данных с 501 столбцом. Набор данных все еще можно использовать для обучения, если вы исключите один признак во время настройки эксперимента.
-
Для использования в Qlik Cloud поддерживается любой неструктурированный файл, который можно загрузить и профилировать в Qlik Predict.
Если файл содержит несколько таблиц, например Microsoft Excel файлы с несколькими листами, будет импортирована только первая таблица. Если не удается выполнить профилирование данных таблицы (например, если таблица пуста), файл не поддерживается.
Ограничения набора данных для обучения и профилирования
В этом разделе перечислены ограничения, применяемые к размерам наборов данных для обучения в Qlik Predict.
Обратите внимание на следующие моменты.
-
Ограничения применяются только к данным, включенным в версию эксперимента: ко всем включенным функциональностям, включая целевой столбец.
-
Ограничения применяются либо к общему профилированию данных на платформе Qlik Cloud, либо являются специфичными для Qlik Predict.
-
Ограничения представляют собой максимальные возможности. Лимиты вашей подписки Qlik Cloud могут быть ниже.
Ограничения размера набора данных для обучения
Эти ограничения представляют собой технические возможности по размеру, количеству ячеек и числу включенных столбцов в обучающих наборах данных.
| Тип набора данных | Максимальный размер набора данных | Максимальное количество ячеек набора данных | Максимальное количество включенных столбцов |
|---|---|---|---|
| CSV | 2 ГБ | 100 млн | 500 |
| Parquet | 2 ГБ | 500 млн | 500 |
| QVD | 2 ГБ | 500 млн | 500 |
| Другое | 1 ГиБ | 100 млн | 500 |
Кроме того, некоторые функции обучения доступны только для наборов данных определенного размера и количества ячеек.
| Тип набора данных | Поддерживается инжиниринг признаков свободного текста | Поддерживаются эксперименты с временными рядами | Поддерживается обнаружение смещения |
|---|---|---|---|
| CSV | До 100 миллионов ячеек или 1 ГиБ (превышение любого из этих ограничений не поддерживается) | До 1 ГиБ | До 1 ГиБ |
| Parquet | До 100 миллионов ячеек или 1 ГиБ (превышение любого из этих ограничений не поддерживается) | До 1 ГиБ | До 1 ГБ |
| QVD | До 100 миллионов ячеек или 1 ГБ (превышение любого из этих ограничений не поддерживается) | До 1 ГБ | До 1 ГБ |
| Другое | До 100 миллионов ячеек или 1 ГБ (превышение любого из этих ограничений не поддерживается) | До 1 ГиБ | До 1 ГиБ |
Ограничения профилирования
При добавлении обучающего набора данных в эксперимент он анализируется профилированием данных Qlik Cloud для оценки различных статистических данных (таких как количество ячеек и количество уникальных значений). После запуска версии эксперимента выполняется предварительная обработка Qlik Predict, что иногда приводит к изменению определенных статистических данных.
Для больших наборов данных — превышающих 1 ГиБ — данные профилируются частично. Это может привести к изменению некоторых оценочных статистических данных — например, количества строк, ячеек, уникальных значений и нулевых значений — после выполнения обучения.
В результате при работе с некоторыми большими наборами данных могут возникнуть следующие ошибки обучения:
-
Обучение завершается сбоем из-за того, что набор данных превышает количество ячеек, разрешенное подпиской, даже если при профилировании ошибок не было.
-
Обучение завершается сбоем, потому что количество нулевых значений превышает максимально допустимый порог, даже если при профилировании ошибок не было.
-
Предполагаемый тип эксперимента оказался несовместимым с обучающим набором данных, хотя при профилировании ошибок не было.
Для получения инструкций по устранению неполадок, за которыми вы можете следить, чтобы уменьшить размер набора данных, см. Поиск и устранение неисправностей — Qlik Predict.