Перейти к основному содержимому Перейти к дополнительному содержимому

Шаг 2. Создание кластера Lakehouse

Кластер Lakehouse определяет вычислительную среду, используемую для выполнения задач хранения данных Открытое озеро данных Qlik. Каждый кластер имеет параметры, определяющие число экземпляров, тип машины и стратегию масштабирования.

При создании сетевой интеграции для проекта конвейера Открытое озеро данных Qlik кластер с одним экземпляром AWS Spot создается автоматически. Однако можно создать дополнительные кластеры в центрах активности «Администрирование» и Интеграция данных.

Кластеры Lakehouse связывают конвейеры с группой экземпляров AWS, позволяя оптимизировать рабочие нагрузки: распределяют критически важные задачи на высокопроизводительные кластеры, а некритичные рабочие нагрузки — на экономичные машины.

Один кластер связан с одним VPC, но в одном частном виртуальном облаке могут работать несколько кластеров. Кроме того, один кластер может выполнять несколько заданий. Перед созданием Lakehouse рекомендуется определиться с вычислительными потребностями. Параметры кластера, включая стратегию масштабирования, можно менять по мере необходимости, однако для применения некоторых изменений может потребоваться развертывание кластера. Для получения информации об изменении настроек кластера см. раздел Управление кластерами Lakehouse

При создании кластера Lakehouse необходимо указать число экземпляров (машин) Spot и On-Demand, выделяемых для Qlik. Для получения дополнительной информации о том, как Qlik использует экземпляры Spot и On-Demand в кластере, см. Кластер Lakehouse (EC2 Auto-Scaling Group)

Необходимые условия

Для создания кластера Lakehouse требуется следующее:

  • Сетевая интеграция в текущем клиенте.

  • Разрешение на доступ к сетевой интеграции.

Создание кластера Lakehouse

Чтобы добавить кластер к текущему клиенту:

  1. В центре активности Администрирование нажмите Кластеры Lakehouse. Выберите вкладку Кластеры Lakehouse, нажмите Создать, затем Кластер Lakehouse. Настройте кластер следующим образом:

    • Имя: введите имя кластера.

    • Сетевая интеграция: выберите сетевую интеграцию, в которой будет развернут кластер.

    • Интеграционное пространство: выберите пространство, к которому будет принадлежать кластер, так как оно не наследуется при интеграции сети.

    • Тип семейства: выберите тип экземпляров.

  2. Настройте экземпляры:
    • Экземпляры AWS по запросу: введите количество машин AWS On-Demand, доступных для этого кластера.

    • Спотовые экземпляры AWS: введите минимальное и максимальное число машин Spot.

  3. Выберите подходящую стратегию для рабочей нагрузки:
    • Низкая стоимость – оптимизирует с целью снижения расходов, однако в этом случае могут возникать более длительные задержки.

    • Низкая задержка – по возможности обеспечивает низкую задержку, однако допускаются кратковременные всплески.

    • Постоянно низкие задержки – масштабирует заранее, чтобы обеспечить низкую задержку.

    • Ручное масштабирование – использует фиксированное число экземпляров без автоматического масштабирования.

  4. Выберите механизм обновления программного обеспечения на кластере:

    • Раннее развертывание: оптимально для кластеров разработки и тестирования, так как в этом случае можно проверить новые версии на пользовательских конфигурациях и коде до выхода в производство.

    • Позднее развертывание: обновления применяются, если раннее развертывание прошло успешно. Рекомендуется для производственных сред.

  5. Добавьте Ключ и Значение для тегов, которые будут использоваться для идентификации, организации и управления ресурсами.

Помогла ли вам эта страница?

Если вы обнаружили какую-либо проблему на этой странице или с ее содержанием — будь то опечатка, пропущенный шаг или техническая ошибка, сообщите нам об этом!