KMeans2D() вычисляет строки диаграммы путем применения кластеризации методом k-средних; для каждой строки диаграммы отображается идентификатор кластера, которому была назначена эта точка диаграммы. Столбцы, используемые алгоритмом кластеризации, определены соответственно параметрами coordinate_1 и coordinate_2. Они оба являются агрегированиями. Количество созданных кластеров определяется параметром num_clusters. Данные могут быть при необходимости нормализованы с помощью параметра нормы.
KMeans2D возвращает одно значение на точку диаграммы. Возвращенное значение — двойное и является целочисленным значением, соответствующим кластеру, которому была назначена каждая точка диаграммы.
Целое число, которое указывает количество кластеров.
coordinate_1
Агрегирование, вычисляющее первую координату, обычно ось X точечной диаграммы, которая может быть сделана из диаграммы. Дополнительный параметр coordinate_2 вычисляет вторую координату.
norm
Дополнительный метод нормализации применяется к наборам данных перед кластеризацией методом k-средних.
Возможные значения:
0 или 'нет' при отсутствии нормализации
1 или ‘zscore’ для нормализации с помощью z-оценки
2 или ‘minmax’ для нормализации с помощью мин./макс.
Если параметры не предоставлены или предоставленный параметр неправильный, нормализация не применяется.
Z-оценка нормализует данные на основе среднего и стандартного отклонения признака. Z-оценка не гарантирует, что у каждого признака будет одинаковый масштаб, но при выбросах этот подход лучше, чем мин./макс.
Нормализация с помощью мин./макс. гарантирует, что признаки имеют одинаковый масштаб; для этого берутся минимальное и максимальное значения каждого признака и каждая точка данных вычисляется заново.
В этом примере создается точечная диаграмма с помощью набора данных Iris, и затем с помощью KMeans данные раскрашиваются по выражению.
Также мы создаем переменную для аргумента num_clusters и затем используем поле ввода переменной, чтобы изменить количество кластеров.
Набор данных Iris общедоступен в различных форматах. Данные предоставлены в виде встроенной таблицы для загрузки с помощью редактора загрузки данных в программе Qlik Sense. Обратите внимание, что к таблице данных для этого примера добавлен столбец Идентификатор.
Введите следующее для метки: Идентификатор кластера
Параметры вида для диаграммы Лепесток (раскрашивание по выражению)
Два кластера на диаграмме раскрашены по выражению KMeans.
Кластеры, раскрашенные по выражению на диаграммы Лепесток (раскрашивание по выражению)
Добавьте поле Ввод переменной для количества кластеров.
В разделе Пользовательские объекты на панели Ресурсы выберите Qlik Dashboard Bundle. Если бы к пакету информационной панели не было доступа, количество кластеров можно бы было изменить с помощью созданной переменной или непосредственно с помощью целого числа в выражении.
Перетащите поле Ввод переменной на лист.
В разделе Вид щелкните Общее.
Введите следующее для параметра Заголовок: Кластеры
Щелкните Переменная.
Выберите следующую переменную для параметра Имя: KmeansPetalClusters.
Выберите Ползунок для параметра Показать в виде.
Выберите Значения и настройте параметры как требуется,
Вид поля ввода переменной Кластеры
По завершении редактирования можно изменить количество кластеров с помощью ползунка в поле ввода переменной Кластеры.
Кластеры, раскрашенные по выражению на диаграммы Лепесток (раскрашивание по выражению)
Автоматическая кластеризация
Функции метода k-средних поддерживают автоматическую кластеризацию с помощью метода, называемого разницей глубины (DeD). Когда пользователь задает количество кластеров равным 0, оптимальное количество кластеров определяется для набора данных. Обратите внимание, что хотя целое число для количества кластеров (k) явно не возвращается, оно вычисляется в алгоритме k-средних. Например, если 0 указан в функции для значения KmeansPetalClusters или установлен через поле ввода переменной, назначения кластеров автоматически вычисляются для набора данных на основе оптимального количества кластеров.
Метод разницы глубины k-средних определяет оптимальное количество кластеров, когда (k) установлен на 0
Набор данных Iris: встроенная загрузка для редактора загрузки данных в Qlik Sense
Если вы обнаружили какую-либо проблему на этой странице и с ее содержанием — будь то опечатка, пропущенный шаг или техническая ошибка, сообщите нам об этом, чтобы мы смогли ее исправить!