Correl — функция диаграммы

Функция Correl() возвращает агрегированный коэффициент корреляции для двух наборов данных. Функция корреляции — это мера отношений между наборами данных. Она агрегирована для пар значений (x,y), повторяемых в измерениях диаграммы.

Syntax:  

Correl([{SetExpression}] [DISTINCT] [TOTAL [<fld{, fld}>]] value1, value2 )

Return data type: числовое значение

Arguments:  

Аргумент Описание
value1, value2 Выражения или поля, содержащие два образца множеств, для которых необходимо измерить коэффициент корреляции.
SetExpression По умолчанию функция агрегирования агрегирует множество возможных записей, определенных выборкой. Альтернативный набор записей может быть определен выражением анализа множества.
DISTINCT Если слово DISTINCT указывается до аргументов функции, все дубликаты, возникшие в результате оценки аргументов функции, будут проигнорированы.
TOTAL

Если слово TOTAL стоит перед аргументами функции, вычисление выполняется по всем возможным значениям, указанным в текущих выборках, а не только в тех, которые относятся к значению текущего измерения, т. е. измерения диаграммы игнорируются.

При использовании выражения TOTAL [<fld {.fld}>], где префикс TOTAL предшествует списку из одного или нескольких имен полей, выступающих в качестве подмножества переменных измерения диаграммы, создается подмножество всех возможных значений.

Определение объема агрегирования

Limitations:  

Выражение не должно содержать функции агрегирования, кроме внутреннего агрегирования, содержащего префикс TOTAL. Для получения более расширенных вложенных агрегирований необходимо использовать функцию расширенного агрегирования Aggr вместе с вычисляемыми измерениями.

Текстовые значения, значения NULL и отсутствующие значения в какой-либо или обеих частях пары значений приводят к игнорированию всей пары значений.

Examples and results:  

Пример Результат
Correl(Age, Salary)

Для таблицы, включающей измерение Employee name и меру Correl(Age, Salary), результат будет 0,9270611. Результат отображается только для итоговой ячейки.

Correl(TOTAL Age, Salary))

0.927. Этот и следующие результаты показаны в формате с тремя знаками после десятичной запятой для удобства считывания.

При создании фильтра с измерением Gender и выборками из него полученный результат составит 0,951, если выбран элемент Female, и 0,939, если выбран элемент Male. Это обусловлено тем, что выборка исключает все результаты, которые не принадлежат другому значению элемента Gender.

Correl({1} TOTAL Age, Salary))

0.927. Независимо от выборок. Это обусловлено тем, что выражение множества {1} игнорирует все выборки и измерения.

Correl(TOTAL <Gender> Age, Salary))

0,927 в итоговой ячейке, 0,939 для всех значений элемента Male и 0,951 для всех значений элемента Female. Это соответствует результатам при выполнении выборок в фильтре на основе элемента Gender.

Данные, используемые в примерах:

Salary:

LOAD * inline [

"Employee name"|Gender|Age|Salary

Aiden Charles|Male|20|25000

Brenda Davies|Male|25|32000

Charlotte Edberg|Female|45|56000

Daroush Ferrara|Male|31|29000

Eunice Goldblum|Female|31|32000

Freddy Halvorsen|Male|25|26000

Gauri Indu|Female|36|46000

Harry Jones|Male|38|40000

Ian Underwood|Male|40|45000

Jackie Kingsley|Female|23|28000

] (delimiter is '|');