Понимание машинного обучения | Qlik Cloud Справка
Перейти к основному содержимому Перейти к дополнительному содержимому

Понимание машинного обучения

Машинное обучение — это практика использования математических алгоритмов для распознавания закономерностей в данных и последующего использования этих закономерностей для составления прогнозов.

Простой пример: прогнозирование продаж

Чтобы лучше понять машинное обучение, давайте рассмотрим простой пример прогнозирования продаж продукта в следующем квартале. Мы можем знать, что на продажи этого продукта влияет то, сколько денег тратится на его рекламу. Изучив данные за предыдущие кварталы, мы знаем:

  • Сколько денег тратится (в тысячах долларов) на рекламу продукта по телевидению.

  • Какими были продажи (в миллионах долларов).

Когда мы наносим данные на график, становится очевидно, что чем больше денег тратится на рекламу нашего продукта по телевидению, тем больше мы продаем.

График зависимости продаж от расходов на телевизионную рекламу

График зависимости продаж от расходов на телевизионную рекламу.

Чтобы спрогнозировать выручку от продаж в следующем финансовом квартале, мы можем подобрать функцию к историческим данным:

Линейная функция подобрана к данным

График зависимости продаж от расходов на телевизионную рекламу с линейной функцией.

Основываясь на сумме денег, которую мы заложили в бюджет на телевизионную рекламу в следующем финансовом квартале, мы можем вычислить значение функции для этой суммы. Допустим, мы планируем потратить 225 000 долларов на телевизионную рекламу в следующем квартале. Вычисление функции при значении 225 дает нам 17,7, и мы можем спрогнозировать продажи в размере 17,7 млн долларов на следующий квартал.

Функция вычисляется для прогнозирования продаж при определенной сумме расходов на рекламу

График зависимости продаж от расходов на телевизионную рекламу с вычислением точки на линейной функции.

Чтобы еще больше повысить точность нашего прогноза, мы можем попытаться найти функцию, которая лучше соответствует историческим данным — как показано на рисунке — и делать прогнозы на основе этой функции.

Функция, которая лучше соответствует данным

График зависимости продаж от расходов на телевизионную рекламу с нелинейной функцией.

В этом примере мы рассмотрели только сумму денег, потраченную на телевизионную рекламу. Мы также могли бы учесть другие факторы, влияющие на будущие продажи. Вместо того чтобы рассматривать продажи как функцию только от расходов на телевизионную рекламу, мы могли бы, например, рассматривать продажи как функцию от трех переменных: расходов на телевизионную рекламу, расходов на радиорекламу и расходов на рекламу в газетах. Мы можем использовать столько переменных, сколько захотим, но общая идея остается той же.

Концепции машинного обучения

С точки зрения данных проблема машинного обучения сводится к составлению таблицы с историческими данными. В таблице есть один столбец, представляющий то, что мы хотим спрогнозировать, что в нашем предыдущем примере было продажами. На языке машинного обучения этот столбец называется целевым. Остальные столбцы называются характеристиками и используются для прогнозирования значения целевого столбца. Характеристики — это переменные, которые потенциально могут влиять на целевой результат. Фундаментальная идея машинного обучения заключается в следующем:

Имея набор данных, мы находим функцию, которая соответствует этим данным, чтобы мы могли спрогнозировать, каким будет значение целевого столбца с учетом значений столбцов характеристик.

Для решения различных видов проблем машинного обучения было разработано несколько сложных алгоритмов машинного обучения. Когда мы передаем данные алгоритму машинного обучения и позволяем ему изучать закономерности, мы говорим, что обучаем алгоритм машинного обучения.

В Qlik Predict проблемы машинного обучения делятся на проблемы классификации, регрессии или временных рядов в зависимости от:

Автоматизированное машинное обучение

С помощью автоматизированного машинного обучения наиболее подходящие функции находятся автоматически во время обучения на ваших исторических данных. Вы можете легко загрузить набор данных, выбрать цель, а затем начать обучение одним нажатием кнопки.

Однако вы получите хороший прогнозный результат только в том случае, если у вас есть хорошие входные данные. Для эксперимента машинного обучения требуется четко сформулированный вопрос машинного обучения и набор данных, предназначенный для ответа на этот вопрос. Чтобы начать свой первый эксперимент, выполните следующие шаги:

  1. Определите вопрос машинного обучения

    Превратите свой бизнес-сценарий в конкретный вопрос, используя структурированную структуру.

    Формулирование задач машинного обучения

  2. Подготовьте набор данных для обучения

    Соберите качественные данные, релевантные для вашего сценария использования.

    Подготовка набора данных к обучению

  3. Создайте эксперимент автоматизированного машинного обучения

    Когда подготовка будет завершена, вы сможете начать экспериментировать.

    Работа с экспериментами

СОПУТСТВУЮЩИЕ УЧЕБНЫЕ МАТЕРИАЛЫ:

Подробнее

Помогла ли вам эта страница?

Если вы обнаружили какую-либо проблему на этой странице или с ее содержанием — будь то опечатка, пропущенный шаг или техническая ошибка, сообщите нам об этом!