Общее представление о машинном обучении
Машинное обучение — это практическое использование математических алгоритмов для выявления закономерностей в данных, чтобы затем использовать эти закономерности для создания прогнозов.
Простой пример: прогнозирование продаж
Чтобы лучше понимать машинное обучение, рассмотрим простой пример прогнозирования продаж продукта в следующем квартале. Допустим, мы знаем, что продажи этого продукта зависят от того, сколько денег тратится на его рекламу. Изучив данные за предыдущие кварталы, мы также узнали:
-
сколько денег (в тысячах долларов) было потрачено на рекламу продукта на телевидении;
-
какими были продажи (в миллионах долларов).
Если построить график на основе этих данных, становится очевидным, что чем больше денег тратится на рекламу продукта на телевидении, тем выше уровень продаж.
Для того чтобы спрогнозировать доход от продаж в следующем отчетном квартале, можно подогнать функцию к данным за предыдущие кварталы.
Исходя из суммы денег, заложенной в бюджет в качестве расходов на телевизионную рекламу в следующем отчетном квартале, мы можем с помощью линейной функции спрогнозировать уровень продаж, соответствующий этой сумме. Допустим, в следующем квартале мы планируем потратить 225 000 $ на телевизионную рекламу. Линейная функция на отметке 225 соответствует значению 17,7, это значит, что прогнозируемый уровень продаж в следующем квартале составляет 17,7 млн долларов.
Чтобы еще больше повысить точность прогноза, можно попытаться найти функцию, которая лучше подгоняется к данным за предыдущие кварталы, как показано на рисунке, и выполнить прогнозирование на основе этой функции.
В данном примере мы рассмотрели зависимость продаж только от суммы денег, потраченной на телевизионную рекламу. Также можно было бы принять во внимание и другие факторы, влияющие на будущие продажи. Например, мы могли бы спрогнозировать уровень продаж не только в зависимости от расходов на телевизионную рекламу, а с использованием трех переменных: расходы на телевизионную рекламу, расходы на рекламу на радио и расходы на рекламу в газетах. Можно использовать сколько угодно переменных, но общий принцип остается неизменным.
Концепции машинного обучения
С точки зрения данных задача машинного обучения сводится к составлению таблицы с историческими данными. Таблица содержит один столбец, представляющий то, что необходимо спрогнозировать, в предыдущем примере это были продажи. На языке машинного обучения этот столбец называется целью. Другие столбцы называются признаками и используются для прогнозирования значения целевого столбца. Признаки — это переменные, которые потенциально могут способствовать достижению целевого результата. Основная идея машинного обучения заключается в следующем.
Используя набор данных, мы находим функцию, которая подгоняется к этим данным таким образом, чтобы можно было спрогнозировать значение целевого столбца с учетом значений столбцов признаков.
Для решения различных задач машинного обучения было разработано несколько сложных алгоритмов машинного обучения. Когда данные передаются в алгоритм машинного обучения и он учится выявлять закономерности в этих данных, речь идет об обучении алгоритма машинного обучения.
Задачи машинного обучения делятся на задачи регрессии и задачи классификации — в зависимости от того, является ли цель, которую необходимо спрогнозировать, числовым или категориальным значением. См. примеры в разделах Задачи классификации и Задачи регрессии.
Автоматизированное машинное обучение
При автоматизированном машинном обучении поиск наиболее подходящих функций происходит автоматически в процессе обучения на основе исторических данных. Вы можете легко загрузить набор данных, выбрать цель, а затем запустить обучение одним нажатием кнопки.
Однако, чтобы получить хороший прогнозируемый результат, требуются хорошие входные данные. Для проведения эксперимента машинного обучения нужна четко сформулированная задача машинного обучения и набор данных, предназначенный для решения этой задачи. Перед тем как запустить первый эксперимент, выполните действия, описанные ниже.
- Сформулируйте задачу машинного обучения
Преобразуйте бизнес-сценарий использования в конкретную задачу с помощью упорядоченной структуры.
- Подготовьте набор данных для обучения
Соберите качественные данные, релевантные для сценария использования.
- Создайте автоматизированный эксперимент машинного обучения
Когда подготовка завершена, можно приступать к созданию эксперимента.