기계 학습 이해
기계 학습은 수학적 알고리즘을 사용하여 데이터의 패턴을 인식한 다음 해당 패턴을 사용하여 예측을 수행하는 방법입니다.
간단한 예: 판매 예측
기계 학습을 더 잘 이해하기 위해 다음 분기의 제품 판매를 예측하는 간단한 예를 살펴보겠습니다. 이 제품의 판매가 제품을 광고하는 데 사용된 비용에 영향을 받는다는 것을 알 수 있습니다. 이전 분기의 데이터를 보면 다음을 알 수 있습니다.
-
TV에서 제품을 광고하는 데 사용된 비용(수천 달러)
-
판매 금액(수백만 달러).
데이터를 표시해 보면 텔레비전에서 제품을 광고하는 데 더 많은 비용을 사용할수록 더 많이 팔린다는 것을 분명히 알 수 있습니다.
다음 비즈니스 분기의 판매 매출을 예측하기 위해 기록 데이터에 함수를 맞출 수 있습니다.
다음 사업 분기 동안 TV 광고에 지출하기로 예산을 책정한 금액을 기준으로 이 금액에 해당하는 값에서 함수를 평가할 수 있습니다. 다음 분기에 텔레비전 광고에 $225,000를 지출할 계획이라고 가정해 보겠습니다. 함수를 225로 평가하면 17.7이 되고 다음 분기에 1,770만 달러의 판매를 예측할 수 있습니다.
예측의 정확도를 더욱 향상시키기 위해 그림에 표시된 대로 기록 데이터에 더 잘 맞는 함수를 찾고 이 함수를 기반으로 예측을 수행할 수 있습니다.
이 예에서는 텔레비전 광고에 지출된 금액만 살펴보았습니다. 향후 판매에 영향을 미치는 다른 요인도 고려할 수 있습니다. 예를 들어, 텔레비전 광고 지출만의 함수로 판매가 발생하지 않고 텔레비전 광고 지출, 라디오 광고 지출 및 신문 광고 지출의 세 가지 변수의 함수로 판매가 발생할 수 있습니다. 원하는 만큼 많은 변수를 사용할 수 있지만 일반적인 아이디어는 동일합니다.
기계 학습 개념
데이터 관점에서 기계 학습 문제는 기록 데이터로 테이블을 컴파일하여 축소할 수 있습니다. 테이블에 예측하고자 하는 항목(이전 예에서는 판매)을 나타내는 하나의 열이 있습니다. 기계 학습 언어에서는 이 열을 대상이라고 합니다. 다른 열은 기능이라고 하며 대상 열의 값을 예측하는 데 사용됩니다. 기능은 대상 결과에 잠재적으로 기여할 수 있는 변수입니다. 기계 학습의 기본 아이디어는 다음과 같습니다.
데이터 집합이 주어지면 대상 열의 값이 함수 열의 값으로 주어질지 예측할 수 있도록 해당 데이터에 맞는 함수를 찾습니다.
다양한 종류의 기계 학습 문제를 해결하기 위해 여러 가지 정교한 기계 학습 알고리즘이 개발되었습니다. 기계 학습 알고리즘에 데이터를 공급하고 패턴을 학습하게 할 때 우리는 기계 학습 알고리즘을 교육하고 있다고 말합니다.
기계 학습 문제는 예측하려는 대상이 숫자 값인지 범주 값인지에 따라 회귀 문제 또는 분류 문제로 나뉩니다. 분류 문제 및 회귀 문제의 예를 참조하십시오.
자동화된 기계 학습
자동화된 기계 학습을 사용하면 기록 데이터를 교육하는 동안 가장 적합한 함수를 자동으로 찾습니다. 데이터 집합을 쉽게 업로드하고 대상을 선택한 다음 버튼을 눌러 교육을 시작할 수 있습니다.
그러나 좋은 입력이 있는 경우에만 좋은 예측 결과를 가져올 수 있습니다. 기계 학습 실험에는 잘 정의된 기계 학습 질문과 해당 질문에 답하도록 설계된 데이터 집합이 필요합니다. 첫 번째 실험을 시작하려면 다음 단계를 따르십시오.
- 기계 학습 질문 정의
구조화된 프레임워크를 사용하여 비즈니스 사용 사례를 특정 질문으로 전환하십시오.
- 교육 데이터 집합 준비
사용 사례와 관련된 양질의 데이터를 수집합니다.
- 자동화된 기계 학습 실험 만들기
준비가 완료되면 실험을 시작할 수 있습니다.