기본 콘텐츠로 건너뛰기 보완적인 콘텐츠로 건너뛰기

추정 및 보간

데이터 범위는 예측할 때 중요합니다. 데이터 범위에서 데이터 포인트가 누락된 경우 누락된 범위에 있는 값을 예측하기 위해 보간과 추정이 사용됩니다.

보간과 추정의 개념을 설명하기 위해 레모네이드 판매 예측의 예를 사용할 것입니다. 또한 알아야 할 추정의 위험도 보여 줍니다. 차트에서 달러로 표시된 레모네이드 판매량은 매일 최대 기온에 대해 표시됩니다. 기온이 따뜻해지면 판매가 증가하는 것을 볼 수 있습니다.

온도에 대해 표시된 판매 데이터

판매 대 온도 그래프.

우리는 기온이 화씨 70도에서 90도 사이인 날에 대한 데이터만 수집했습니다. 이는 데이터 범위 또는 도메인이 70–90°F임을 의미합니다.

보간

보간은 알려진 값 사이 또는 교육 데이터의 도메인 내에서 예측을 수행하는 경우입니다. 이 예에서는 화씨 77도의 하루 동안 판매 데이터를 수집하지 않았습니다. 값 77은 70~90 사이이므로 해당 날짜의 판매 예측은 보간으로 간주됩니다.

77°F에 대해 수집된 데이터가 없습니다.

선이 77도에 있는 판매 대 온도 그래프.

기온이 77°F에 도달하면 내일 판매가 어떻게 될지 예측하려고 한다고 하겠습니다. 차트에 표시된 추세선은 기계 학습 모델이 주어진 온도에 대해 예측하는 것을 나타냅니다. 77°F에서 이 모델은 $67의 판매를 예측합니다.

77°F에서 $67의 추세선을 따라 예측된 값

77도에 대한 예측 값을 보여 주는 판매 대 온도 그래프.

추정

추정은 알려진 값을 넘어서거나 교육 데이터의 영역 외부에서 예측을 하고 있음을 의미합니다. 최고 온도가 70°F 이하 또는 90°F 이상인 날의 판매 데이터가 없습니다. 70°F 이하 또는 90°F 이상일 동안의 판매 예측은 추정으로 간주됩니다.

더 덥거나 더 시원한 위치나 계절로의 이동이 판매에 미치는 영향을 예측하려면 65°F 및 95°F로 추정해야 합니다. 추세선은 값을 예측하는 데 다시 사용하여 영역을 넘어 확장할 수 있습니다.

65°F에서 $7, 95°F에서 $157의 추세선을 따라 예측된 값

65도 및 95도에 대한 예측 값을 보여 주는 판매 대 온도 그래프.

추정에 따른 문제

추세선이 정말로 데이터 범위를 벗어나 계속되는지를 질문해야 합니다. 모델에서 따뜻한 날씨에 더 높은 판매를 예측하므로 온도가 100°F에 달하는 애리조나에서 레모네이드 판매를 시작해야 할까요? 다음 차트와 같이 판매가 계속 증가할까요?

90°F 이상의 온도에 대한 예측 값

고온에 대한 예측 값을 보여 주는 판매 대 온도 그래프.

애리조나에 레모네이드 가판대를 짓고 판매 데이터를 기록한다고 가정해 보겠습니다. 너무 더워지면 고객이 집에 머물면서 판매가 늘어나지 않고 급격하게 떨어지게 됩니다. 추정의 문제는 패턴이 항상 동일하게 유지되지 않는다는 것입니다. 레모네이드 예에서 추정은 나쁜 비즈니스 결과로 이어졌습니다.

예측 결과는 빨간색 선을 따르지만 파란색의 실제 결과는 패턴이 다릅니다.

예측 값과 실제 값의 차이를 보여 주는 판매 대 온도 그래프.

이 페이지가 도움이 되었습니까?

이 페이지 또는 해당 콘텐츠에서 오타, 누락된 단계 또는 기술적 오류와 같은 문제를 발견하면 개선 방법을 알려 주십시오!