Extrapolação e interpolação
O intervalo de seus dados é importante quando você faz previsões. Se pontos de dados estiverem ausentes em um intervalo de dados, a interpolação e a extrapolação serão usadas para prever os valores que estão no intervalo ausente.
Usaremos um exemplo de previsão de vendas de limonada para ilustrar os conceitos de interpolação e extrapolação. Também mostra os riscos com extrapolação dos quais você precisa estar ciente. Em nosso gráfico, as vendas de limonada em dólares são plotadas em relação à temperatura máxima diária. Podemos ver que as vendas aumentam com temperaturas mais quentes.
Coletamos dados apenas para dias com temperaturas de 70 a 90 graus Fahrenheit. Isso significa que nosso intervalo de dados, ou domínio, é de 70–90°F.
Interpolação
Interpolação é quando você faz uma previsão entre valores conhecidos ou dentro do domínio dos dados de treinamento. Em nosso exemplo, não coletamos nenhum dado de vendas para um dia de 77°F. O valor 77 fica entre 70-90, portanto, a previsão de vendas para esse dia seria considerada uma interpolação.
Digamos que queremos prever quais serão as vendas amanhã se a temperatura atingir 77°F. A linha de tendência mostrada no gráfico representa o que o modelo de aprendizado de máquina preveria para qualquer temperatura. A 77°F, o modelo prevê US$ 67 em vendas.
Extrapolação
Extrapolação significa que você está fazendo uma previsão além dos valores conhecidos ou fora do domínio dos dados de treinamento. Não temos dados de vendas para um dia com temperatura máxima abaixo de 70°F ou acima de 90°F. A previsão de vendas para dias abaixo de 70°F ou acima de 90°F seria considerada extrapolação.
Se quisermos prever como a mudança para um local ou estação mais quente ou mais fria afetaria as vendas, precisamos extrapolar para 65°F e 95°F. A linha de tendência pode novamente ser usada para prever os valores, estendendo-a além do domínio.
O desafio da extrapolação
A pergunta que precisamos fazer é se a linha de tendência realmente continua fora dos limites de nossos dados. Nosso modelo prevê vendas mais altas em climas mais quentes, então devemos começar a vender limonada no Arizona, onde atinge 100°F? As vendas continuariam aumentando como no gráfico a seguir?
Digamos que construímos uma barraca de limonada no Arizona e registramos dados de vendas. Em vez de aumentar as vendas, os clientes ficam em casa quando fica muito quente e as vendas caem drasticamente! O desafio da extrapolação é que o padrão nem sempre permanece o mesmo. Em nosso exemplo da limonada, a extrapolação levou a um mau resultado comercial.