Ir para conteúdo principal Pular para conteúdo complementar

Extrapolação e interpolação

O intervalo de seus dados é importante quando você faz previsões. Se pontos de dados estiverem ausentes em um intervalo de dados, a interpolação e a extrapolação serão usadas para prever os valores que estão no intervalo ausente.

Usaremos um exemplo de previsão de vendas de limonada para ilustrar os conceitos de interpolação e extrapolação. Também mostra os riscos com extrapolação dos quais você precisa estar ciente. Em nosso gráfico, as vendas de limonada em dólares são plotadas em relação à temperatura máxima diária. Podemos ver que as vendas aumentam com temperaturas mais quentes.

Dados de vendas plotados em relação à temperatura

Gráfico de vendas versus temperatura.

Coletamos dados apenas para dias com temperaturas de 70 a 90 graus Fahrenheit. Isso significa que nosso intervalo de dados, ou domínio, é de 70–90°F.

Interpolação

Interpolação é quando você faz uma previsão entre valores conhecidos ou dentro do domínio dos dados de treinamento. Em nosso exemplo, não coletamos nenhum dado de vendas para um dia de 77°F. O valor 77 fica entre 70-90, portanto, a previsão de vendas para esse dia seria considerada uma interpolação.

Não há dados coletados para 77°F

Gráfico de vendas versus temperatura com linha a 77 graus.

Digamos que queremos prever quais serão as vendas amanhã se a temperatura atingir 77°F. A linha de tendência mostrada no gráfico representa o que o modelo de aprendizado de máquina preveria para qualquer temperatura. A 77°F, o modelo prevê US$ 67 em vendas.

Valor previsto ao longo da linha de tendência de US$ 67 a 77°F

Gráfico de vendas versus temperatura mostrando o valor previsto para 77 graus.

Extrapolação

Extrapolação significa que você está fazendo uma previsão além dos valores conhecidos ou fora do domínio dos dados de treinamento. Não temos dados de vendas para um dia com temperatura máxima abaixo de 70°F ou acima de 90°F. A previsão de vendas para dias abaixo de 70°F ou acima de 90°F seria considerada extrapolação.

Se quisermos prever como a mudança para um local ou estação mais quente ou mais fria afetaria as vendas, precisamos extrapolar para 65°F e 95°F. A linha de tendência pode novamente ser usada para prever os valores, estendendo-a além do domínio.

Valores previstos ao longo da linha de tendência de US$ 7 a 65°F e US$ 157 a 95°F

Gráfico de vendas versus temperatura mostrando valores previstos para 65 e 95 graus.

O desafio da extrapolação

A pergunta que precisamos fazer é se a linha de tendência realmente continua fora dos limites de nossos dados. Nosso modelo prevê vendas mais altas em climas mais quentes, então devemos começar a vender limonada no Arizona, onde atinge 100°F? As vendas continuariam aumentando como no gráfico a seguir?

Valores previstos para temperaturas acima de 90°F

Gráfico de vendas versus temperatura mostrando valores previstos para altas temperaturas.

Digamos que construímos uma barraca de limonada no Arizona e registramos dados de vendas. Em vez de aumentar as vendas, os clientes ficam em casa quando fica muito quente e as vendas caem drasticamente! O desafio da extrapolação é que o padrão nem sempre permanece o mesmo. Em nosso exemplo da limonada, a extrapolação levou a um mau resultado comercial.

O resultado previsto segue a linha vermelha, mas o resultado real em azul tem um padrão diferente

Gráfico de vendas versus temperatura mostrando a diferença entre os valores previstos e os valores reais.

Esta página ajudou?

Se você encontrar algum problema com esta página ou seu conteúdo - um erro de digitação, uma etapa ausente ou um erro técnico - informe-nos como podemos melhorar!