Comprendere il machine learning
Il machine learning è la pratica di utilizzare algoritmi matematici per riconoscere modelli nei dati e quindi utilizzare tali modelli per effettuare previsioni.
Un semplice esempio: previsione delle vendite
Per comprendere meglio il machine learning, diamo un'occhiata a un semplice esempio che prevede le vendite di un prodotto nel trimestre successivo. Potremmo sapere che le vendite di questo prodotto sono influenzate dalla quantità di denaro spesa per pubblicizzarlo. Osservando i dati dei trimestri precedenti sappiamo:
-
Quanto denaro viene speso (in migliaia di dollari) per pubblicizzare il prodotto in televisione.
-
A quanto ammontavano le vendite (in milioni di dollari).
Quando tracciamo i dati, è ovvio che più denaro viene speso per pubblicizzare il nostro prodotto in televisione, più vendiamo.
Grafico delle vendite rispetto alla spesa pubblicitaria televisiva

Per prevedere i ricavi delle vendite durante il prossimo trimestre aziendale, possiamo adattare una funzione ai dati storici:
Una funzione lineare viene adattata ai dati

In base alla quantità di denaro che abbiamo preventivato di spendere in pubblicità televisiva durante il prossimo trimestre aziendale, possiamo valutare la funzione al valore corrispondente a tale importo. Supponiamo di avere in programma di spendere 225.000 dollari in pubblicità televisiva nel prossimo trimestre. Valutando la funzione a 225 otteniamo 17,7 e possiamo prevedere 17,7 milioni di dollari di vendite per il prossimo trimestre.
La funzione viene valutata per prevedere le vendite per un importo specifico speso in pubblicità

Per migliorare ulteriormente l'accuratezza della nostra previsione, possiamo provare a trovare una funzione che si adatti meglio ai dati storici, come mostrato nella figura, ed effettuare previsioni basate su questa funzione.
Una funzione che si adatta meglio ai dati

In questo esempio, abbiamo esaminato solo la quantità di denaro spesa per la pubblicità televisiva. Potremmo anche considerare altri fattori che influenzano le vendite future. Invece di avere le vendite come funzione della sola spesa pubblicitaria televisiva, potremmo, ad esempio, avere le vendite come funzione delle tre variabili spesa pubblicitaria televisiva, spesa pubblicitaria radiofonica e spesa pubblicitaria sui giornali. Possiamo utilizzare tutte le variabili che vogliamo, ma l'idea generale è la stessa.
Concetti di machine learning
Dal punto di vista dei dati, il problema del machine learning si riduce alla compilazione di una tabella con dati storici. Abbiamo una colonna nella tabella che rappresenta ciò che vogliamo prevedere, che nel nostro esempio precedente erano le vendite. Nel linguaggio del machine learning, questa colonna è chiamata destinazione. Le altre colonne sono chiamate funzionalità e vengono utilizzate per prevedere il valore della colonna di destinazione. Le funzionalità sono variabili che possono potenzialmente contribuire al risultato di destinazione. L'idea fondamentale alla base del machine learning è:
Dato un set di dati, troviamo una funzione che si adatta a tali dati in modo da poter prevedere quale sarà il valore per la colonna di destinazione dati i valori per le colonne delle funzionalità.
Sono stati sviluppati diversi sofisticati algoritmi di machine learning per risolvere diversi tipi di problemi di machine learning. Quando forniamo dati a un algoritmo di machine learning e gli permettiamo di apprendere modelli, diciamo che stiamo addestrando un algoritmo di machine learning.
In Qlik Predict, i problemi di machine learning sono suddivisi in problemi di classificazione, regressione o serie temporali, a seconda di:
-
Se la destinazione da prevedere è un valore categorico o numerico. Vedere gli esempi in Problemi di classificazione e Problemi di regressione.
-
Se è necessario prevedere i dati per periodi di tempo futuri specifici. Vedere un esempio in Problemi di serie temporali.
Machine learning automatizzato
Con il machine learning automatizzato, le funzioni più adatte vengono trovate automaticamente durante l'addestramento sui dati storici. È possibile caricare facilmente un set di dati, selezionare una destinazione e quindi avviare l'addestramento premendo un pulsante.
Tuttavia, si otterrà un buon output predittivo solo se si dispone di un buon input. Un esperimento di machine learning richiede una domanda di machine learning ben definita e un set di dati progettato per rispondere a tale domanda. Per iniziare con il tuo primo esperimento, segui questi passaggi:
- Definire una domanda di machine learning
Trasforma il tuo caso d'uso aziendale in una domanda specifica utilizzando un framework strutturato.
- Preparare il set di dati di addestramento
Raccogli dati di buona qualità pertinenti per il tuo caso d'uso.
- Creare un esperimento di machine learning automatizzato
Al termine dei preparativi, è possibile iniziare a sperimentare.