Introduzione al machine learning automatico
Automatizza il machine learning per il tuo team di analisi con Qlik AutoML. Grazie alla semplice interfaccia senza codice, è possibile creare facilmente esperimenti di machine learning per generare modelli ed effettuare previsioni.
Cos'è il machine learning
Il machine learning è una branca dell'intelligenza artificiale e della scienza dei dati che si concentra sul riconoscimento di modelli nei dati cronologici per prevedere i risultati futuri. Gli algoritmi vengono addestrati sui dati per costruire un modello di previsione senza essere esplicitamente programmati per farlo. Un modello di machine learning può aiutare a rispondere a domande come:
-
Un cliente di una palestra cancellerà il proprio abbonamento?
-
Qual è il valore di durata attesa per un determinato cliente?
Per saperne di più sui concetti di base, consultare Comprendere il machine learning. Si imparerà anche a conoscere il framework strutturato per la definizione delle domande di machine learning e la preparazione dei set di dati.
Cosa si può fare con il machine learning automatizzato
Crea esperimenti di machine learning automatizzato in Qlik Sense. Nel centro attività Analisi è possibile collaborare all'esperimento con altri utenti e caricare facilmente i dati dal Catalogo per addestrare il modello.
Integrare l'analisi previsionale con le app Qlik Sense per condividere i risultati. Esplorare ulteriormente con visualizzazioni e scenari interattivi "what-if" per capire come la modifica di diversi parametri possa influire sul risultato desiderato.
È possibile fare previsioni per i set di dati archiviati nel Catalogo o fare previsioni operative in tempo reale utilizzando le API Qlik Sense.
Come funzionano gli esperimenti
Un esperimento addestra gli algoritmi di machine learning su un particolare set di dati con una particolare destinazione. Il training genera modelli di machine learning che possono essere utilizzati per fare previsioni.
La maggior parte del processo è automatizzata nel machine learning. Quando si crea un esperimento e si carica un set di dati, questo viene analizzato automaticamente e i dati vengono pre-elaborati per renderli pronti per il machine learning. Le statistiche e le altre informazioni relative a ciascuna colonna vengono visualizzate per aiutare l'utente a selezionare una destinazione. Quando si avvia il training, diversi algoritmi iniziano a cercare modelli nei dati. Per ulteriori informazioni sulla creazione e sul training degli esperimenti, vedere Utilizzo degli esperimenti.
Al termine del training, i punteggi e le classifiche consentono di valutare i modelli di machine learning generati. Modificando i parametri e ripetendo il training, è possibile generare diverse versioni. Scegliere il modello più performante per il proprio set di dati e distribuirlo per iniziare a effettuare previsioni. Per ulteriori informazioni, vedere Utilizzo delle distribuzioni di ML.
Come mostra l'immagine seguente, un esperimento può avere più versioni, ciascuna delle quali utilizza uno o più algoritmi. Il modello con l'algoritmo più performante può essere distribuito per effettuare previsioni. Ciò significa che un esperimento può portare a diverse distribuzioni di ML.
Accesso utente ad AutoML
Per i dettagli completi su come gli utenti possono accedere a Qlik AutoML, vedere Utenti che possono utilizzare Qlik AutoML.
Limitazioni di AutoML e capacità gestite dalla licenza
AutoML è una funzionalità aggiuntiva a pagamento. Alcune funzionalità limitate sono incluse nelle sottoscrizioni applicabili. Le funzionalità e le capacità specifiche dipendono dal livello di sottoscrizione.
Limitazioni
-
Qlik AutoML ha un limite di frequenza API di 300 richieste al minuto.
-
Numero massimo di colonne nel set di dati: 500
Questo vale per i set di dati utilizzati per gli esperimenti di training e per la generazione delle previsioni. Il limite è il numero di colonne utilizzate come funzioni in una versione dell'esperimento. Il set di dati può contenere più colonne e i limiti vengono calcolati quando le colonne sono incluse nel set di dati.
Capacità gestite con licenza
La propria licenza per clienti determina la capacità di varie metriche che controllano il modo in cui è possibile utilizzare Qlik AutoML. Le metriche di utilizzo vengono misurate come una combinazione dell'uso che l'utente fa dei servizi di AutoML tramite l'interfaccia utente AutoML, l'analisi dei fattori chiave in un'app Qlik Sense e attraverso le API pubbliche.
Sono disponibili più livelli di AutoML, in base alle proprie esigenze aziendali. Ci sono i due tipi di livelli seguenti:
-
Livello incluso: è la funzionalità di AutoML di base con capacità limitate. È incluso con una sottoscrizione a Qlik Sense Enterprise SaaS, Qlik Cloud Analytics Standard, Qlik Cloud Analytics Premium, Qlik Cloud Enterprise o Qlik Talend Cloud (Standard, Premium o Enterprise). Il livello incluso è adatto per testare il prodotto e valutare il modo in cui Qlik AutoML può contribuire a soddisfare le proprie esigenze aziendali. Non è adatto per casi di utilizzo di produzione. Per funzionalità più complete, considerare un livello a pagamento di Qlik AutoML.
-
Livelli a pagamento: ci sono diversi pacchetti che forniscono le capacità complete di AutoML, le quali sono necessarie per casi di utilizzo di produzione. Sono disponibili come componenti aggiuntivi a pagamento per una sottoscrizione a Qlik Cloud.
Le seguenti funzionalità sono disponibili solo nei livelli a pagamento di Qlik AutoML:
-
Ottimizzazione degli iperparametri
-
Previsioni pianificate
-
Previsioni in tempo reale
-
Connettore Qlik AutoML
Per ulteriori informazioni su cosa è incluso in ciascun tipo di livello di AutoML, vedere la tabella sottostante.
Metrica | Descrizione | Disponibile nel livello incluso | Disponibile nei livelli a pagamento |
---|---|---|---|
Modelli distribuiti | Il livello incluso in una sottoscrizione a Qlik Cloud definisce un numero massimo di modelli distribuiti che possono essere creati in tutti i tenant creati all'interno della licenza. Questo limite di consumo viene definito in base al modello, il che significa che più distribuzioni ML create da un singolo modello conteranno come un singolo modello distribuito. | Sì | Sì |
Training contemporanei | È il numero di modelli che un tenant può addestrare in parallelo. Nel livello incluso di Qlik AutoML, i modelli verranno eseguiti uno dopo l'altro. I livelli a pagamento includono una capacità che consente al proprio tenant di addestrare più modelli contemporaneamente. | No | Sì |
Dimensioni dei set di dati aumentate | I livelli a pagamento offrono dimensioni dei set di dati aumentate per il training di modelli. | No | Sì |
Previsioni manuali in blocco | È possibile prevedere tutte le righe in un set di dati manualmente. | Sì | Sì |
Previsioni pianificate in blocco | È possibile configurare le proprie previsioni affinché vengano eseguite secondo una pianificazione, anziché avviarle manualmente. Le previsioni pianificate sono disponibili solo con i livelli a pagamento di Qlik AutoML. Per ulteriori informazioni, vedere Previsioni di pianificazione. | No | Sì |
Previsioni in tempo reale | È possibile impiegare questa API per utilizzare le proprie distribuzioni ML per eseguire previsioni in tempo reale. Per ulteriori informazioni, vedere Creazione di previsioni in tempo reale. | No | Sì |
Connettore Qlik AutoML in Qlik Cloud Analytics | Con questo connettore di analisi, è possibile caricare dati dalla piattaforma Qlik AutoML integrata in Qlik Cloud. Per ulteriori informazioni, vedere Sorgente di analisi di Qlik AutoML. | No | Sì |
Ottimizzazione degli iperparametri | L'ottimizzazione degli iperparametri consente di regolare i propri modelli AutoML per avere un maggiore controllo sul processo di apprendimento. Per ulteriori informazioni, vedere Ottimizzazione degli iperparametri. | No | Sì |
Per informazioni dettagliate sulle metriche della licenza, vedere la descrizione dei prodotti per le Sottoscrizioni a Qlik Cloud®. Gli amministratori possono visualizzare le informazioni sulle licenze e monitorare il numero di modelli distribuiti nel centro attività Amministrazione. Per ulteriori informazioni, vedere Monitoraggio del consumo di risorse.