Affinamento dei modelli
Una volta creati alcuni modelli iniziali, è importante affinarli per aumentarne l'efficacia e la potenziale accuratezza. I punteggi del modello indicano diverse misure di queste prestazioni. Sebbene l'obiettivo dell'affinamento dei modelli sia aumentare questi punteggi, un punteggio più alto non indica sempre un modello migliore.
È possibile affinare i modelli escludendo o includendo funzionalità, modificando i dati di addestramento e modificando altri parametri di configurazione. In questo modo, è possibile confrontare diverse versioni per vedere l'effetto delle modifiche apportate.
Interpretando i punteggi, si apprenderà come affinare il modello. I valori delle diverse metriche possono fornire indicazioni sulle azioni da intraprendere per migliorare il risultato.
Requisiti e autorizzazioni
Per ulteriori informazioni sui requisiti utente per lavorare con gli esperimenti ML, vedere Lavorare con gli esperimenti.
Configurazione di una nuova versione
Dopo aver eseguito una versione dell'esperimento, è possibile affinare i modelli, se necessario, creando una nuova versione.
Procedere come indicato di seguito:
-
Dalla scheda Dati di addestramento, Modelli o Analizza, selezionare il modello da utilizzare come base per la versione successiva.
-
Fare clic su Visualizza configurazione.
Si apre il pannello di configurazione dell'esperimento.
-
Fare clic su Crea nuova versione.
Dopo aver creato una nuova versione, è possibile apportare modifiche alla sua configurazione, ad esempio:
-
Escludere funzionalità esistenti
-
Includere funzionalità precedentemente escluse
-
Modificare o aggiornare il set di dati
-
Selezionare o deselezionare gli algoritmi
Ulteriori informazioni su queste opzioni sono fornite nelle sezioni seguenti.
Durante la stesura di una nuova versione, fare clic sull'icona del filtro sotto Funzionalità nel pannello di configurazione dell'esperimento. Durante il filtraggio, è possibile visualizzare più facilmente quali funzionalità sono state introdotte da quando è stato modificato il set di dati di addestramento. È inoltre possibile vedere quali funzionalità sono generate automaticamente e quali non lo sono.
Miglioramento del set di dati
Se il modello non ottiene un buon punteggio, potrebbe essere necessario rivedere il set di dati per risolvere eventuali problemi. Maggiori informazioni su come migliorare il set di dati sono disponibili in Preparazione del dataset per il training.
Esclusione di funzionalità
Un numero maggiore di funzionalità non rende necessariamente migliore un modello. Per affinare il modello, si desidera escludere le funzionalità inaffidabili e irrilevanti, come:
-
Funzionalità con correlazione troppo elevata. Tra due funzionalità correlate, escludere quella con minore importanza della funzionalità.
-
Funzionalità con importanza della funzionalità troppo bassa. Tali funzionalità non influiscono su ciò che si sta cercando di apprendere.
-
Funzionalità con importanza della funzionalità troppo elevata. Potrebbe essere dovuto alla dispersione dei dati (data leakage).
Provare a rimuovere la funzionalità dai dati di addestramento, quindi eseguire nuovamente l'addestramento e verificare se questo migliora il modello. Fa una grande differenza o nessuna per il punteggio del modello?
Procedere come indicato di seguito:
-
Aprire un esperimento dal Catalogo.
-
Dalla scheda Dati di addestramento, Modelli o Analizza, selezionare il modello da utilizzare come base per la versione successiva.
-
Fare clic su Visualizza configurazione.
Si apre il pannello di configurazione dell'esperimento.
-
Fare clic su Crea nuova versione per configurare una nuova versione dell'esperimento.
-
Sotto Funzionalità, deselezionare le caselle di controllo per qualsiasi funzionalità che non si desidera utilizzare nell'addestramento.
Aggiunta di funzionalità
Se il modello continua a non ottenere un buon punteggio, potrebbe essere dovuto al fatto che le funzionalità che hanno una relazione con il target non sono ancora state acquisite nel set di dati. È possibile rielaborare e riutilizzare il set di dati per ottimizzare la qualità dei dati e per aggiungere nuove funzionalità e informazioni. Una volta pronto, il nuovo set di dati può essere aggiunto alle versioni future dell'esperimento. Vedere Modifica e aggiornamento del set di dati.
Ulteriori informazioni su come acquisire o progettare nuove funzionalità sono disponibili in Creazione di nuove colonne di funzioni.
Modifica delle impostazioni di rilevamento della distorsione
È possibile modificare le funzionalità su cui è impostata l'esecuzione del rilevamento della distorsione. Ad esempio, se sono state aggiunte nuove funzionalità al set di dati, è possibile attivare il rilevamento della distorsione per queste funzionalità.
Procedere come indicato di seguito:
-
Aprire un esperimento dal catalogo.
-
Dalla scheda Dati di addestramento, Modelli o Analizza, selezionare il modello da utilizzare come base per la versione successiva.
-
Fare clic su Visualizza configurazione.
Si apre il pannello di configurazione dell'esperimento.
-
Fare clic su Crea nuova versione per configurare una nuova versione dell'esperimento.
-
Espandere Distorsione nel pannello di configurazione dell'addestramento.
-
Facoltativamente, fare clic su Ottieni consigli per utilizzare l'IA generativa per suggerire funzionalità che potrebbero contenere dati distorti. Vedere Utilizzo dell'IA generativa per raccomandare funzionalità per il rilevamento dei bias.
-
Selezionare o deselezionare le funzionalità per le quali si desidera eseguire il rilevamento della distorsione.
In alternativa, definire le impostazioni di rilevamento della distorsione in Vista schema.
Per ulteriori informazioni sul rilevamento della distorsione, vedere Rilevamento dei bias nei modelli di machine learning.
Selezione degli algoritmi
In base al tipo di dati della colonna target, vengono selezionati automaticamente gli algoritmi adatti per l'addestramento. Si potrebbe desiderare di escludere gli algoritmi che non offrono prestazioni altrettanto buone o che sono più lenti. In questo modo non si dovrà perdere tempo con essi per l'addestramento.
Per ulteriori informazioni su come vengono scelti gli algoritmi, vedere Nozioni sugli algoritmi dei modelli.
Procedere come indicato di seguito:
-
Aprire un esperimento dal Catalogo.
-
Dalla scheda Dati, Modelli o Analizza, selezionare il modello da utilizzare come base per la versione successiva.
-
Fare clic su Visualizza configurazione.
Si apre il pannello di configurazione dell'esperimento.
-
Fare clic su Crea nuova versione per configurare una nuova versione dell'esperimento.
-
Sotto Algoritmi, deselezionare le caselle di controllo per qualsiasi algoritmo che non si desidera utilizzare nell'addestramento.
Modifica e aggiornamento del set di dati
Se i dati di addestramento sono cambiati dall'ultima versione dell'esperimento, è possibile modificare o aggiornare il set di dati per le versioni future dell'esperimento.
Questo potrebbe essere utile se si desidera confrontare le metriche e le prestazioni del modello per diversi set di dati all'interno dello stesso esperimento. Ad esempio, questo è utile se:
-
È disponibile un nuovo set di record di dati o sono stati apportati aggiornamenti al set originale di record di dati. Ad esempio, le transazioni dell'ultimo mese potrebbero essere diventate disponibili e idonee per l'uso nell'addestramento, oppure potrebbe essere stato identificato e risolto un problema di raccolta dei dati.
-
Il set di dati di addestramento originale è stato rielaborato o riutilizzato, forse con l'intenzione di migliorare l'addestramento del modello. Ad esempio, si potrebbe aver migliorato la logica per definire i valori delle colonne delle funzionalità o persino aver aggiunto nuove colonne delle funzionalità.
La modifica o l'aggiornamento del set di dati non altera i modelli esistenti che sono già stati addestrati a partire da versioni precedenti dell'esperimento. All'interno di una versione dell'esperimento, i modelli vengono addestrati solo sui dati di addestramento definiti all'interno di quella specifica versione.
Requisiti
Quando si modifica o si aggiorna il set di dati per una nuova versione dell'esperimento, il nuovo set di dati deve soddisfare i seguenti requisiti:
-
Il nome e il tipo di funzionalità della colonna target devono essere gli stessi del target nel set di dati di addestramento originale.
- Il numero di valori distinti nella colonna target deve rientrare nello stesso intervallo richiesto per il tipo di esperimento specificato. Ad esempio, per un esperimento di classificazione multiclasse, la colonna target nel nuovo set di dati deve avere ancora tra tre e dieci valori univoci. Per gli intervalli specifici, vedere Configurazione degli esperimenti.
Le altre colonne delle funzionalità possono essere completamente nuove, avere nomi diversi e contenere dati diversi.
Modifica del set di dati
Procedere come indicato di seguito:
-
Dalla scheda Dati di addestramento, Modelli o Analizza, selezionare il modello da utilizzare como base per la versione successiva.
-
Fare clic su Visualizza configurazione.
Si apre il pannello di configurazione dell'esperimento.
-
Fare clic su Crea nuova versione per configurare una nuova versione dell'esperimento.
-
Sotto Dati di addestramento > Rivedi set di dati, fare clic su Modifica set di dati.
-
Selezionare o caricare il nuovo set di dati. È possibile scegliere tra:
-
Set di dati: selezionare un set di dati in qualsiasi spazio a cui si ha accesso. Vedere Suggerimenti e linee guida per il caricamento e la selezione dei set di dati.
-
Prodotti dati: selezionare un set di dati da un prodotto dati attivo a cui si ha accesso. Per ulteriori informazioni sui prodotti dati, vedere Creating data products.
-
Aggiornamento del set di dati
Procedere come indicato di seguito:
-
Dalla scheda Dati di addestramento, Modelli o Analizza, selezionare il modello da utilizzare come base per la versione successiva.
-
Fare clic su Visualizza configurazione.
Si apre il pannello di configurazione dell'esperimento.
-
Fare clic su Crea nuova versione per configurare una nuova versione dell'esperimento.
-
Sotto Dati di addestramento, fare clic su Aggiorna set di dati.
Si riceve una notifica se è disponibile un aggiornamento del set di dati. Un set di dati in genere si aggiorna quando il file di dati esistente viene sovrascritto dalla creazione di un nuovo file con lo stesso nome.
Suggerimenti e linee guida per il caricamento e la selezione dei set di dati
-
I set di dati possono essere caricati tramite la pagina Crea nel centro attività Analisi e sono visibili nel catalogo. È anche possibile caricare un nuovo set di dati direttamente nel catalogo dalla pagina di selezione del set di dati dell'esperimento. A tal fine, fare clic su Carica file e scegliere il file da caricare.
-
Qualsiasi file flat che può essere caricato e profilato in Qlik Cloud è supportato per l'uso in Qlik Predict.
Per i file a più tabelle, come i file Microsoft Excel con più fogli, verrà importata solo la prima tabella. Se la profilazione dei dati non riesce per una tabella (ad esempio, se è vuota), il file non è supportato.
Esecuzione della versione affinata
Al termine della configurazione della versione, è possibile eseguirla.
Procedere come indicato di seguito:
-
Fare clic su Esegui v2 nell'angolo in basso a destra dello schermo.
(Il testo sul pulsante dipende dal numero di versioni eseguite).
Confronto delle versioni dell'esperimento
Al termine dell'addestramento della nuova versione, confrontare la nuova versione con quella precedente per vedere l'effetto delle modifiche. Sono disponibili diverse opzioni per confrontare i modelli tra le versioni dell'esperimento.
Analisi rapida
Utilizzare le schede Modelli e Dati di addestramento nell'esperimento per confrontare la versione con le versioni precedenti. Nella scheda Modelli, è possibile:
-
Visualizzare i risultati nella tabella Metriche del modello.
-
Visualizzare i modelli consigliati in base ai requisiti comuni di analisi predittiva, inclusi l'accuratezza e la velocità di previsione.
-
Passare da un modello all'altro per visualizzare le differenze nel Riepilogo addestramento modello e in altri grafici generati automaticamente.
Per ulteriori informazioni sull'analisi rapida del modello, vedere Esecuzione di un'analisi rapida del modello.
Analisi approfondita
È possibile approfondire l'analisi del modello passando alle schede Confronta e Analizza nell'esperimento. Queste schede offrono un'esperienza di analisi integrata in cui è possibile valutare in modo interattivo i modelli a un livello più granulare.
La scheda Confronta offre il confronto dei punteggi del modello e degli iperparametri tra tutti i modelli. La scheda Analizza consente di concentrarsi su un modello specifico per valutare l'accuratezza della previsione, l'importanza della funzionalità e altri dettagli.
Per ulteriori informazioni, vedere Confronto dei modelli e Esecuzione di analisi dettagliate dei modelli.
Modifica delle impostazioni di ottimizzazione del modello
È possibile disattivare l'ottimizzazione intelligente dopo aver eseguito una versione in cui era attivata. Ciò consente di utilizzare le informazioni fornite dall'ottimizzazione intelligente, offrendo al contempo il controllo necessario per apportare modifiche minori e minime. In alternativa, è possibile attivare l'ottimizzazione intelligente del modello dopo aver eseguito una o più versioni con l'impostazione disattivata.
L'ottimizzazione degli iperparametri è un'impostazione che può essere utile attivare durante il processo di affinamento del modello. In genere, non è consigliabile attivare questa impostazione per la prima versione dell'esperimento.
È inoltre possibile scegliere se utilizzare o meno l'addestramento basato sul tempo o modificare la colonna utilizzata come indice della data.
Procedere come indicato di seguito:
-
Fare clic su Visualizza configurazione.
-
Se necessario, fare clic su Crea nuova versione per configurare una nuova versione dell'esperimento.
-
Nel pannello, espandere Ottimizzazione del modello.
-
Passare dalle impostazioni Intelligente a Manuale per attivare o disattivare l'ottimizzazione intelligente del modello.
-
Se si desidera attivare l'ottimizzazione degli iperparametri, selezionare la casella di controllo Ottimizzazione degli iperparametri e impostare un tempo massimo di addestramento.
-
Sotto Suddivisione test-addestramento basata sul tempo, è possibile modificare le impostazioni per l'addestramento basato sul tempo:
-
Per attivare l'addestramento basato sul tempo, modificare il valore predefinito di Nessuno selezionando una colonna Indice data specifica nel set di dati.
-
Per disattivare l'addestramento basato sul tempo, impostare Indice data sul valore Nessuno.
-
Modificare la colonna Indice data selezionata impostandone una diversa.
-
Eliminazione delle versioni dell'esperimento
È possibile eliminare le versioni dell'esperimento che non si desidera conservare. Tenere presente che verranno eliminati anche tutti i modelli nelle versioni dell'esperimento e non potranno essere recuperati.
Procedere come indicato di seguito:
-
Passare alla scheda Modelli.
-
Nella tabella Metriche del modello, selezionare un modello dalla versione dell'esperimento che si desidera eliminare.
Nota di suggerimentoÈ anche possibile selezionare un modello quando ci si trova nelle schede Dati di addestramento o Analizza, utilizzando il menu a discesa nella barra degli strumenti. -
In basso a destra, fare clic su Elimina <numero versione>.
-
Nella finestra di dialogo di conferma, fare clic su Elimina.