Affinamento dei modelli
Una volta creati i primi modelli, è importante perfezionarli per aumentarne l'efficacia e la potenziale precisione. I punteggi del modello indicano diverse misure di questa performance. Sebbene l'obiettivo di perfezionare i modelli sia quello di aumentare questi punteggi, un punteggio più alto non sempre indica un modello migliore.
È possibile perfezionare i modelli escludendo o includendo funzioni o modificando i dati di addestramento e altri parametri di configurazione. Durante tali operazioni, è possibile confrontare le diverse versioni, per vedere l'effetto delle modifiche.
Interpretando i punteggi, si imparerà a perfezionare il modello. I valori delle diverse metriche possono fornire informazioni strategiche sulle azioni da intraprendere per migliorare i risultati.
Requisiti e autorizzazioni
Per maggiori informazioni sui requisiti utente per l'utilizzo degli esperimenti di ML, vedere Utilizzo degli esperimenti.
Configurazione di una nuova versione
Dopo aver eseguito una versione dell'esperimento, è possibile affinare e perfezionare i modelli, se richiesto, creando una nuova versione.
Procedere come indicato di seguito:
-
Dalla scheda Dati, Modelli o Analizza, selezionare il modello da utilizzare come base per la versione successiva.
-
Fare clic su Visualizza configurazione.
Viene visualizzato il pannello di configurazione dell'esperimento.
-
Fare clic su Nuova versione.
Una volta creata una nuova versione, è possibile apportare modifiche alla configurazione, come ad esempio:
-
Escludere funzioni esistenti
-
Includere funzioni escluse precedentemente
-
Modificare o aggiornare il set di dati
-
Selezionare o deselezionare algoritmi
Ulteriori informazioni su queste opzioni sono fornite nelle sezioni sottostanti.
Quando si crea una bozza di una nuova versione, fare clic sull'icona del filtro in Funzioni nel pannello di configurazione dell'esperimento. Quando si utilizzano i filtri, è possibile visualizzare più facilmente le funzioni introdotte dalla modifica del training set. È possibile inoltre visualizzare quali funzione sono state progettate automaticamente e quali no.
Miglioramento del set di di dati
Se il modello non ottiene un buon punteggio, è opportuno rivedere il set di di dati per risolvere eventuali problemi. Ulteriori informazioni su come migliorare il set di di dati sono riportate in Preparazione del set di dati per il training.
Esclusione di funzioni
Un maggior numero di funzioni non significa necessariamente un modello migliore. Per affinare il modello, è preferibile escludere le funzioni inaffidabili e irrilevanti, come ad esempio:
-
Funzioni con correlazione troppo elevata. Tra due funzioni correlate, escludere quella con minore importanza.
-
Funzioni con importanza troppo bassa. Queste funzioni non hanno alcuna influenza su ciò che si sta cercando di imparare.
-
Funzioni con importanza troppo elevata. Ciò potrebbe essere dovuto a una perdita di dati.
Testare rimuovendo la funzione dai dati di training, quindi eseguire nuovamente l'addestramento e verificare se questo migliora il modello. Fa una grande differenza o non cambia nulla per il punteggio del modello?
Procedere come indicato di seguito:
-
Aprire un esperimento dal Catalogo.
-
Dalla scheda Dati, Modelli o Analizza, selezionare il modello da utilizzare come base per la versione successiva.
-
Fare clic su Visualizza configurazione.
Viene visualizzato il pannello di configurazione dell'esperimento.
-
Fare clic su Nuova versione per configurare una nuova versione dell'esperimento.
-
Sotto Funzioni, rimuovere il segno di spunta dalle caselle per qualsiasi funzione che non si desidera usare nell'addestramento.
Aggiunta di funzioni
Se il modello non ottiene ancora un buon punteggio, potrebbe essere perché le funzioni che hanno una relazione con la destinazione non sono ancora state acquisite nel set di dati. È possibile elaborare nuovamente e cambiare ambito per il set di dati per ottimizzare la qualità dei dati, oltre ad aggiungere nuove funzioni e informazioni. Una volta terminato, è possibile aggiungere il nuovo set di dati alle versioni successive dell'esperimento. Vedere Modificare e aggiornare il set di dati.
Sono disponibili maggiori informazioni su come acquisire o progettare nuove funzionalità in Creazione di nuove colonne di funzioni.
Selezione degli algoritmi
In base al tipo di dati della colonna di destinazione, vengono selezionati automaticamente gli algoritmi adatti per il training. Si potrebbero escludere gli algoritmi che non funzionano bene o che sono più lenti. In questo modo non si dovrà perdere tempo con loro per il training.
Per ulteriori informazioni sulla scelta degli algoritmi, vedere Nozioni sugli algoritmi dei modelli.
Procedere come indicato di seguito:
-
Aprire un esperimento dal Catalogo.
-
Dalla scheda Dati, Modelli o Analizza, selezionare il modello da utilizzare come base per la versione successiva.
-
Fare clic su Visualizza configurazione.
Viene visualizzato il pannello di configurazione dell'esperimento.
-
Fare clic su Nuova versione per configurare una nuova versione dell'esperimento.
-
Sotto Algoritmi, deselezionare le caselle di controllo degli algoritmi che non si desidera utilizzare nel training.
Modificare e aggiornare il set di dati
Se i dati di addestramento sono cambiati dall'ultima versione dell'esperimento, è possibile modificare o aggiornare il set di dati per le versioni successive.
Questo può rivelarsi utile se si desidera confrontare metriche e prestazioni del modello per differenti set di dati nello stesso esperimento. Per esempio, questa operazione è utile nei seguenti casi:
-
Se sono disponibili nuovi record o se sono stati apportati aggiornamenti ai record del set di dati originale. Per esempio, le transazioni del mese precedente potrebbero diventare disponibili ed essere adeguate per l'utilizzo nell'addestramento; oppure potrebbe essere identificato o risolto un problema per una raccolta di dati.
-
Se il training set originale è stato rielaborato o riutilizzato, magari allo scopo di migliorare l'addestramento del modello. Per esempio, può essere stata migliorata la logica per definire i valori di colonna delle funzioni, o potrebbero persino essere state aggiunte nuove colonne per le funzioni.
La modifica o l'aggiornamento del set di dati non altera i modelli esistenti che sono già stati addestrati da versioni precedenti dell'esperimento. All'interno di una versione dell'esperimento, i modelli vengono addestrati solo utilizzando i dati di addestramento definiti in quella versione specifica.
Requisiti
Quando si modifica o si aggiorna il set di dati per una nuova versione dell'esperimento, il nuovo set di dati deve seguire i seguenti requisiti:
-
Il nome e il tipo di funzione della colonna di destinazione devono essere gli stessi della destinazione utilizzata nel set di dati di addestramento originale.
- Il numero di valori distinti nella colonna di destinazione deve essere compreso nello stesso intervallo richiesto per quel tipo di esperimento. Per esempio, nel caso di un esperimento di classificazione multiclasse, la colonna di destinazione nel nuovo set di dati deve ancora avere tra tre e dieci valori univoci. Per gli intervalli specifici, vedere Determinazione del tipo di modello creato.
Le altre colonne per la funzione possono essere completamente nuove, avere nomi diversi e contenere dati differenti.
Modifica del set di dati
Procedere come indicato di seguito:
-
Dalla scheda Dati, Modelli o Analizza, selezionare il modello da utilizzare come base per la versione successiva.
-
Fare clic su Visualizza configurazione.
Viene visualizzato il pannello di configurazione dell'esperimento.
-
Fare clic su Nuova versione per configurare una nuova versione dell'esperimento.
-
In Dati di training, fare clic su Modifica set di dati.
-
Selezionare o caricare il nuovo set di dati.
Aggiornamento del set di dati
Procedere come indicato di seguito:
-
Dalla scheda Dati, Modelli o Analizza, selezionare il modello da utilizzare come base per la versione successiva.
-
Fare clic su Visualizza configurazione.
Viene visualizzato il pannello di configurazione dell'esperimento.
-
Fare clic su Nuova versione per configurare una nuova versione dell'esperimento.
-
In Dati di training, fare clic su Aggiorna set di dati.
Quando è disponibile un aggiornamento per il set di dati, si riceve una notifica. Gli aggiornamenti per i set di dati di norma sono disponibili quando il file di dati esistente viene sovrascritto dalla creazione di un nuovo file con lo stesso nome.
Esecuzione della versione ottimizzata
Una volta completata la configurazione della versione, è possibile eseguirla.
Procedere come indicato di seguito:
-
Fare clic su Esegui v2 nell'angolo in basso a destra dello schermo.
(Il testo sul pulsante dipende dal numero di versioni eseguite.)
Confronto tra le versioni dell'esperimento
Una volta completato l'addestramento della nuova versione, confrontare la nuova versione con quella anteriore per visualizzare l'effetto delle modifiche apportate. È disponibile una serie di opzioni per il confronto dei modelli nelle diverse versioni dell'esperimento.
Analisi rapida
Utilizzare le schede Modelli e Dati nell'esperimento per confrontare la versione con quelle anteriori. Nella scheda Modelli, è possibile fare quanto segue:
-
Visualizzare i risultati nella tabella Metriche modello.
-
Passare tra modelli differenti per visualizzare le differenze nel Riepilogo addestramento modello e in altri grafici generati automaticamente.
Per maggiori informazioni sull'analisi rapida del modello, vedere Esecuzione di analisi rapide dei modelli.
Analisi dettagliata
È possibile eseguire analisi dettagliate del modello passando alle schede Confronta e Analizza nell'esperimento. Queste schede forniscono analisi integrate dove è possibile valutare in modo interattivo i modelli a un livello più granulare.
La scheda Confronta consente di confrontare i punteggi del modello e gli iperparametri in tutti i modelli. La scheda Analizza consente di concentrarsi su un modello specifico per valutare l'accuratezza della previsione, l'importanza della funzione e altri dettagli.
Per ulteriori informazioni, vedere Confronto dei modelli e Esecuzione di analisi dettagliate dei modelli.
Modifica delle impostazioni di ottimizzazione del modello
È possibile disattivare l'ottimizzazione intelligente dopo aver eseguito una versione nella quale è stata attivata. Ciò consente di utilizzare le informazioni strategiche fornite dall'ottimizzazione intelligente, fornendo allo stesso tempo il controllo necessario per apportare correzioni minori o di lieve entità. In alternativa, è possibile attivare l'ottimizzazione intelligente del modello dopo aver eseguito una o più versioni con l'impostazione disattivata.
L'ottimizzazione degli iperparametri è un'impostazione che può essere utile da attivare durante il processo di affinamento del modello. In genere, si sconsiglia di attivare questa impostazione per la prima versione dell'esperimento.
È inoltre possibile selezionare se utilizzare o meno l'addestramento sensibile ai valori temporali o cambiare la colonna utilizzata come indicizzazione della data.
Procedere come indicato di seguito:
Fare clic su Visualizza configurazione.
Se necessario, fare clic su Nuova versione per configurare una nuova versione dell'esperimento.
Nel pannello, espandere Ottimizzazione modello.
Passare tra le impostazioni Intelligente e Manuale per attivare o disattivare l'ottimizzazione intelligente del modello.
Se si desidera attivare l'ottimizzazione degli iperparametri, fare clic sulla casella di selezione Ottimizzazione iperparametro e impostare un intervallo di tempo massimo per l'addestramento.
Nella sezione Suddivisione training-test in base al tempo, è possibile modificare le impostazioni per l'addestramento sensibile ai valori temporali:
Per attivare l'addestramento sensibile ai valori temporali, cambiare il valore predefinito di Nessuno selezionando una specifica colonna Indicizzazione data nel set di dati.
Per disattivare l'addestramento sensibile ai valori temporali, impostare Indicizzazione data sul valore Nessuno.
Cambiare la colonna Indicizzazione data selezionata in un'altra colonna.
Eliminazione delle versioni degli esperimenti
È possibile eliminare le versioni di esperimenti che non si desidera conservare. Si noti che anche tutti i modelli delle versioni sperimentali verranno eliminati e non potranno essere recuperati.
Procedere come indicato di seguito:
Passare alla scheda Modelli.
Nella tabella Metriche del modello, selezionare un modello della versione dell'esperimento che si desidera eliminare.
Nota di suggerimentoÈ possibile anche selezionare un modello dalle schede Dati o Analizza utilizzando il menu a discesa nella barra degli strumenti.In basso a destra, fare clic su Elimina <numero versione>.
Nella finestra di dialogo di conferma, fare clic su Elimina.