Configurazione degli esperimenti
La configurazione degli esperimenti consiste nella selezione del target e delle funzionalità che il modello utilizzerà per prevedere il target. È inoltre possibile configurare una serie di impostazioni opzionali.
Per supportare l'utente nella selezione di un target, il set di dati storico viene analizzato e vengono visualizzate statistiche di riepilogo su ciascuna colonna nel set di dati. Diversi passaggi di pre-elaborazione automatica vengono applicati al set di dati per assicurarsi che vengano inclusi solo dati idonei. Per ulteriori dettagli sulla pre-elaborazione dei dati, vedere Preparazione e trasformazione automatica dei dati.
Dopo aver eseguito la v1, è possibile creare nuove versioni dell'esperimento, se necessario, per perfezionare ulteriormente l'addestramento del modello. Per ulteriori informazioni, vedere Affinamento dei modelli.
Requisiti e autorizzazioni
Per ulteriori informazioni sui requisiti utente per lavorare con gli esperimenti ML, vedere Lavorare con gli esperimenti.
L'interfaccia
Le sezioni seguenti descrivono come navigare nell'interfaccia dell'esperimento per configurare l'esperimento. Per ulteriori informazioni sull'interfaccia, vedere Navigazione nell'interfaccia dell'esperimento.
Navigazione a schede
Quando si crea un esperimento, si apre la scheda Configurazione. Qui è possibile configurare il target e le funzionalità per l'esperimento.
Dopo aver eseguito almeno una versione dell'esperimento, la scheda Configurazione diventa Dati di addestramento. Diventano disponibili anche altre schede. Queste altre schede consentono di analizzare i modelli appena addestrati nella versione. Se è necessario configurare versioni successive con selezioni di funzionalità diverse, è possibile tornare alla scheda Dati di addestramento.
Vista schema e Vista dati
Nella scheda Configurazione/Dati di addestramento, è possibile alternare tra le seguenti viste:
-
Vista schema: La vista predefinita. In questa vista, ogni colonna nel set di dati è rappresentata da una riga nello schema con informazioni e statistiche.
-
Vista dati: Una vista alternativa che è possibile utilizzare per accedere a ulteriori informazioni e dati campione per ciascuna colonna.
Vista schema in un esperimento ML

Vista dati in un esperimento ML

Pannello di configurazione dell'esperimento
Nel pannello di configurazione dell'esperimento, è possibile personalizzare ulteriormente l'addestramento dell'esperimento. Questo pannello è aperto per impostazione predefinita nei nuovi esperimenti.
Dopo aver eseguito una versione, fare clic su Visualizza configurazione per aprire il pannello per configurare la versione successiva.
Con il pannello di configurazione dell'esperimento, è possibile:
-
Selezionare un target e il tipo di esperimento
-
Impostare un nome per la versione
-
Aggiungere o rimuovere funzionalità
-
Configurare una nuova versione dell'esperimento
-
Visualizzare il tipo di modello che si sta addestrando
-
Selezionare per modificare o aggiornare il dataset di addestramento
-
Aggiungere o rimuovere algoritmi
-
Modificare le impostazioni di ottimizzazione del modello
-
Per i modelli di serie temporali, impostare le impostazioni di previsione
-
Configurare il rilevamento dei bias
Pannello di configurazione dell'esperimento

Selezione del target e del tipo di esperimento
È possibile modificare la colonna target e il tipo di esperimento fino all'inizio del primo addestramento. Successivamente, sono bloccati per la modifica.
La colonna target contiene i valori che si desidera che il modello di machine learning preveda.
Il tipo di esperimento è determinato dal target e dal tipo di dati che contiene. Il tipo di esperimento definisce quale tipo di modello si desidera addestrare. Potrebbero essere disponibili le seguenti opzioni:
-
Classificazione binaria: Addestra i modelli a prevedere un target che ha due possibili valori (ad esempio, sì o no). I dati possono essere di qualsiasi tipo di funzionalità.
-
Classificazione multiclasse: Addestra i modelli a prevedere un target con 3-10 possibili valori (ad esempio, un elenco di categorie). I dati possono essere di qualsiasi tipo di funzionalità, ma una colonna con più di 10 classi (valori) distinte e non numeriche non è selezionabile come target.
-
Regressione: Addestra i modelli a prevedere un target con più di 10 possibili valori, in particolare, un target con tipo di funzionalità numerico.
-
Serie temporale: Addestra i modelli a prevedere i valori target per periodi di tempo futuri specifici, sfruttando i dati storici. Il target deve avere più di 10 valori distinti e avere dati numerici. Per ulteriori informazioni, vedere Utilizzo degli esperimenti sulle serie temporali.
Procedere come indicato di seguito:
-
In
Vista schema o
Vista dati, passare il mouse sopra la colonna.
-
Fare clic sull'icona
che appare.
La colonna target è ora indicata da
e le altre colonne disponibili vengono selezionate automaticamente come funzionalità.
Selezione del target in Vista schema

-
Nel pannello di configurazione dell'esperimento, in Impostazioni esperimento, è possibile modificare il target prima dell'addestramento, se necessario.
Quando il target e il tipo di esperimento sono selezionati, è possibile iniziare a eseguire la prima versione dell'esperimento. Ulteriori informazioni in Addestramento degli esperimenti. A questo punto è possibile eseguire una configurazione aggiuntiva, descritta di seguito, o regolare la configurazione dopo aver esaminato i risultati dell'addestramento.
Le spiegazioni su come i dati vengono interpretati ed elaborati vengono mostrate man mano che l'addestramento dell'esperimento continua. Per ulteriori informazioni, vedere Interpretazione degli insight del dataset.
Selezione delle colonne delle funzionalità
Con il target impostato, è possibile scegliere quali delle altre colonne disponibili includere nell'addestramento del modello. Escludere eventuali funzionalità che non si desidera facciano parte del modello. Si noti che la colonna rimarrà nel set di dati ma non verrà utilizzata dall'algoritmo di addestramento.
Nella parte superiore del pannello di configurazione dell'esperimento, è possibile visualizzare il numero di celle nel set di dati. Se il numero supera il limite del set di dati, è possibile escludere le funzionalità per scendere al di sotto del limite.
È possibile selezionare le colonne delle funzionalità in vari modi:
In Vista schema e Vista dati
Nelle viste principali, è possibile:
-
Deselezionare Includi tutte le funzionalità disponibili e quindi selezionare solo quelle che si desidera includere.
-
Deselezionare manualmente le caselle di controllo per le funzionalità che non si desidera includere.
-
Effettuare una ricerca ed escludere o includere tutte le funzionalità nel risultato della ricerca filtrato.
Nel pannello di configurazione dell'esperimento
Nel pannello di configurazione dell'esperimento, è possibile:
-
Deselezionare manualmente le caselle di controllo per le funzionalità che non si desidera includere.
-
Dopo aver eseguito la prima versione dell'esperimento, è possibile definire il Numero di funzionalità principali da includere.
Sezione Funzionalità nel pannello di configurazione dell'esperimento

Quando si selezionano le funzionalità, viene loro assegnato automaticamente un tipo di funzionalità. I possibili tipi di funzionalità sono:
-
Categoriale
-
Numerico
-
Data
-
Testo libero
Il tipo di funzionalità viene assegnato in base ai dati contenuti nella colonna della funzionalità. Se una funzionalità soddisfa determinati criteri, potrebbe essere selezionata per diventare la base per le funzionalità auto-ingegnerizzate. Se lo si desidera, è possibile modificare se la funzionalità viene utilizzata per l'ingegneria automatica delle funzionalità. Per i dettagli completi sull'ingegneria automatica delle funzionalità, vedere Ingegneria automatica delle funzionalità.
Alcune colonne nel set di dati potrebbero non essere selezionabili come funzionalità per l'esperimento o potrebbero avere un'elaborazione specifica applicata ad esse. Le spiegazioni su come i dati vengono interpretati ed elaborati vengono mostrate durante la navigazione nell'addestramento dell'esperimento. Per ulteriori informazioni, vedere Interpretazione degli insight del dataset.
Configurazione del rilevamento dei bias
È possibile attivare il rilevamento dei bias per le funzionalità contenenti dati sensibili. Il rilevamento dei bias viene eseguito quando si esegue l'esperimento. È inoltre possibile fare clic su Ottieni raccomandazioni per utilizzare l'IA generativa per scansionare i dati di addestramento alla ricerca di funzionalità potenzialmente sensibili prima di eseguire il rilevamento dei bias.
Il rilevamento dei bias determina se la funzionalità aumenta la probabilità del modello di promuovere risultati ingiusti nelle sue previsioni o se i dati di origine sono intrinsecamente distorti.
Procedere come indicato di seguito:
-
In un esperimento ML, espandi Bias nel pannello di configurazione dell'addestramento.
-
Prima di selezionare le funzionalità per il rilevamento del bias, fare clic facoltativamente su Ottieni consigli per utilizzare l'IA generativa per suggerire funzionalità che potrebbero contenere dati distorti. Vedere Utilizzo dell'IA generativa per raccomandare funzionalità per il rilevamento dei bias.
-
Selezionare o deselezionare le funzionalità per le quali si desidera eseguire il rilevamento del bias.
In alternativa, attiva il rilevamento del bias per le funzionalità desiderate nella vista Schema.
Per ulteriori informazioni sul rilevamento dei bias, vedere Rilevamento dei bias nei modelli di machine learning.
Selezione degli algoritmi
Tutti gli algoritmi disponibili sono inclusi per impostazione predefinita ed è possibile escludere eventuali algoritmi che non si desidera utilizzare. Normalmente, si farebbe questo come parte del perfezionamento del modello quando si sono visti i primi risultati dell'addestramento. Ulteriori informazioni in Affinamento dei modelli.
Sezione Algoritmi nel pannello di configurazione dell'esperimento
Modifica dei tipi di funzionalità
Quando viene caricato un set di dati, le colonne vengono trattate come categoriali, numeriche, data o testo libero in base al tipo di dati e ad altre caratteristiche. In alcuni casi, si potrebbe voler modificare questa impostazione.
Ad esempio, se i giorni della settimana sono rappresentati dai numeri 1-7, ogni numero rappresenta un valore categoriale. Per impostazione predefinita, viene trattato come un valore numerico classificato continuo, quindi sarebbe necessario modificare manualmente la configurazione per trattarlo come categoriale.
Quando una colonna viene identificata come contenente informazioni su data e ora, viene utilizzata come base per nuove funzionalità auto-ingegnerizzate generate. Quando ciò accade, la colonna originale (la funzionalità padre) viene trattata come avente il tipo di funzionalità data.
È possibile modificare la funzionalità padre da una funzionalità data a una funzionalità categoriale o numerica. Ad esempio, questo è utile quando una funzionalità viene identificata come data, ma è necessario che venga trattata come stringa o numero. Quando si esegue questa operazione, non è più possibile utilizzare le sue funzionalità auto-ingegnerizzate nell'addestramento dell'esperimento.
Procedere come indicato di seguito:
-
In
Vista schema, individuare la funzionalità.
-
Nella colonna Tipo di funzionalità per questa funzionalità, fare clic su
.
-
Selezionare un valore nell'elenco.
In alternativa, è possibile modificare i tipi di funzionalità da Vista dati. Individuare la funzionalità, quindi fare clic su
accanto al tipo di funzionalità corrente. Selezionare un valore nell'elenco.
Previsione delle serie temporali
Se si sta addestrando un esperimento di serie temporali, alcune trasformazioni del tipo di funzionalità vengono applicate automaticamente a seconda della configurazione. Ad esempio, se si selezionano gruppi da utilizzare per la previsione multivariata, i tipi di funzionalità di questi gruppi vengono automaticamente passati a categoriali.
Impatto sulle previsioni
Quando si modifica manualmente il tipo di funzione e quindi si distribuisce il modello risultante, le sostituzioni del tipo di funzione verranno applicate alla funzione nel set di dati di applicazione utilizzato nelle previsioni fatte con quel modello.
Modifica del set di dati
È possibile modificare il set di dati di addestramento prima di eseguire la prima versione dell'esperimento, nonché dopo aver eseguito qualsiasi versione.
Se si modifica il set di dati prima di eseguire la prima versione, si perderà qualsiasi configurazione eseguita prima della modifica del set di dati.
Procedere come indicato di seguito:
-
Nel pannello di configurazione dell'esperimento in Dati di addestramento > Rivedi set di dati, fare clic su Modifica set di dati.
-
Selezionare un nuovo set di dati.
Per ulteriori informazioni sulla modifica e l'aggiornamento del set di dati durante il perfezionamento del modello (dopo aver eseguito una versione dell'esperimento), vedere Modifica e aggiornamento del set di dati.
Configurazione dell'ottimizzazione del modello
Se il tipo di esperimento è classificazione binaria, classificazione multiclasse o regressione, è possibile regolare le seguenti impostazioni per ottimizzare i modelli:
-
Attivazione o disattivazione dell'ottimizzazione intelligente del modello
-
Attivazione o disattivazione dell'ottimizzazione degli iperparametri
-
Attivazione o disattivazione dell'addestramento sensibile al tempo
Queste opzioni possono essere attivate o disattivate per ogni versione dell'esperimento che si esegue.
Sezione Ottimizzazione del modello nel pannello di configurazione dell'esperimento
Configurazione dell'ottimizzazione intelligente
Per impostazione predefinita, l'esperimento utilizza l'ottimizzazione intelligente del modello. Con l'ottimizzazione intelligente del modello, Qlik Predict gestisce il processo di perfezionamento del modello per l'utente iterando la selezione delle funzionalità e applicando trasformazioni avanzate ai dati.
Per ulteriori informazioni sull'ottimizzazione intelligente, vedere Ottimizzazione intelligente del modello.
È possibile disattivare questa impostazione per perfezionare manualmente i modelli che si addestrano. Ad esempio, si potrebbe voler iniziare l'addestramento del modello con l'ottimizzazione intelligente del modello, quindi passare al perfezionamento manuale per la v2 per regolare ulteriormente la configurazione.
Procedere come indicato di seguito:
-
Fare clic su
Visualizza configurazione.
-
Se è già stata eseguita almeno una versione dell'esperimento, fare clic su Nuova versione.
-
Nel pannello, espandere Ottimizzazione del modello.
-
Passare da Intelligente a Manuale.
-
Utilizzando il dispositivo di scorrimento, impostare la durata massima di esecuzione per l'addestramento.
Configurazione dell'ottimizzazione degli iperparametri
È possibile ottimizzare i modelli utilizzando l'ottimizzazione degli iperparametri. Si noti che questa è un'opzione avanzata che potrebbe aumentare significativamente il tempo di addestramento. L'ottimizzazione degli iperparametri è disponibile se si disattiva l'ottimizzazione intelligente.
Per ulteriori informazioni, vedere Ottimizzazione degli iperparametri.
Procedere come indicato di seguito:
-
Fare clic su
Visualizza configurazione.
-
Se è già stata eseguita almeno una versione dell'esperimento, fare clic su Nuova versione.
-
Nel pannello, espandere Ottimizzazione del modello.
-
Passare da Intelligente a Manuale.
-
Selezionare la casella di controllo Ottimizzazione degli iperparametri.
-
Facoltativamente, impostare un limite di tempo per l'ottimizzazione. Il limite di tempo predefinito è un'ora.
Configurazione dell'addestramento sensibile al tempo
Se si desidera che i modelli vengano addestrati tenendo conto di una dimensione di serie temporale, attivare l'addestramento sensibile al tempo per la versione dell'esperimento. Per utilizzare questa opzione, è necessario disporre di una colonna nel set di dati che contenga le informazioni pertinenti sulle serie temporali.
Quando l'addestramento sensibile al tempo è attivato, Qlik Predict utilizza processi specializzati di convalida incrociata e imputazione nulla per addestrare i modelli.
Per ulteriori informazioni, vedere Creazione di modelli sensibili ai valori temporali e Convalida incrociata basata sul tempo.
Procedere come indicato di seguito:
-
Fare clic su
Visualizza configurazione.
-
Se è già stata eseguita almeno una versione dell'esperimento, fare clic su Nuova versione.
-
Nel pannello, espandere Ottimizzazione del modello.
-
In Divisione test-addestramento basata sul tempo, selezionare l'Indice data da utilizzare per l'ordinamento dei dati.
Visualizzazione di informazioni dettagliate sui dati di addestramento
Nella scheda Configurazione/Dati di addestramento dell'esperimento, è possibile visualizzare informazioni dettagliate sulla gestione dei dati di addestramento. Queste informazioni sono disponibili nella colonna Informazioni dettagliate in Vista schema. Le informazioni mostrate dipendono dal fatto che sia stata eseguita o meno una versione con i dati di addestramento correnti. Le modifiche nella colonna Informazioni dettagliate possono aiutare a identificare il motivo per cui le funzionalità potrebbero non essere disponibili per l'uso o il motivo per cui sono state eliminate automaticamente.
Per ulteriori informazioni sul significato di ciascuna informazione dettagliata, vedere Interpretazione degli insight del dataset.