Configurazione degli esperimenti

La configurazione degli esperimenti consiste nella selezione della destinazione e delle funzionalità che il modello utilizzerà per prevedere la destinazione. È inoltre possibile configurare una serie di impostazioni opzionali.

Per supportarti nella selezione di una destinazione, il set di dati storico viene analizzato e vengono visualizzate statistiche di riepilogo su ciascuna colonna nel set di dati. Diversi passaggi di pre-elaborazione automatica vengono applicati al set di dati per assicurarsi che vengano inclusi solo dati idonei. Per ulteriori dettagli sulla pre-elaborazione dei dati, vedere Preparazione e trasformazione automatica dei dati.

Dopo aver eseguito la v1, è possibile creare nuove versioni dell'esperimento, se necessario, per perfezionare ulteriormente l'addestramento del modello. Per ulteriori informazioni, vedere Affinamento dei modelli.

Requisiti e autorizzazioni

Per ulteriori informazioni sui requisiti utente per lavorare con gli esperimenti ML, vedere Lavorare con gli esperimenti.

L'interfaccia

Le seguenti sezioni descrivono come navigare nell'interfaccia dell'esperimento per configurare l'esperimento. Per ulteriori informazioni sull'interfaccia, vedere Navigazione nell'interfaccia dell'esperimento.

Navigazione a schede

Quando si crea un esperimento, si apre la scheda Configurazione. Qui è possibile configurare la destinazione e le funzionalità per l'esperimento.

Dopo aver eseguito almeno una versione dell'esperimento, la scheda Configurazione diventa Dati di addestramento. Diventano disponibili anche altre schede. Queste altre schede consentono di analizzare i modelli appena addestrati nella versione. Se è necessario configurare versioni successive con diverse selezioni di funzionalità, è possibile tornare alla scheda Dati di addestramento.

Vista schema e Vista dati

Nella scheda Configurazione/Dati di addestramento, è possibile alternare tra Righe Vista schema e Profilo Vista dati.

Vista schema

Righe Vista schema è la vista predefinita. In questa vista, ogni colonna nel set di dati è rappresentata da una riga nello schema con informazioni e statistiche.

È possibile:

Selezionare le funzionalità da includere nell'esperimento.
Visualizzare i dettagli su ciascuna colonna, come il tipo di dati e il tipo di funzionalità.
Visualizzare informazioni dettagliate sulle colonne, ad esempio perché non possono essere selezionate o come verranno elaborate durante l'addestramento.

Fare clic su Sposta colonna

per personalizzare le informazioni nella tabella. Ad esempio, è possibile nascondere determinate colonne per ridurre le informazioni visualizzate.

Vista dati

Profilo Vista dati è una vista alternativa che è possibile utilizzare per accedere a ulteriori informazioni e dati campione per ciascuna colonna.

Pannello di configurazione dell'esperimento

Nel pannello di configurazione dell'esperimento, è possibile personalizzare ulteriormente l'addestramento dell'esperimento. Questo pannello è aperto per impostazione predefinita nei nuovi esperimenti.

Dopo aver eseguito una versione, fare clic su Controlli Visualizza configurazione per aprire il pannello per configurare la versione successiva.

Con il pannello di configurazione dell'esperimento, è possibile:

Selezionare un target e il tipo di esperimento
Impostare un nome per la versione
Aggiungere o rimuovere funzionalità
Configurare una nuova versione dell'esperimento
Visualizzare il tipo di modello che si sta addestrando
Selezionare per modificare o aggiornare il dataset di addestramento
Aggiungere o rimuovere algoritmi
Modificare le impostazioni di ottimizzazione del modello
Per i modelli di serie temporali, impostare le impostazioni di previsione
Configurare il rilevamento dei bias

Pannello di configurazione dell'esperimento con target selezionato, tipo di esperimento e selezione delle funzionalità predefinita — Pannello di configurazione dell'esperimento

Selezione della destinazione e del tipo di esperimento

È possibile modificare la colonna di destinazione e il tipo di esperimento fino all'inizio del primo addestramento. Successivamente, sono bloccati per la modifica.

La colonna di destinazione contiene i valori che si desidera che il modello di machine learning preveda.

Il tipo di esperimento è determinato dalla destinazione e dal tipo di dati che contiene. Il tipo di esperimento definisce quale tipo di modello si desidera addestrare. Potrebbero essere disponibili le seguenti opzioni:

Classificazione binaria: addestra i modelli a prevedere una destinazione che ha due valori possibili (ad esempio, sì o no). I dati possono essere di qualsiasi tipo di funzionalità.
Classificazione multiclasse: addestra i modelli a prevedere una destinazione con 3-10 valori possibili (ad esempio, un elenco di categorie). I dati possono essere di qualsiasi tipo di funzionalità, ma una colonna con più di 10 classi (valori) distinte e non numeriche non è selezionabile come destinazione.
Regressione: addestra i modelli a prevedere una destinazione con più di 10 valori possibili, in particolare, una destinazione con tipo di funzionalità numerica.
Serie temporale: addestra i modelli a prevedere i valori di destinazione per periodi di tempo futuri specifici, sfruttando i dati storici. La destinazione deve avere più di 10 valori distinti e avere dati numerici. Per ulteriori informazioni, vedere Utilizzo degli esperimenti sulle serie temporali.

Procedere come indicato di seguito:

In Vista schema o Vista dati, fare clic sul pulsante di opzione per una colonna.

La colonna di destinazione è ora indicata da e le altre colonne disponibili vengono selezionate automaticamente come funzionalità.

Selezione della destinazione in Vista schema

Nel pannello di configurazione dell'esperimento, in Impostazioni esperimento, è possibile modificare la destinazione prima dell'addestramento, se necessario.

Impostazioni esperimento può contenere un selettore Tipo di esperimento. Ad esempio, se la previsione delle serie temporali è possibile per il set di dati e la destinazione, è disponibile un'opzione per modificare il tipo di esperimento da Regressione a Serie temporale.

Quando la destinazione e il tipo di esperimento sono selezionati, è possibile iniziare a eseguire la prima versione dell'esperimento. Ulteriori informazioni in Addestramento degli esperimenti. A questo punto è possibile eseguire una configurazione aggiuntiva, descritta di seguito, o regolare la configurazione dopo aver esaminato i risultati dell'addestramento.

Le spiegazioni su come i dati vengono interpretati ed elaborati vengono mostrate man mano che l'addestramento dell'esperimento continua. Per ulteriori informazioni, vedere Interpretazione degli insight del dataset.

Selezione delle colonne delle funzionalità

Con la destinazione impostata, è possibile scegliere quali delle altre colonne disponibili includere nell'addestramento del modello. Escludere eventuali funzionalità che non si desidera facciano parte del modello. Si noti che la colonna rimarrà nel set di dati ma non verrà utilizzata dall'algoritmo di addestramento.

Nella parte superiore del pannello di configurazione dell'esperimento, è possibile visualizzare il numero di celle nel set di dati. Se il numero supera il limite del set di dati, è possibile escludere le funzionalità per scendere al di sotto del limite.

È possibile selezionare le colonne delle funzionalità in vari modi:

In Vista schema e Vista dati

Nelle viste principali, è possibile:

Deselezionare Includi tutte le funzionalità disponibili e quindi selezionare solo quelle che si desidera includere.
Deselezionare manualmente le caselle di controllo per le funzionalità che non si desidera includere.
Effettuare una ricerca ed escludere o includere tutte le funzionalità nel risultato della ricerca filtrato.

In queste viste, ogni colonna ha un'icona accanto per fornire ulteriori informazioni:

: la funzionalità è inclusa, o può essere inclusa, nell'esperimento.
: la funzionalità è esclusa dall'esperimento. A volte può essere inclusa, ma in genere non è consigliato.
: la funzionalità non può essere inclusa nell'esperimento.

Nel pannello di configurazione dell'esperimento

Nel pannello di configurazione dell'esperimento, è possibile:

Deselezionare manualmente le caselle di controllo per le funzionalità che non si desidera includere.
Dopo aver eseguito la prima versione dell'esperimento, è possibile definire il Numero di funzionalità principali da includere.

Sezione Funzionalità nel pannello di configurazione dell'esperimento Qlik Predict — Sezione Funzionalità nel pannello di configurazione dell'esperimento

Quando si selezionano le funzionalità, viene loro assegnato automaticamente un tipo di funzionalità. I possibili tipi di funzionalità sono:

Categoriale
Numerico
Data
Testo libero

Il tipo di funzionalità viene assegnato in base ai dati contenuti nella colonna della funzionalità. Se una funzionalità soddisfa determinati criteri, potrebbe essere selezionata per diventare la base per le funzionalità ingegnerizzate automaticamente. Se lo si desidera, è possibile modificare se la funzionalità viene utilizzata per l'ingegneria automatica delle funzionalità. Per i dettagli completi sull'ingegneria automatica delle funzionalità, vedere Ingegneria automatica delle funzionalità.

Alcune colonne nel set di dati potrebbero non essere selezionabili come funzionalità per l'esperimento o potrebbero avere un'elaborazione specifica applicata ad esse. Le spiegazioni su come i dati vengono interpretati ed elaborati vengono mostrate durante la navigazione nell'addestramento dell'esperimento. Per ulteriori informazioni, vedere Interpretazione degli insight del dataset.

Configurazione del rilevamento dei bias

È possibile attivare il rilevamento dei bias per le funzionalità contenenti dati sensibili. Il rilevamento dei bias viene eseguito quando si esegue l'esperimento. È inoltre possibile fare clic su Ottieni raccomandazioni per utilizzare l'IA generativa per scansionare i dati di addestramento alla ricerca di funzionalità potenzialmente sensibili prima di eseguire il rilevamento dei bias.

Il rilevamento dei bias determina se la funzionalità aumenta la probabilità del modello di promuovere risultati ingiusti nelle sue previsioni o se i dati di origine sono intrinsecamente distorti.

Procedere come indicato di seguito:

In un esperimento ML, espandi Bias nel pannello di configurazione dell'addestramento.
Prima di selezionare le funzionalità per il rilevamento del bias, fare clic facoltativamente su Ottieni consigli per utilizzare l'IA generativa per suggerire funzionalità che potrebbero contenere dati distorti. Vedere Utilizzo dell'IA generativa per raccomandare funzionalità per il rilevamento dei bias.
Selezionare o deselezionare le funzionalità per le quali si desidera eseguire il rilevamento del bias.

In alternativa, attiva il rilevamento del bias per le funzionalità desiderate nella Righe vista Schema.

Per ulteriori informazioni sul rilevamento dei bias, vedere Rilevamento dei bias nei modelli di machine learning.

Selezione degli algoritmi

Tutti gli algoritmi disponibili sono inclusi per impostazione predefinita ed è possibile escludere eventuali algoritmi che non si desidera utilizzare. Normalmente, si farebbe questo come parte del perfezionamento del modello quando si sono visti i primi risultati dell'addestramento. Ulteriori informazioni in Affinamento dei modelli.

Sezione Algoritmi nel pannello di configurazione dell'esperimento Qlik Predict. — Sezione Algoritmi nel pannello di configurazione dell'esperimento

Modifica dei tipi di funzionalità

Quando viene caricato un set di dati, le colonne vengono trattate come categoriali, numeriche, data o testo libero in base al tipo di dati e ad altre caratteristiche. In alcuni casi, potrebbe essere necessario modificare questa impostazione.

Ad esempio, se i giorni della settimana sono rappresentati dai numeri 1-7, ogni numero rappresenta un valore categoriale. Per impostazione predefinita, viene trattato come un valore numerico classificato continuo, quindi sarebbe necessario modificare manualmente la configurazione per trattarlo come categoriale.

Quando una colonna viene identificata come contenente informazioni su data e ora, viene utilizzata come base per nuove funzionalità ingegnerizzate automaticamente generate. Quando ciò accade, la colonna originale (la funzionalità padre) viene trattata come avente il tipo di funzionalità data.

È possibile modificare la funzionalità padre da una funzionalità data a una funzionalità categoriale o numerica. Ad esempio, questo è utile quando una funzionalità viene identificata come data, ma è necessario che venga trattata come stringa o numero. Quando si esegue questa operazione, non è più possibile utilizzare le sue funzionalità ingegnerizzate automaticamente nell'addestramento dell'esperimento.

Procedere come indicato di seguito:

In Vista schema, individuare la funzionalità.
Nella colonna Tipo di funzionalità per questa funzionalità, fare clic su .
Selezionare un valore nell'elenco.

In alternativa, è possibile modificare i tipi di funzionalità da Profilo Vista dati. Individuare la funzionalità, quindi fare clic su Freccia giù accanto al tipo di funzionalità corrente. Selezionare un valore nell'elenco.

Previsione delle serie temporali

Se si sta addestrando un esperimento di serie temporali, determinate trasformazioni del tipo di funzionalità vengono applicate automaticamente a seconda della configurazione. Ad esempio, se si selezionano gruppi da utilizzare per la previsione multivariata, i tipi di funzionalità di questi gruppi vengono automaticamente passati a categoriali.

Impatto sulle previsioni

Quando si modifica manualmente il tipo di funzione e quindi si distribuisce il modello risultante, le sostituzioni del tipo di funzione verranno applicate alla funzione nel set di dati di applicazione utilizzato nelle previsioni fatte con quel modello.

Modifica del set di dati

È possibile modificare il set di dati di addestramento prima di eseguire la prima versione dell'esperimento, nonché dopo aver eseguito qualsiasi versione.

Se si modifica il set di dati prima di eseguire la prima versione, si perderà qualsiasi configurazione eseguita prima di modificare il set di dati.

Procedere come indicato di seguito:

Nel pannello di configurazione dell'esperimento in Dati di addestramento > Rivedi set di dati, fare clic su Modifica set di dati.
Selezionare un nuovo set di dati.

Per ulteriori informazioni sulla modifica e l'aggiornamento del set di dati durante il perfezionamento del modello (dopo aver eseguito una versione dell'esperimento), vedere Modifica e aggiornamento del set di dati.

Configurazione dell'ottimizzazione del modello

Se il tipo di esperimento è classificazione binaria, classificazione multiclasse o regressione, è possibile regolare le seguenti impostazioni per ottimizzare i modelli:

Attivazione o disattivazione dell'ottimizzazione intelligente del modello
Attivazione o disattivazione dell'ottimizzazione degli iperparametri
Attivazione o disattivazione dell'addestramento sensibile al tempo

Queste opzioni possono essere attivate o disattivate per ogni versione dell'esperimento che si esegue.

Sezione Ottimizzazione del modello nel pannello di configurazione dell'addestramento Qlik Predict — Sezione Ottimizzazione del modello nel pannello di configurazione dell'esperimento

Configurazione dell'ottimizzazione intelligente

Per impostazione predefinita, l'esperimento utilizza l'ottimizzazione intelligente del modello. Con l'ottimizzazione intelligente del modello, Qlik Predict gestisce il processo di perfezionamento del modello per te iterando la selezione delle funzionalità e applicando trasformazioni avanzate ai tuoi dati.

Per ulteriori informazioni sull'ottimizzazione intelligente, vedere Ottimizzazione intelligente del modello.

È possibile disattivare questa impostazione per perfezionare manualmente i modelli che si addestrano. Ad esempio, si potrebbe voler iniziare l'addestramento del modello con l'ottimizzazione intelligente del modello, quindi passare al perfezionamento manuale per la v2 per regolare ulteriormente la configurazione.

Procedere come indicato di seguito:

Fare clic su Visualizza configurazione.
Se è già stata eseguita almeno una versione dell'esperimento, fare clic su Nuova versione.
Nel pannello, espandere Ottimizzazione del modello.
Passare da Intelligente a Manuale.
Utilizzando il dispositivo di scorrimento, impostare la durata massima di esecuzione per l'addestramento.

Configurazione dell'ottimizzazione degli iperparametri

È possibile ottimizzare i modelli utilizzando l'ottimizzazione degli iperparametri. Si noti che questa è un'opzione avanzata che potrebbe aumentare significativamente il tempo di addestramento. L'ottimizzazione degli iperparametri è disponibile se si disattiva l'ottimizzazione intelligente.

Per ulteriori informazioni, vedere Ottimizzazione degli iperparametri.

Procedere come indicato di seguito:

Fare clic su Visualizza configurazione.
Se è già stata eseguita almeno una versione dell'esperimento, fare clic su Nuova versione.
Nel pannello, espandere Ottimizzazione del modello.
Passare da Intelligente a Manuale.
Selezionare la casella di controllo Ottimizzazione degli iperparametri.
Facoltativamente, impostare un limite di tempo per l'ottimizzazione. Il limite di tempo predefinito è un'ora.

Configurazione dell'addestramento sensibile al tempo

Se si desidera che i modelli vengano addestrati tenendo conto di una dimensione di serie temporale, attivare l'addestramento sensibile al tempo per la versione dell'esperimento. Per utilizzare questa opzione, è necessario disporre di una colonna nel set di dati che contenga le informazioni pertinenti sulle serie temporali.

Quando l'addestramento sensibile al tempo è attivato, Qlik Predict utilizza processi specializzati di convalida incrociata e imputazione nulla per addestrare i modelli.

Per ulteriori informazioni, vedere Creazione di modelli sensibili ai valori temporali e Convalida incrociata basata sul tempo.

Procedere come indicato di seguito:

Fare clic su Visualizza configurazione.
Se è già stata eseguita almeno una versione dell'esperimento, fare clic su Nuova versione.
Nel pannello, espandere Ottimizzazione del modello.
In Divisione test-addestramento basata sul tempo, selezionare l'Indice data da utilizzare per l'ordinamento dei dati.

Visualizzazione di informazioni dettagliate sui dati di addestramento

Nella scheda Configurazione/Dati di addestramento dell'esperimento, è possibile visualizzare informazioni dettagliate sulla gestione dei dati di addestramento. Queste informazioni sono disponibili nella colonna Informazioni dettagliate in Righe tabella Vista schema. Le informazioni mostrate dipendono dal fatto che sia stata eseguita o meno una versione con i dati di addestramento correnti. Le modifiche nella colonna Informazioni dettagliate possono aiutare a identificare il motivo per cui le funzionalità potrebbero non essere disponibili per l'uso o perché sono state eliminate automaticamente.

Per ulteriori informazioni sul significato di ciascuna informazione dettagliata, vedere Interpretazione degli insight del dataset.

APPRENDIMENTO CORRELATO:

Introduzione a Qlik Predict

Ulteriori informazioni

Introduzione a Qlik Predict

Hai trovato utile questa pagina?

Se riscontri problemi con questa pagina o con il suo contenuto – un errore di battitura, un passaggio mancante o un errore tecnico – ti pregiamo di farcelo sapere!

Lascia qui il tuo feedback