Vai al contenuto principale Passa a contenuto complementare

Creazione di nuove colonne di funzioni

L'ingegneria delle funzioni è il processo di creazione di nuove colonne di funzionalità a partire da quelle attuali. Può aiutare a ottenere ulteriore potere di previsione dai dati di partenza raccolti per rispondere a una domanda aziendale.

Ad esempio, l'indirizzo di un cliente verrebbe escluso dai dati del training a causa dell'elevata cardinalità. Invece di utilizzare l'indirizzo, potremmo inserire una colonna di distanza. Se si conosce l'indirizzo del cliente e le varie ubicazioni dei negozi, è possibile calcolare le distanze dai negozi. Le nuove colonne avranno un valore numerico che potrà essere utilizzato per scoprire modelli misurabili nei dati.

È possibile eseguire l'ingegneria delle funzionalità nel proprio set di dati, in preparazione per l'utilizzo in AutoML. Inoltre, AutoML suggerisce nuove funzionalità che è possibile generare da quelle esistenti.

Nuove colonne per le distanze dai diversi negozi

Tabella con dati campione.

Esaminare le funzioni del set di dati per determinare eventuali problemi o miglioramenti da apportare. L'ingegneria di funzioni richiede abilità ed esperienza in ambito business. Le funzioni devono essere espresse in modo da collegarsi direttamente alla colonna di destinazione.

Aspetti da considerare:

  • Il tempo deve essere considerato una funzione?

  • Il tasso di cambiamento è importante?

  • Una funzione deve essere normalizzata per tenere conto delle differenze tra sottoinsiemi di dati?

  • I valori nulli hanno un significato?

Ingegneria automatica delle funzioni

Con l'ingegneria automatica delle funzioni, le nuove funzioni vengono create automaticamente da quelle esistenti.

AutoML genera funzionalità progettate automaticamente dalle colonne che contengono informazioni relative a data e ora. Queste nuove funzionalità separano ogni componente dei valori della colonna in funzionalità proprie.

Inoltre, alle colonne contenenti testo libero è possibile applicare un'elaborazione speciale. Le funzioni di testo libero originali vengono trasformate in nuove funzioni per migliorare l'addestramento del modello.

Le funzionalità progettate automaticamente migliorano le prestazioni predittive e analitiche dei modelli utilizzati per il training. Per ulteriori informazioni, vedere Ingegneria automatica delle funzioni.

Esempi: funzioni di ingegneria

Utilizzare i seguenti esempi per iniziare a valutare come progettare funzioni che possano migliorare la natura previsionale dei propri dati.

L'opportunità di vendita si chiuderà?

La colonna di destinazione indica se l'opportunità di vendita è stata chiusa (Sì o No).

  • Funzione originale: numero di incontri

  • Funzioni alternative: riunioni al mese o numero di riunioni in una fase specifica

Trasformare la misura in frequenza delle riunioni consente di introdurre cambiamenti migliori. La misurazione delle riunioni in una fase specifica del processo di vendita esprime meglio la dinamica di vendita e tiene conto del ciclo.

Previsione dell'importo di una transazione futura

La colonna di destinazione rappresenta l'importo della transazione successiva.

  • Funzione originale: importo dell'ultimo ordine

  • Funzioni alternative: l'importo medio dell'ordine o la variazione in percentuale dell'importo dell'ordine

L'importo medio fornisce un quadro più ampio del comportamento degli ordini. La variazione del modello di acquisto fornisce un valore normalizzato.

Un cliente cancellerà la sottoscrizione?

La colonna di destinazione indica se il cliente abbandonerà (sì o no).

  • Funzione originale: valutazione del cliente

  • Funzioni alternative: variazione della valutazione del cliente o numero di giorni con la valutazione attuale

È più probabile che la misurazione della variazione della valutazione porti all'azione. Il numero di giorni indica la durata dello stato attuale.

Un dipendente si licenzierà volontariamente?

La colonna di destinazione indica se un dipendente si licenzierà (Sì o No).

  • Funzione originale: stipendio

  • Funzioni alternative: stipendio rispetto ai colleghi o alla media del settore

Il confronto dello stipendio con quello dei colleghi permette di allineare meglio la retribuzione all'esperienza o alla valutazione del dipendente. Il confronto con lo stipendio medio del settore si allinea meglio al costo opportunità del dipendente.

Un lead si convertirà in un'opportunità?

La colonna di destinazione indica se un lead è stato convertito (Sì o No).

  • Funzione originale: come ci hai trovati?

  • Funzioni alternative: risposta (Sì o No)

Ciò che conta è l'azione e non la risposta. Si noti che in questo caso i nulli hanno un significato: l'inazione.

Date

Con l'ingegneria automatica delle funzioni di AutoML, i componenti di date e timestamp vengono analizzati automaticamente in colonne separate.

Le date possono anche essere progettate in molti altri modi per creare diverse funzionalità in un set di dati, ad esempio:

  • Aggregare le date in stagioni, trimestri o semestri.

  • Calcolare la differenza di data, ad esempio il numero di giorni dall'ultimo acquisto.

APPRENDIMENTO CORRELATO:

Ulteriori informazioni

Hai trovato utile questa pagina?

Se riscontri problemi con questa pagina o con il suo contenuto – un errore di battitura, un passaggio mancante o un errore tecnico – facci sapere come possiamo migliorare!