Procedure consigliate per la modellazione dati
In questa sezione vengono descritti molti modi differenti in cui è possibile caricare i dati nel documento QlikView a seconda di come i dati sono strutturati e di quale modello dati si desidera ottenere.
In generale, il modo in cui si caricano i dati nel documento può essere spiegato mediante il processo di estrazione, trasformazione e caricamento:
-
Estrazione
Il primo passo è l'estrazione di dati dal sistema della sorgente dati. Nello script si utilizzano le istruzioni SELECT o LOAD per definire questo. Le differenze tra queste istruzioni sono:
- SELECT viene utilizzata per selezionare dati da una sorgente dati ODBC o un provider OLE DB. L'istruzione SELECT SQL viene valutata dal provider di dati, non da QlikView.
- L'istruzione LOAD viene utilizzata per caricare dati da un file, dai dati definiti nello script, da una tabella caricata in precedenza, da una pagina Web, dal risultato di un'istruzione SELECT successiva o mediante la generazione automatica di dati.
-
Trasformazione
La fase della trasformazione implica la manipolazione dei dati utilizzando le regole e le funzioni di script per ottenere la struttura del modello dati desiderata. Le tipiche operazioni sono:
- Calcolo di nuovi valori
- Conversione di valori codificati
- Ridenominazione dei campi
- Unione di tabelle
- Aggregazione di valori
- Pivoting
- Convalida di dati
-
Caricamento
Nel passaggio finale viene eseguito lo script per caricare il modello dati definito nel documento.
L'obiettivo dovrebbe essere creare un modello dati che consenta una gestione efficiente dei dati in QlikView. Di solito questo significa che si deve mirare a uno schema a fiocco di neve o a uno schema a stella ragionevolmente normalizzato senza alcun riferimento circolare, ossia, a un modello in cui ciascuna entità viene mantenuta in una tabella separata. In altre parole, un tipico modello dati è simile al seguente:
- Una tabella dei fatti centrale contenente le chiavi per le dimensioni e i numeri utilizzati per calcolare le misure (ad esempio numero di unità, importi delle vendite e importi di budget).
- Tabelle circostanti contenenti le dimensioni con tutti i relativi attributi (ad esempio prodotti, clienti, categorie, calendario e fornitori).
Ciascuna tabella nel modello dati corrisponde di solito a un'istruzione SELECT o LOAD. Le differenze tra queste istruzioni sono:
- SELECT viene utilizzata per selezionare dati da una sorgente dati ODBC o un provider OLE DB. L'istruzione SELECT SQL viene valutata dal provider di dati, non da QlikView.
- L'istruzione LOAD viene utilizzata per caricare dati da un file, dai dati definiti nello script, da una tabella caricata in precedenza, da una pagina Web, dal risultato di un'istruzione SELECT successiva o mediante la generazione automatica di dati.