Creazione e gestione di data mart
Dopo aver eseguito l'onboarding dei dati, è possibile creare data mart utilizzando i dati delle attività Archiviazione o Trasformazione. È possibile creare un numero qualsiasi di data mart a seconda delle esigenze aziendali. Idealmente, i data mart dovrebbero contenere repository di dati riepilogati raccolti per l'analisi su una sezione o unità specifica all'interno di un'organizzazione, ad esempio il reparto vendite.
La procedura per la creazione di un data mart è identica, indipendentemente dal fatto che il data mart sia basato su un'attività di Archiviazione, oppure su un'attività di Trasformazione. Le istruzioni in questa sezione presuppongono che il data mart sia basato su un'attività di Archiviazione.
Prerequisiti
Prima di poter creare un data mart, è necessario effettuare le seguenti operazioni:
- popolare lo Archiviazione con i dati (dal trasferimento) che si desidera utilizzare nel data mart. Per ulteriori informazioni, vedere Inserimento dati.
-
Creare un modello relazionale del set di dati per definire le relazioni tra i set di dati di origine. Per ulteriori informazioni, vedere Creazione di un modello dati.
Nota di avvisoTutti i set di dati di origine devono avere delle chiavi.
Creazione di un data mart
Per creare un data mart:
-
aprire il progetto.
-
Effettuare una delle seguenti operazioni:
- Fare clic su Creain alto a destra e selezionare Crea data mart.
-
Nell'attività dati di archiviazione, fare clic su nell'angolo in basso a destra, quindi selezionare Crea data mart.
Si aprirà la finestra di dialogo Crea data mart
-
Fornire un nome al data mart e, facoltativamente, fornire anche una descrizione.
-
Se si desidera configurare il data mart in un secondo momento, deselezionare la casella di controllo Apri e quindi fare clic su Crea. Altrimenti, basta fare clic su Crea.
Il data mart si apre sulla scheda Data mart.
- Selezionare i dati di origine come descritto in Selezione dei dati di origine
- Se si desidera che il data mart contenga dimensioni, aggiungere le dimensioni come descritto in Aggiungere dimensioni e un fatto al data mart
- Se si desidera che il data mart contenga un fatto, aggiungere un fatto come descritto in Aggiunta di un fatto
- Se il data mart contiene sia dimensioni che un fatto, aggiungere le dimensioni allo schema a stella come descritto in Costruire uno schema a stella
- Creare i set di dati nel data mart e popolarli con i dati, come descritto nella sezione Popolamento del data mart
Selezione dei dati di origine
Selezionare i dati di origine dal set di dati nell'attività dati Archiviazione.
Operazione da eseguire:
-
Fare clic sul pulsante Seleziona dati sorgente al centro della scheda o fare clic sul pulsante Seleziona dati sorgente nella barra degli strumenti.
Si apre la finestra di dialogo Seleziona dati sorgente.
-
Dall'elenco a discesa Asset di dati, selezionare un'attività di Archiviazione o un'attività di Trasformazione se si sono create trasformazioni.
-
Lasciare la % predefinita per cercare tutti i set di dati o inserire il nome di un set di dati specifico da trovare. Quindi, fare clic su Cerca.
-
Selezionare le set di dati desiderate e quindi fare clic su Aggiungi tabelle selezionate.
-
Fare clic su OK per chiudere la finestra di dialogo, quindi procedere con Aggiungi fatto e/o Aggiungi dimensioni.
Aggiungere dimensioni e un fatto al data mart
Dopo aver selezionato i dati di origine, è quindi possibile procedere alla creazione del data mart. Un data mart può avere un set di dati sui fatti, uno sulle dimensioni o una combinazione di entrambi (dove i set di dati sulle dimensioni sono logicamente correlati al set di dati sui fatti).
Aggiunta di dimensioni
Per aggiungere una dimensione:
-
Fare clic sul pulsante Aggiungi dimensione.
Si apre la finestra di dialogo Aggiungi dimensione.
-
Sono disponibili le impostazioni seguenti:
- Set di dati più granulare: Selezionare un set di dati.
- Nome: Specificare un nome visualizzato per la dimensione. L'impostazione predefinita è il nome del set di dati più granulare.
- Descrizione: Facoltativamente, fornire una descrizione.
- Tipo cronologia: Selezionare una delle opzioni seguenti:
- Tipo 1: il record esistente nella dimensione verrà aggiornato ogni volta che verrà aggiornato il record corrispondente in Archiviazione.
- Tipo 2: un nuovo record verrà aggiunto alla dimensione ogni volta che verrà aggiornato il record corrispondente in Archiviazione.
-
Set di dati correlato da denormalizzare: Tutti i set di dati che possono essere denormalizzati nel set di dati dimensionale (in base alle relazioni nel modello dell'asset di dati di origine) saranno qui disponibili per la selezione.
-
Fare clic su OK per salvare le impostazioni.
La dimensione verrà aggiunta all'elenco Dimensioni a sinistra.
Vedere anche Dimensioni che svolgono un ruolo.
Visualizzazione delle informazioni su una dimensione
Quando si seleziona una dimensione, la scheda Modello relazionale sorgente verrà visualizzata nel riquadro centrale. Questa scheda mostra i set di dati di origine consolidati nella dimensione. Una volta aggiunta la dimensione, i set di dati che si è scelto di denormalizzare verranno mostrati come selezionati (e disattivati).
Aggiunta di un fatto
Per aggiungere un fatto:
-
Fare clic sul pulsante Aggiungi fatto.
Verrà visualizzata la finestra di dialogo Aggiungi fatto.
-
Sono disponibili le impostazioni seguenti:
- Fatto: Selezionare un set di dati che sia il fatto. il set di dati deve definire la granularità del fatto che si sta creando.
- Nome: Specificare un nome visualizzato per il fatto. L'impostazione predefinita è il nome del fatto.
- Descrizione: Facoltativamente, fornire una descrizione.
- Set di dati correlati da denormalizzare: Tutti i set di dati che possono essere denormalizzati nel set di dati dei fatti saranno disponibili qui per la selezione.
- Avanzate
- Usa dati correnti: Quando questa opzione è selezionata (impostazione predefinita), i dati non conterranno una colonna con la data della transazione.
-
Scegli data di transazione: per individuare i dati in base a una data di transazione specifica, selezionare questa opzione, quindi selezionare una colonna per la data. Questa opzione è utile quando lo schema a stella utilizzato contiene dimensioni di tipo 2 e si desidera trovare i dati corretti per una transazione specifica. Ad esempio, se un cliente ha più indirizzi, è possibile trovare quello corretto in base alla data dell'ordine.
Caso d'uso di esempio:
Un rivenditore ha bisogno di creare un data mart per analizzare la relazione tra ordini e clienti. Il data mart dovrebbe poter rispondere a query quali, ad esempio: Quale stato degli Stati Uniti ha la somma maggiore di ordini nel quarto trimestre del 2022?
Se il rivenditore seleziona l'opzione Usa dati correnti, solo la versione più recente del record nella tabella Clienti sarà inclusa nel calcolo.
Ignorando la data della transazione si otterranno dati imprecisi, come illustrato di seguito:
Se il rivenditore seleziona l'opzione Scegli data transazione, tuttavia, gli ordini del cliente saranno associati alla versione corretta del record nella tabella Clienti.
Ciò consentirà al rivenditore di calcolare con precisione la somma totale degli ordini per Stato nel quarto trimestre del 2022.
Nota di suggerimentoSi noti che la data della transazione può essere sfruttata in modo diverso in ogni data mart, a seconda delle esigenze aziendali. Ad esempio, in un data mart potrebbe essere utilizzato per analizzare le date degli ordini, mentre in un altro data mart potrebbe essere utilizzato per analizzare le date di spedizione.
-
Fare clic su OK per salvare le impostazioni.
Il fatto sarà aggiunto all'elenco Fatti a sinistra.
Visualizzazione delle informazioni sul fatto
Quando si seleziona un fatto, nel riquadro centrale vengono visualizzate le seguenti schede:
- Modello schema a stella (predefinito): mostra una rappresentazione grafica delle relazioni tra i set di dati all'interno del data mart.
-
Modello dei fatti: mostra eventuali set di dati correlati al set di dati dei fatti. Una volta aggiunto il fatto, i set di dati che si è scelto di denormalizzare verranno mostrati come selezionati (e disattivati).
- Data transazione: il nome della colonna per la transazione se si è selezionata l'opzione Scegli data di transazione quando si è aggiunto il fatto.
Gestione delle dimensioni sconosciute e recenti
Ogni dimensione contiene le righe -1 e 0, che rappresentano la chiave aziendale della dimensione (ID oggetto). La riga -1 è riservata alle dimensioni recenti, mentre quella 0 è riservata alle dimensioni sconosciute.
Dimensioni sconosciute
Sono definiti come "sconosciuti" i dati che non sono disponibili al momento della creazione della dimensione. Per esempio, supponiamo di avere un fatto ORDER (ordine) con una colonna SHIPPER (mittente spedizione) che è la chiave aziendale per la dimensione SHIPPER. Se la riga del dato ORDER non è ancora stata spedita, e quindi la colonna SHIPPER ha un valore NULL, questa verrà correlata al record 0 (che denota un valore Sconosciuto per la dimensione). Quando il fatto ORDER viene successivamente aggiornato con un valore SHIPPER (ad esempio, USPS), il relativo ID dimensione (0) verrà aggiornato a sua volta.
Dimensioni recenti
Una dimensione recente ha una chiave che esiste nei nuovi dati del fatto, ma che non esiste ancora nella dimensione. Ad esempio, se SHIPPER nel fatto ORDER ha il valore "NEWSHIP" per un nuovo spedizioniere e questa chiave aziendale non esiste ancora nella dimensione DIM_SHIPPER, l'elaborazione del data mart metterà in relazione quel fatto con la riga -1. Questo denota la mancanza di un membro per la dimensione nella relativa tabella delle dimensioni. Quando la chiave aziendale "NEWSHIP" arriva per la dimensione DIM_SHIPPER, viene creata la relativa riga di dimensione e il record del fatto viene aggiornato per allinearsi con la dimensione mancante in precedenza.
Costruire uno schema a stella
Una volta aggiunte le dimensioni al data mart, è quindi possibile procedere a collegarle ai set di dati dei fatti, creando così uno schema a stella.
Operazione da eseguire:
- Selezionare il fatto nell'elenco Fatti a sinistra.
-
Selezionare le dimensioni da aggiungere dall'elenco Dimensioni consigliate a destra.
Le dimensioni consigliate sono mostrate collegate al set di dati dei fatti con una linea punteggiata.
Nell'immagine sottostante, alcune delle dimensioni sono state aggiunte prima e quindi sono collegate da una linea continua di colore grigio.
-
Fare clic su Applica per aggiungere le dimensioni.
Le dimensioni verranno visualizzate collegate al set di dati dei fatti con una linea continua di colore grigio.
-
Per chiudere il pannello Dimensioni consigliate fare clic su .
Popolamento del data mart
Una volta progettato il data mart, è quindi possibile procedere a popolarlo.
Operazione da eseguire:
-
Fare clic sul pulsante Prepara della barra strumenti in alto a destra.
Il processo di preparazione include la creazione di set di dati e visualizzazioni nel data mart e l'aggiornamento del catalogo.
È possibile seguire l'avanzamento in Avanzamento preparazione nella parte inferiore dello schermo.
Al termine della preparazione, il pulsante Prepara cambia in Esegui.
-
Facoltativamente, convalidare il data mart come descritto nella sezione Convalida e sincronizzazione di un data mart di seguito.
-
Fare clic sul pulsante Esegui.
La finestra passa alla vista Monitora, che mostra l'avanzamento del caricamento e lo stato dei set di dati nel data mart.
Ogni record sorgente verrà elaborato dal data mart, anche i record eliminati. Questo viene fatto per garantire che le informazioni storiche siano conservate.
Convalida e sincronizzazione di un data mart
La convalida dei data mart consente di assicurare che i metadati del data mart siano identici ai metadati in Archiviazione (o Trasformazione, se definita). La convalida del data mart consente inoltre di confrontare i metadati creati con la progettazione dello schema a stella corrente. Ad esempio, se si esegue la convalida dopo aver aggiunto una dimensione a un data mart creato in precedenza, la convalida non verrà eseguita.
Per convalidare il data mart:
-
Selezionare Convalida set di dati dal menu a destra del pulsante Esegui o fare clic sul pulsante Convalida set di dati nella parte inferiore destra della finestra.
Verrà visualizzato il messaggio Convalida completata.
-
Se i metadati non sono sincronizzati o se sono presenti conflitti nella progettazione dello schema a stella, il pannello Convalida e regola nella parte inferiore della finestra si aprirà automaticamente con il report della convalida.
Esempio di data mart con un conflitto nella progettazione di uno schema a stella: Esempio di data mart con errori di convalida:
-
Per risolvere qualsiasi problema relativo alle Modifiche al design in attesa, fare clic sul pulsante in alto a destra e selezionare Prepara. Se il valore della colonna Alterabile senza perdita di dati è Sì, verrà eseguita un'operazione ALTER. In caso contrario, le tabelle del data mart verranno ricreate.
Notare che tutti gli Errori di convalida devono essere risolti manualmente.
Gestione dei data mart
Questa sezione descrive le varie opzioni disponibili per la gestione dei set di dati e dei data mart.
Affinare fatti o dimensioni
Nella scheda Set di dati, è possibile eseguire varie operazioni per affinare fatti e dimensioni, come la creazione di regole di trasformazione (ad esempio, la sostituzione dei valori delle colonne) e l'aggiunta di espressioni a livello di colonna. La scheda Set di dati si trova a destra della scheda Data mart:
Aggiunta di regole
Per una spiegazione su come aggiungere regole globali, vedere Creazione di regole per la trasformazione di set di dati
Aggiunta di nuove colonne
È possibile aggiungere nuove colonne al set di dati di destinazione.
-
Aggiunta di una nuova colonna da zero
Fare clic su Aggiungi +.
Fornire un nome per la colonna e impostare un'espressione per definire i dati della colonna.
Per ulteriori informazioni, vedere Aggiunta di colonne a un set di dati.
-
Aggiunta di una colonna dalla sorgente
Fare clic su accanto ad Aggiungi e selezionare Aggiungi colonna dalla sorgente.
Selezionare una colonna dal set di dati di origine.
Riordino delle colonne
È possibile cambiare la posizione ordinale di una colonna.
-
Selezionare una colonna.
-
Fare clic su e quindi su Riordina.
-
Utilizzare le frecce per spostare la colonna verso l'alto oppure verso il basso.
-
Chiudere Cambia ordinale per continuare.
Dimensioni che svolgono un ruolo
Le dimensioni che svolgono un ruolo sono delle dimensioni che vengono utilizzate più volte in uno schema a stella, ma con significati differenti. Si tratta di una funzione comune nelle dimensioni Data e Cliente. Ad esempio, uno schema a stella potrebbe avere due entità Data, una che rappresenta la Data ordine e un'altra che rappresenta la Data di ricezione.
Per aggiungere o modificare il nome del ruolo di una dimensione:
- fare clic sull'icona nel nodo della dimensione e selezionare Modifica ruolo.
Nella finestra di dialogo Modifica ruolo, inserire un nome (o modificare un nome esistente) nel campo Nome ruolo in uno schema a stella e fare clic su OK.
Il nome del ruolo verrà visualizzato sotto il nome della dimensione.
Opzioni di gestione aggiuntive
La tabella seguente descrive ulteriori opzioni di gestione:
A | Azione da eseguire |
---|---|
Aggiungere ulteriori set di dati di origine | Vedere Selezione dei dati di origine. |
Aggiungere ulteriori fatti | Vedere Aggiunta di un fatto |
Aggiungere ulteriori dimensioni | Vedere Aggiungere dimensioni e un fatto al data mart. |
Eliminare una dimensione | Selezionare la dimensione nel riquadro Dimensioni, quindi selezionare Eliminadal menu . |
Eliminare un fatto | Selezionare il fatto nel riquadro Fatti, quindi selezionare Elimina dal menu . |
Ricreare un data mart | Fare clic sul pulsante in alto a destra e selezionare Ricrea tabelle. Potrebbe essere necessario ricreare un data mart se, ad esempio, in Archiviazione sono presenti modifiche che non possono essere sincronizzate automaticamente con il data mart. |
Arresta un'attività di data mart in esecuzione | Fare clic sul pulsante Stop in alto a destra. |
Preparazione di un'attività data mart | Fare clic sul pulsante in alto a destra e selezionare Prepara per sincronizzare i set di dati con le risorse Trasforma o Archiviazione e risolvere qualsiasi conflitto di progettazione. Questa funzione prepara un'attività per l'esecuzione. Sono incluse le seguenti tabelle:
È possibile seguire l'avanzamento in Avanzamento preparazione nella parte inferiore dello schermo. |
Pianificazione di un'attività data mart
È possibile pianificare un'attività data mart da aggiornare regolarmente. È possibile configurare una pianificazione basata sul tempo, oppure impostare l'attività da eseguire una volta terminata l'esecuzione delle attività di dati di input.
Fare clic su ... su un'attività di dati e selezionare Pianificazione per creare una pianificazione. L'impostazione della pianificazione predefinita viene ereditata dalle impostazioni nel progetto. Per ulteriori informazioni sulle impostazioni predefinite, vedere Valori predefiniti data mart.
Per attivare la pianificazione, è necessario impostare Pianificazione su Attiva.
Pianificazioni basate sul tempo
È possibile utilizzare una pianificazione basata sul tempo per eseguire un'attività indipendentemente da quando vengono aggiornate le sorgenti di input.
Selezionare In base a un orario specifico in Avvia attività di dati.
È possibile impostare una pianificazione giornaliera, settimanale o mensile.
Pianificazioni basate su un evento
È possibile usare una pianificazione basata su un evento per eseguire un'attività determinata una volta terminata l'esecuzione delle attività di dati di input.
Selezionare In base a un evento specifico in Avvia attività di dati.
È possibile selezionare se si desidera eseguire l'attività quando viene completata una qualsiasi delle attività di input, oppure quando viene completata qualsiasi selezione di attività di input.
Ricaricamento di dati
È possibile eseguire il ricaricamento manuale dei dati. Questa funzionalità è utile quando si presentano dei problemi con una o più tabelle.
Aprire l'attività dati e selezionare la scheda Monitora.
Selezionare le tabelle che si desidera ricaricare.
Quando una dimensione viene selezionata per il ricaricamento, anche tutte le azioni che utilizzano quella dimensione verranno ricaricati per mantenere l'integrità.
Fare clic su Ricarica tabelle.
È possibile annullare il ricaricamento per le tabelle con ricaricamento in attesa facendo clic su Annulla ricaricamento. Questa azione non avrà alcun effetto sulle tabelle che sono state già ricaricate e i ricaricamenti attualmente in esecuzione verranno completati.
Il ricaricamento viene eseguito nei seguenti modi:
Troncando le dimensioni e i fatti selezionati.
Caricando le tabelle delle dimensioni selezionate dall'attività dati a monte.
Caricando le tabelle dei fatti dall'attività dati a monte. Sono incluse le seguenti tabelle:
Le tabelle selezionate in modo esplicito.
Le tabelle dei fatti che sono correlate a una dimensione ricaricata.
Impostazioni data mart
Fare clic sul pulsante Impostazioni della barra degli strumenti per aprire la finestra di dialogo Impostazioni: <nome-data-mart>.
Impostazioni generali
Nella scheda Generale sono disponibili le seguenti impostazioni:
- Database: il database in cui sarà creato il data mart
- Schema attività dati: lo schema in cui saranno creati i set di dati
- Schema interno: lo schema in cui saranno creati i set di dati interni
- Prefisso per tutte le tabelle e le visualizzazioni
È possibile impostare un prefisso per tutte le tabelle e visualizzazioni create per questa attività.
Nota informaticaSe si desidera utilizzare uno schema del database per più attività, è necessario usare un prefisso univoco.
Impostazioni del tempo di esecuzione
Nella scheda Tempo di esecuzione sono disponibili le seguenti impostazioni:
- Esecuzione parallela: Immettere il numero massimo di connessioni al database che a Qlik Cloud è consentito aprire per l'attività. Il numero predefinito è 10.
- Warehouse: rilevante solo per Snowflake. Nome del data warehouse Snowflake.
Impostazioni Catalogo
Pubblica nel catalogo
Selezionare questa opzione per pubblicare questa versione dei dati nel Catalogo come un set di dati. Il contenuto del Catalogo verrà aggiornato la volta successiva che si prepara l'attività.
Per ulteriori informazioni sul Catalogo, vedere Informazioni sui dati con gli strumenti del catalogo.