Vai al contenuto principale Passa a contenuto complementare

Creazione e gestione di data mart

Dopo aver eseguito l'onboarding dei dati, è possibile creare data mart utilizzando i dati delle attività Archiviazione o Trasformazione. È possibile creare un numero qualsiasi di data mart a seconda delle esigenze aziendali. Idealmente, i data mart dovrebbero contenere repository di dati riepilogati raccolti per l'analisi su una sezione o unità specifica all'interno di un'organizzazione, ad esempio il reparto vendite.

Nota informaticaLa procedura per la creazione di un data mart è identica, indipendentemente dal fatto che il data mart sia basato su un'attività di Archiviazione, oppure su un'attività di Trasformazione. Le istruzioni in questa sezione presuppongono che il data mart sia basato su un'attività di Archiviazione.
Nota informaticaLe attività dati vengono eseguite nel contesto del relativo proprietario. Per ulteriori informazioni su ruoli e autorizzazioni necessari, vedere Ruoli e autorizzazioni dello spazio dati.

Prerequisiti

Prima di poter creare un data mart, è necessario effettuare le seguenti operazioni:

  • popolare lo Archiviazione con i dati (dal trasferimento) che si desidera utilizzare nel data mart. Per ulteriori informazioni, vedere Inserimento dati.
  • Creare un modello relazionale del set di dati per definire le relazioni tra i set di dati di origine. Per ulteriori informazioni, vedere Creazione di un modello dati.

    Nota di avvisoTutti i set di dati di origine devono avere delle chiavi.

Creazione di un data mart

Per creare un data mart:

  1. Aprire il proprio progetto dati facendo clic su alla fine della riga e selezionando Apri.

  2. Effettuare una delle seguenti operazioni:

    • Fare clic su Aggiungi nuovo pulsantein alto a destra e selezionare Crea data mart.
    • Individuare la risorsa Archiviazione e fare clic sull'icona nell'angolo in basso a destra. Quindi, selezionare Crea data mart.

    Si aprirà la finestra di dialogo Crea data mart

  3. Fornire un nome al data mart e, facoltativamente, fornire anche una descrizione.

  4. Se si desidera configurare il data mart in un secondo momento, deselezionare la casella di controllo Apri e quindi fare clic su Crea. Altrimenti, basta fare clic su Crea.

    Il data mart si apre sulla scheda Data mart.

  5. Selezionare i dati sorgente come descritto in Selezione dei dati sorgente
  6. Se si desidera che il data mart contenga dimensioni, aggiungere le dimensioni come descritto in Aggiungere dimensioni e un fatto al data mart
  7. Se si desidera che il data mart contenga un fatto, aggiungere un fatto come descritto in Aggiunta di un fatto
  8. Se il data mart contiene sia dimensioni che un fatto, aggiungere le dimensioni allo schema a stella come descritto in Costruire uno schema a stella
  9. Creare i set di dati nel data mart e popolarli con i dati, come descritto nella sezione Popolamento del data mart

Selezione dei dati sorgente

Selezionare i dati di origine dal set di dati nell'attività dati Archiviazione.

Operazione da eseguire:

  1. Fare clic sul pulsante Seleziona dati sorgente al centro della scheda o fare clic sul pulsante Seleziona dati sorgente nella barra degli strumenti.

    Si apre la finestra di dialogo Seleziona dati sorgente.

  2. Dall'elenco a discesa Asset di dati, selezionare un'attività di Archiviazione o un'attività di Trasformazione se si sono create trasformazioni.

  3. Lasciare la % predefinita per cercare tutti i set di dati o inserire il nome di un set di dati specifico da trovare. Quindi, fare clic su Cerca.

  4. Selezionare le set di dati desiderate e quindi fare clic su Aggiungi tabelle selezionate.

  5. Fare clic su OK per chiudere la finestra di dialogo, quindi procedere con Aggiungi fatto e/o Aggiungi dimensioni.

Nota informaticaÈ possibile ripetere il processo per aggiungere set di dati da altre attività di dati.

Aggiungere dimensioni e un fatto al data mart

Dopo aver selezionato i dati sorgente, è quindi possibile procedere alla creazione del data mart. Un data mart può avere un set di dati sui fatti, uno sulle dimensioni o una combinazione di entrambi (dove i set di dati sulle dimensioni sono logicamente correlati al set di dati sui fatti).

Aggiunta di dimensioni

Per aggiungere una dimensione:

  1. Fare clic sul pulsante Aggiungi dimensione.

    Si apre la finestra di dialogo Aggiungi dimensione.

  2. Sono disponibili le impostazioni seguenti:

    • Set di dati più granulare: Selezionare un set di dati.
    • Nome: Specificare un nome visualizzato per la dimensione. L'impostazione predefinita è il nome del set di dati più granulare.
    • Descrizione: Facoltativamente, fornire una descrizione.
    • Tipo cronologia: Selezionare una delle opzioni seguenti:
      • Tipo 1: il record esistente nella dimensione verrà aggiornato ogni volta che verrà aggiornato il record corrispondente in Archiviazione.
      • Tipo 2: un nuovo record verrà aggiunto alla dimensione ogni volta che verrà aggiornato il record corrispondente in Archiviazione.
    • Set di dati correlato da denormalizzare: Tutti i set di dati che possono essere denormalizzati nel set di dati dimensionale (in base alle relazioni nel modello dell'asset di dati sorgente) saranno qui disponibili per la selezione.

       

      Esempio di una dimensione che può essere denormalizzata

      Esempio di una dimensione con relative dimensioni

  3. Fare clic su OK per salvare le impostazioni.

    La dimensione verrà aggiunta all'elenco Dimensioni a sinistra.

Vedere anche Dimensioni che svolgono un ruolo.

Visualizzazione delle informazioni su una dimensione

Quando si seleziona una dimensione, la scheda Modello relazionale sorgente verrà visualizzata nel riquadro centrale. Questa scheda mostra i set di dati di origine consolidati nella dimensione. Una volta aggiunta la dimensione, i set di dati che si è scelto di denormalizzare verranno mostrati come selezionati (e disattivati).

Dimensione Prodotti denormalizzata con i set di dati Categorie e Fornitori

Aggiunta di un fatto

Per aggiungere un fatto:

  1. Fare clic sul pulsante Aggiungi fatto.

    Verrà visualizzata la finestra di dialogo Aggiungi fatto.

  2. Sono disponibili le impostazioni seguenti:

    • Fatto: Selezionare un set di dati che sia il fatto. il set di dati deve definire la granularità del fatto che si sta creando.
    • Nome: Specificare un nome visualizzato per il fatto. L'impostazione predefinita è il nome del fatto.
    • Descrizione: Facoltativamente, fornire una descrizione.
    • Set di dati correlati da denormalizzare: Tutti i set di dati che possono essere denormalizzati nel set di dati dei fatti saranno disponibili qui per la selezione.
    • Avanzate
      • Usa dati correnti: Quando questa opzione è selezionata (impostazione predefinita), i dati non conterranno una colonna con la data della transazione.
      • Scegli data di transazione: per individuare i dati in base a una data di transazione specifica, selezionare questa opzione, quindi selezionare una colonna per la data. Questa opzione è utile quando lo schema a stella utilizzato contiene dimensioni di tipo 2 e si desidera trovare i dati corretti per una transazione specifica. Ad esempio, se un cliente ha più indirizzi, è possibile trovare quello corretto in base alla data dell'ordine.

        Caso d'uso di esempio:

        Un rivenditore ha bisogno di creare un data mart per analizzare la relazione tra ordini e clienti. Il data mart dovrebbe poter rispondere a query quali, ad esempio: Quale stato degli Stati Uniti ha la somma maggiore di ordini nel quarto trimestre del 2022?

         

        Se il rivenditore seleziona l'opzione Usa dati correnti, solo la versione più recente del record nella tabella Clienti sarà inclusa nel calcolo.

        Ignorando la data della transazione si otterranno dati imprecisi, come illustrato di seguito:

         

        Mostra la relazione tra la tabella dei fatti degli ordini e la dimensione Clienti quando è selezionato Usa dati correnti.

         

        Se il rivenditore seleziona l'opzione Scegli data transazione, tuttavia, gli ordini del cliente saranno associati alla versione corretta del record nella tabella Clienti.

        Ciò consentirà al rivenditore di calcolare con precisione la somma totale degli ordini per Stato nel quarto trimestre del 2022.

         

        Mostra la relazione tra la tabella dei fatti degli ordini e la dimensione Clienti quando è selezionato Usa data transazione.

        Nota di suggerimentoSi noti che la data della transazione può essere sfruttata in modo diverso in ogni data mart, a seconda delle esigenze aziendali. Ad esempio, in un data mart potrebbe essere utilizzato per analizzare le date degli ordini, mentre in un altro data mart potrebbe essere utilizzato per analizzare le date di spedizione.
  3. Fare clic su OK per salvare le impostazioni.

    Il fatto sarà aggiunto all'elenco Fatti a sinistra.

Visualizzazione delle informazioni sul fatto

Quando si seleziona un fatto, nel riquadro centrale vengono visualizzate le seguenti schede:

  • Modello schema a stella (predefinito): mostra una rappresentazione grafica delle relazioni tra i set di dati all'interno del data mart.
  • Modello dei fatti: mostra eventuali set di dati correlati al set di dati dei fatti. Una volta aggiunto il fatto, i set di dati che si è scelto di denormalizzare verranno mostrati come selezionati (e disattivati).

     

    Fatto Dettagli Ordini con un set di dati Ordini denormalizzato

  • Data transazione: il nome della colonna della transazione se si è selezionato l'opzione Scegli data di transazione quando si è aggiunto il fatto.

Costruire uno schema a stella

Una volta aggiunte le dimensioni al data mart, è quindi possibile procedere a collegarle ai set di dati dei fatti, creando così uno schema a stella.

Operazione da eseguire:

  1. Selezionare il fatto nell'elenco Fatti a sinistra.
  2. Selezionare le dimensioni da aggiungere dall'elenco Dimensioni consigliate a destra.

    Le dimensioni consigliate sono mostrate collegate al set di dati dei fatti con una linea punteggiata.

    Nell'immagine sottostante, alcune delle dimensioni sono state aggiunte prima e quindi sono collegate da una linea continua di colore grigio.

  3. Fare clic su Applica per aggiungere le dimensioni.

    Le dimensioni verranno visualizzate collegate al set di dati dei fatti con una linea continua di colore grigio.

  4. Per chiudere il pannello Dimensioni consigliate fare clic su .

Popolamento del data mart

Una volta progettato il data mart, è quindi possibile procedere a popolarlo.

Operazione da eseguire:

  1. Fare clic sul pulsante Prepara della barra strumenti in alto a destra.

    Il processo di preparazione include la creazione di set di dati e visualizzazioni nel data mart e l'aggiornamento del catalogo.

    È possibile seguire l'avanzamento in Avanzamento preparazione nella parte inferiore dello schermo.

    Al termine della preparazione, il pulsante Prepara cambia in Esegui.

  2. Facoltativamente, convalidare il data mart come descritto nella sezione Convalida e sincronizzazione di un data mart di seguito.

  3. Fare clic sul pulsante Esegui.

    La finestra passa alla vista Monitora, che mostra l'avanzamento del caricamento e lo stato dei set di dati nel data mart.

Ogni record sorgente verrà elaborato dal data mart, anche i record eliminati. Questo viene fatto per garantire che le informazioni storiche siano conservate.

Nota informaticaPer i set di dati dimensione con cronologia di tipo 2, il conteggio dei record elaborati includerà tutte le righe della versione per un record e mostrerà un valore maggiore del numero dei record reali elaborati.

Convalida e sincronizzazione di un data mart

La convalida dei data mart consente di assicurare che i metadati del data mart siano identici ai metadati corrispondenti nell'asset di dati della relativa sorgente (in Archiviazione o Trasformazione, se definito). La convalida del data mart consente inoltre di confrontare i metadati creati con la progettazione dello schema a stella corrente. Ad esempio, se si esegue la convalida dopo aver aggiunto una dimensione a un data mart creato in precedenza, la convalida non verrà eseguita.

Per convalidare il data mart:

  1. Selezionare Convalida set di dati dal menu a destra del pulsante Esegui o fare clic sul pulsante Convalida set di dati nella parte inferiore destra della finestra.

    Verrà visualizzato il messaggio Convalida completata.

  2. Se i metadati non sono sincronizzati o se sono presenti conflitti nella progettazione dello schema a stella, il pannello Convalida e regola nella parte inferiore della finestra si aprirà automaticamente con il report della convalida.

  3. Per risolvere qualsiasi problema relativo alle Modifiche al design in attesa, fare clic sul pulsante in alto a destra e selezionare Prepara. Se il valore della colonna Alterabile senza perdita di dati è , verrà eseguita un'operazione ALTER. In caso contrario, le tabelle del data mart verranno ricreate.

    Notare che tutti gli Errori di convalida devono essere risolti manualmente.

Gestione dei data mart

Questa sezione descrive le varie opzioni disponibili per la gestione dei set di dati e dei data mart.

Affinare fatti o dimensioni

Nella scheda Set di dati, è possibile eseguire varie operazioni per affinare fatti e dimensioni, come la creazione di regole di trasformazione (ad esempio, la sostituzione dei valori delle colonne) e l'aggiunta di espressioni a livello di colonna. La scheda Set di dati si trova a destra della scheda Data mart:

Scheda Set di dati

Scheda Set di dati per la gestione di set di dati di fatti e dimensioni

Aggiunta di regole

Per una spiegazione su come aggiungere regole globali, vedere Creazione di regole per la trasformazione di set di dati

Nota informaticaPer ulteriori informazioni sulle regole e su altre operazioni che è possibile eseguire sui set di dati, vedere Gestione dei data mart. Si tenga presente che alcune delle opzioni come il filtraggio e la ridenominazione dei set di dati non sono disponibili per attività dati in Data Mart.

Aggiunta di colonne ed espressioni

Per una spiegazione su come aggiungere colonne ed espressioni, vedere Aggiunta di colonne a un set di dati.

Dimensioni che svolgono un ruolo

Le dimensioni che svolgono un ruolo sono delle dimensioni che vengono utilizzate più volte in uno schema a stella, ma con significati differenti. Si tratta di una funzione comune nelle dimensioni Data e Cliente. Ad esempio, uno schema a stella potrebbe avere due entità Data, una che rappresenta la Data ordine e un'altra che rappresenta la Data di ricezione.

Per aggiungere o modificare il nome del ruolo di una dimensione:

  1. fare clic sull'icona nel nodo della dimensione e selezionare Modifica ruolo.
  2. Nella finestra di dialogo Modifica ruolo, inserire un nome (o modificare un nome esistente) nel campo Nome ruolo in uno schema a stella e fare clic su OK.

    Il nome del ruolo verrà visualizzato sotto il nome della dimensione.

Opzioni di gestione aggiuntive

La tabella seguente descrive ulteriori opzioni di gestione:

A Azione da eseguire
Aggiungere ulteriori set di dati di origine Vedere Selezione dei dati sorgente.
Aggiungere ulteriori fatti Vedere Aggiunta di un fatto
Aggiungere ulteriori dimensioni Vedere Aggiungere dimensioni e un fatto al data mart.
Eliminare una dimensione Selezionare la dimensione nel riquadro Dimensioni, quindi selezionare Eliminadal menu .
Eliminare un fatto Selezionare il fatto nel riquadro Fatti, quindi selezionare Elimina dal menu .
Ricreare un data mart Fare clic sul pulsante in alto a destra e selezionare Ricrea tabelle. Potrebbe essere necessario ricreare un data mart se, ad esempio, in Archiviazione sono presenti modifiche che non possono essere sincronizzate automaticamente con il data mart.
Arresta un'attività di data mart in esecuzione Fare clic sul pulsante Stop in alto a destra.
Preparazione di un'attività data mart

Fare clic sul pulsante in alto a destra e selezionare Prepara per sincronizzare i set di dati con le risorse Trasforma o Archiviazione e risolvere qualsiasi conflitto di progettazione. Questa funzione prepara un'attività per l'esecuzione. Include le seguenti operazioni:

  • Convalida della validità della progettazione.

  • Creazione o modifica delle tabelle fisiche e delle visualizzazioni in modo che corrispondano alla progettazione.

  • Generazione del codice SQL per l'attività dati.

  • Creazione o modifica delle voci del catalogo per i set di dati di output dell'attività.

È possibile seguire l'avanzamento in Avanzamento preparazione nella parte inferiore dello schermo.

Pianificazione di un'attività data mart

È possibile pianificare un'attività data mart da aggiornare regolarmente. È possibile configurare una pianificazione basata sul tempo, oppure impostare l'attività da eseguire una volta terminata l'esecuzione delle attività di dati di input.

Fare clic su ... su un'attività di dati e selezionare Pianificazione per creare una pianificazione. L'impostazione della pianificazione predefinita viene ereditata dalle impostazioni nel progetto dati. Per ulteriori informazioni sulle impostazioni predefinite, vedere Valori predefiniti data mart.

Per attivare la pianificazione, è sempre necessario impostare Pianificazione su Attiva.

Pianificazioni basate sul tempo

È possibile utilizzare una pianificazione basata sul tempo per eseguire un'attività indipendentemente da quando vengono aggiornate le sorgenti di input.

  • Selezionare In base a un orario specifico in Avvia attività di dati.

È possibile impostare una pianificazione giornaliera, settimanale o mensile.

Pianificazioni basate su un evento

È possibile usare una pianificazione basata su un evento per eseguire un'attività determinata una volta terminata l'esecuzione delle attività di dati di input.

  • Selezionare In base a un evento specifico in Avvia attività di dati.

È possibile selezionare se si desidera eseguire l'attività quando viene completata una qualsiasi delle attività di input, oppure quando viene completata qualsiasi selezione di attività di input.

Nota informaticaL'attività non verrà eseguita se qualsiasi attività di input o attività downstream è in esecuzione quando viene attivata la pianificazione. L'attività viene ignorata fino all'esecuzione della pianificazione successiva.

Ricaricamento di dati

È possibile eseguire il ricaricamento manuale dei dati. Questa funzionalità è utile quando si presentano dei problemi con una o più tabelle.

  1. Aprire l'attività dati e selezionare la scheda Monitora.

  2. Selezionare le tabelle che si desidera ricaricare.

    Quando una dimensione viene selezionata per il ricaricamento, anche tutte le azioni che utilizzano quella dimensione verranno ricaricati per mantenere l'integrità.

  3. Fare clic su Ricarica tabelle.

È possibile annullare il ricaricamento per le tabelle con ricaricamento in attesa facendo clic su Annulla ricaricamento. Questa azione non avrà alcun effetto sulle tabelle che sono state già ricaricate e i ricaricamenti attualmente in esecuzione verranno completati.

Il ricaricamento viene eseguito nei seguenti modi:

  1. Troncando le dimensioni e i fatti selezionati.

  2. Caricando le tabelle delle dimensioni selezionate dall'attività dati a monte.

  3. Caricando le tabelle dei fatti dall'attività dati a monte. Sono incluse le seguenti tabelle:

    • Le tabelle selezionate in modo esplicito.

    • Le tabelle dei fatti che sono correlate a una dimensione ricaricata.

Nota informaticaSe si ricarica una dimensione x e il fatto correlato a, e quindi si crea un nuovo fatto b utilizzando sempre la dimensione x, il fatto b non verrà ricaricato automaticamente. È necessario ricaricare il nuovo fatto b manualmente.

Impostazioni data mart

Fare clic sul pulsante Impostazioni della barra degli strumenti per aprire la finestra di dialogo Impostazioni: <nome-data-mart>.

Nota di avvisoSe l'attività è già stata eseguita, la modifica di un'impostazione diversa da quella di Runtime richiede la ricreazione dei set di dati.

Scheda Info generali

Nella scheda Generale sono disponibili le seguenti impostazioni:

  • Database: il database in cui sarà creato il data mart
  • Schema attività dati: lo schema in cui saranno creati i set di dati
  • Schema interno: lo schema in cui saranno creati i set di dati interni
  • Prefisso per tutte le tabelle e le visualizzazioni

    È possibile impostare un prefisso per tutte le tabelle e visualizzazioni create per questa attività.

    Nota informaticaSe si desidera utilizzare uno schema del database per più attività, è necessario usare un prefisso univoco.

Scheda Tempo di esecuzione

Nella scheda Tempo di esecuzione sono disponibili le seguenti impostazioni:

  • Esecuzione parallela: Immettere il numero massimo di connessioni al database che a Qlik Cloud è consentito aprire per l'attività. Il numero predefinito è 10.
  • Warehouse: rilevante solo per Snowflake. Nome del data warehouse Snowflake.

Ulteriori informazioni

Hai trovato utile questa pagina?

Se riscontri problemi con questa pagina o con il suo contenuto – un errore di battitura, un passaggio mancante o un errore tecnico – facci sapere come possiamo migliorare!