Vai al contenuto principale Passa a contenuto complementare

Creazione di uno sprint di risoluzione da un file CSV

È possibile creare uno sprint di risoluzione da un file CSV contenente i dati da convalidare.

Prerequisiti

Prima di creare lo sprint, è necessario:

  • Uno spazio da utilizzare durante la creazione dello sprint.

    I proprietari/creatori dello sprint devono disporre delle seguenti autorizzazioni nello spazio: Può gestire, Può modificare, Può visualizzare, Può visualizzare i dati

    I Data steward devono avere le seguenti autorizzazioni nello spazio: Può modificare, Può visualizzare, Può visualizzare i dati

  • Una connessione al data warehouse Snowflake che si desidera utilizzare per archiviare i dati dello sprint. Non utilizzare un gateway dati per la connessione.

    Tutti gli utenti dello sprint devono avere le seguenti autorizzazioni nello spazio della connessione: Può modificare, Può visualizzare, Può visualizzare i dati

    È possibile creare una connessione in Connessioni nel Qlik Talend Data Integration centro attività.

    Per ulteriori informazioni sulle connessioni Snowflake, vedere Snowflake.

Creazione di uno sprint

Per creare uno sprint di risoluzione, fare clic su Crea sprint in Stewardship dei dati nel centro attività Qlik Talend Data Integration.

Impostazioni generali dello sprint

  1. Nome

    Aggiungere un nome per lo sprint.

  2. Spazio

    Selezionare lo spazio in cui creare lo sprint.

  3. Descrizione

    Aggiungere una descrizione dello sprint.

  4. Origine per il popolamento dello sprint

    Selezionare File.

    Importare il file CSV contenente i dati che si desidera convalidare.

Fai clic su Avanti quando sei pronto per procedere alla definizione dello schema dei dati.

Definisci lo schema dei dati

Ora puoi convalidare lo schema dei dati utilizzato per convalidare i dati e adattarlo alle tue esigenze. Gli indicatori di qualità dei dati vengono visualizzati per ogni colonna e i dati potenzialmente non validi vengono evidenziati. Questo si basa su un campione dei dati.

Blocca colonne

Fai clic su ... su una colonna e seleziona Blocca per bloccare la colonna per la modifica nello sprint. I dati della colonna saranno comunque visibili ma non potranno essere modificati dai data steward.

Escludi colonne

Fai clic su ... su una colonna e seleziona Escludi per escludere la colonna dallo sprint. I dati della colonna non saranno visibili agli steward dei dati.

Applica un tipo semantico a una colonna

La colonna utilizzerà il suo tipo di dati nativo come predefinito. È possibile applicare un tipo semantico alla colonna per assistere gli steward durante la convalida dei dati.

  • Seleziona la colonna e fai clic Modifica accanto a Tipo di dati. Ora puoi selezionare un tipo semantico da applicare alla colonna.

Puoi anche modificare il nome e la descrizione per ogni colonna.

Fai clic su Avanti quando sei pronto per procedere a definire l'archiviazione dei dati.

Aggiungi una regola di convalida a una colonna

Puoi applicare regole di convalida a una colonna per facilitare l'individuazione dei dati non validi. I dati non validi verranno evidenziati nella colonna.

  • Selezionare la colonna e fare clic su Applica regola di convalida. È possibile selezionare una regola di convalida esistente o crearne una nuova.

Per maggiori informazioni sulla creazione di regole di convalida, vedere Creating a validation rule.

Connettersi all'archivio dati

Devi connetterti al data warehouse cloud che desideri utilizzare per archiviare i dati dello sprint. Snowflake è attualmente l'unico data warehouse supportato.

  1. Seleziona la connessione al data warehouse.

  2. Seleziona quale database utilizzare.

  3. Seleziona se desideri utilizzare uno schema di database esistente o un nuovo schema di database.

    Se selezioni Nuovo schema di database, imposta il nome del nuovo schema.

  4. Imposta il nome della tabella da utilizzare per i dati di sprint risolti in Nome tabella per i record risolti.

Fai clic su Avanti quando sei pronto per procedere a definire ruoli e altre impostazioni per il flusso di lavoro dello sprint.

Definisci ruoli e impostazioni per il flusso di lavoro dello sprint

L'ultimo passaggio consiste nel definire ruoli e altre impostazioni.

  1. Aggiungi proprietari

    Aggiungi tutti gli utenti che dovrebbero essere proprietari dello sprint.

  2. Aggiungi steward

    Aggiungi tutti i data steward per questo sprint.

  3. Flusso di dati record

    Puoi selezionare se vuoi aggiungere un secondo passaggio di convalida da parte dei proprietari dello sprint.

    Nota informaticaSe un utente che è sia proprietario dello sprint che data steward convalida un record, il secondo passaggio di convalida viene ignorato.
  4. Assegnazione record

    Seleziona se desideri assegnare automaticamente i record, o se desideri assegnare manualmente i record ai data steward.

    • Automatica

      I record vengono assegnati automaticamente ai data steward con una distribuzione uniforme. I record non verranno assegnati ai proprietari dello sprint che non sono anche un data steward.

    • Manuale

      I record inizialmente non verranno assegnati a un data steward. I proprietari di Sprint e gli steward dei dati possono assegnare record da Non assegnati.

  5. Priorità

    È possibile impostare la priorità per lo sprint.

Fare clic su Salva quando si è pronti per creare lo sprint.

Lo sprint è stato creato e gli steward dei dati assegnati possono iniziare a convalidare i dati.

 

Hai trovato utile questa pagina?

Se riscontri problemi con questa pagina o con il suo contenuto – un errore di battitura, un passaggio mancante o un errore tecnico – ti pregiamo di farcelo sapere!