Azure Data Lake Storage
Azure Data Lake Storage kan worden gebruikt als:
- Een cloudtussengebied bij het gebruik van Databricks, Microsoft Fabric or Azure Synapse Analytics als een doelgegevenspijplijn. Het cloudtussengebied is het gebied waar gegevens en wijzigingen worden klaargezet voordat ze worden toegepast en opgeslagen.
-
Een doel in een replicatietaak.
- Raadpleeg Gegevens tijdelijk opslaan met een Standard-, Premium- of Enterprise-abonnement voor een uitleg over het repliceren van gegevens naar Azure Data Lake Storage met Standard-, Premium- en Enterprise-abonnementen.
- Raadpleeg Gegevens repliceren met een Qlik Talend Cloud Starter-abonnement voor een uitleg over het repliceren van gegevens naar Azure Data Lake Storage met het Starter-abonnement.
Beperkingen en overwegingen
De volgende beperkingen zijn van toepassing:
- Volledige LOB-modus wordt niet ondersteund.
- Databasenamen, schemanamen of tabelnamen die een slash (/) of backslash (\) bevatten, worden niet ondersteund.
Opslagmachtigingen
De Azure Active Directory-tenant die is opgegeven in de connectorinstellingen moet de volgende opslagmachtigingen voor ADLS Gen2 krijgen.
- In de opslagcontainer: LIST
- In de opslagmap: READ, WRITE en DELETE
- In de instellingen voor toegangsbeheer (IAM) voor het ADLS Gen2-bestandssysteem, wijst u de rol 'Storage Blob Data Contributor' toe aan Replicate (AD-app-id). Het kan enkele minuten duren voordat de rol van kracht is.
Verbindingseigenschappen van Azure Data Lake Storage instellen
Ga als volgt te werk om de connector te configureren:
-
Klik in Verbindingen op Verbinding maken.
-
Selecteer de Azure Data Lake Storage -doelconnector en stel de volgende instellingen in:
Gegevensdoel
Gegevensgateway: Selecteer de Gateway voor gegevensverplaatsing die wordt gebruikt om de verbinding met ADLS te testen. Dit moet dezelfde Gateway voor gegevensverplaatsing zijn die is geïmplementeerd om gegevens van de gegevensbron tijdelijk op te slaan.
Verbindingseigenschappen
-
Opslagaccount
Naam van het opslagaccount.
-
Containernaam
Naam van de container die moet worden gebruikt als cloudtussengebied.
-
Tenant-ID van Azure Active Directory
De tenant-ID van het abonnement in Azure Active Directory.
-
Client-ID van Azure-toepassingsregistratie
Client-ID van de toepassing in Azure Active Directory.
-
Registratiegeheim van Azure-toepassing
Het geheim van de toepassing in Azure Active Directory
Naam
De weergavenaam voor de verbinding.
Toewijzing van gegevenstypen
De volgende tabel toont de standaardtoewijzingen van Qlik Cloud-gegevenstypen naar Azure Data Lake Storage-doelgegevenstypen.
Het toewijzen van Qlik Cloud-gegevenstypen aan Azure Data Lake Storage
Qlik Cloud-gegevenstypen | Azure Data Lake Storage-doelgegevenstypen |
---|---|
DATE |
DATE |
TIME |
TIME |
DATETIME |
DATETIME |
BYTES |
BYTES (length) |
BLOB |
BLOB |
REAL4 |
REAL4 (7) |
REAL8 |
REAL8 (14) |
INT1 |
INT1 (3) |
INT2 |
INT2 (5) |
INT4 |
INT4 (10) |
INT8 |
INT8 (19) |
UINT1 |
UINT1 (3) |
UINT2 |
UINT2 (5) |
UINT4 |
UINT4 (10) |
UINT8 |
UINT8 (20) |
NUMERIC |
NUMERIC (p,s) |
STRING |
STRING (Length) |
WSTRING |
STRING (Length) |
CLOB |
CLOB |
NCLOB |
NCLOB |
BOOLEAN |
BOOLEAN (1) |
Qlik Cloud-gegevenstypen toewijzen aan Parquet
Als Parquet is ingesteld als de bestandsindeling, vanwege het beperkt aantal gegevenstypen dat Parquet ondersteunt, zijn de toewijzingen van gegevenstypen als volgt:
Qlik Cloud-gegevenstype | Parquet Primitive-type | Logisch type |
---|---|---|
BOOLEAN |
BOOLEAN |
|
INT1 |
INT32 |
INT(8, true) |
INT2 |
INT32 |
INT(16, true) |
INT4 |
INT32 |
|
INT8 |
INT64 |
|
UINT1 |
INT32 |
INT(8, false) |
UINT2 |
INT32 |
INT(16, false) |
UINT4 |
INT64 |
|
UINT8 |
INT64 |
INT(64, false) |
REAL4 |
FLOAT |
|
REAL8 |
DOUBLE |
|
NUMERIC |
FIXED_LEN_BYTE_ARRAY (16) |
DECIMAL (precisie, schaal) |
STRING |
BYTE_ARRAY |
STRING |
WSTRING |
BYTE_ARRAY |
STRING |
BYTES |
BYTE_ARRAY |
|
BLOB |
BYTE_ARRAY |
|
CLOB |
BYTE_ARRAY |
STRING |
NCLOB |
BYTE_ARRAY |
STRING |
DATE |
INT32 |
DATE |
TIME |
INT32 |
TIME (UTC=true, unit=MILLIS) |
DATETIME |
INT64 |
TIMESTAMP (UTC=true, unit=MICROS) |