Metadatafilbeskrivning
När alternativet Skapa metadatafiler i målmappen väljs kommer mellanlagringsuppgiften för datasjö att skapa en motsvarande metadatafil i den angivna målmappen för varje CSV-/JSON-/Parquet-fil.
Metadatafilen ger flera fördelar, exempelvis att aktivera anpassade batchprocesser för att få bättre validering, stöd för djupare automatisering, erbjuda ursprungsinformation och förbättra bearbetningens tillförlitlighet.
Metadatafilerna beskrivs i nedanstående tabeller.
Alla tidsmarkörer är i ISO-8601-format, till exempel 2016-08-02T10:05:04.802.
Fält | Beskrivning |
---|---|
namn |
Namnet på mellanlagringsuppgiften för datasjö |
sourceEndpoint |
Det namn som definieras i inställningarna för källslutpunkt. |
sourceEndpointType |
Källkopplingstypen (t.ex. Oracle, MySQL osv.). |
sourceEndpointUser |
Den användare som definieras i inställningarna för källslutpunkt. |
replicationServer |
Värdnamnet på den maskin där Gateway för dataflytt är installerad. |
åtgärd |
Om en måldatafil har skapats kommer det här fältet att innehålla följande värde: dataProduced |
Fält | Beskrivning |
---|---|
namn |
Namnet på datafilen utan komplement. |
komplement |
Komplementet till datafilen (.csv eller .json beroende på valt målfilformat). |
plats |
Datafilens plats. |
startWriteTimestamp |
UTC-tidsmarkör som anger när filen började skrivas till. |
endWriteTimestamp |
UTC-tidsmarkör som anger när filen slutade skrivas till. |
firstTransactionTimestamp |
UTC-tidsmarkör för den första posten i filen. |
lastTransactionTimestamp |
UTC-tidsmarkör för den sista posten i filen. |
content |
Värdena kan antingen vara data (för mellanlagring med fullständig laddning) eller changes (för CDC-mellanlagring) beroende på data i motsvarande CSV-fil. |
recordCount |
Antalet poster i filen. |
errorCount |
Antal datafel som påträffades när filen skapades. |
Fält | Beskrivning |
---|---|
format |
delimited eller json beroende på valt filformat. |
alternativ |
Alternativen för delimited -filformatet. De här alternativen kommer inte att visas för json -formatet eftersom de inte är relevanta. |
recordDelimiter |
Den avgränsare som används för att separera fält (kolumner) i målfilerna. Standard är ett nyradstecken (\n). |
fieldDelimiter |
Den avgränsare som används för att separera fält (kolumner) i målfilerna. Standardvärdet är ett komma. |
nullValue |
Strängen som används för att ange ett nullvärde i målfilen. |
quoteChar |
Det tecken används i början och på slutet av en kolumn. Standard är dubbelcitattecknet ("). |
escapeChar |
Det tecken som används för att skapa ett undantag för en sträng när både strängen och kolumnen som innehåller strängen är omslutna av dubbla citattecken. Observera att strängens citattecken kommer att tas bort om de inte kompletteras med undantagstecken. Exempel (där " är citattecknet och \ är undantagstecknet): 1955,"old, \"rare\", Chevrolet",$1000 |
Fält | Beskrivning |
---|---|
customInfo |
Det här delavsnittet innehåller alla anpassade egenskaper som har ställts in med den interna egenskapen dfmCustomProperties. Den interna parametern dfmCustomProperties måste anges i följande format: Parameter1=Value1;Parameter2=Value2;Parameter3=Value3 Exempel: Color=Blue;Size=Large;Season=Spring En förklaring av hur interna egenskaper ställs in finns i Amazon S3. |
Fält | Beskrivning |
---|---|
sourceSchema |
Schemat innehåller källtabellen. |
sourceTable |
Namnet på källtabellen. |
targetSchema |
Namnet på måltabellschemat (om målschemats namn har ändrats). |
targetTable |
Namnet på måltabellen (om källtabellnamnet har ändrats). |
tableVersion |
Mellanlagringsuppgiften för datasjö tilldelar tabellen ett internt versionsnummer. Versionsnumret ökar när en DDL-ändring sker i källtabellen. |
columns |
Information om tabellkolumnerna. |
ordningstal |
Kolumnens position i posten (1, 2, 3 osv.). |
namn |
Kolumnens namn. |
typ |
Kolumndatatypen: Mer information finns i Supported data types. |
bredd |
Den maximala tillåtna bredden för data (i bytes) för kolumnen. |
scale |
Det maximala tillåtna antalet siffror till höger om decimalkommat för ett tal. |
primaryKeyPos |
Kolumnens position i tabellens Primärnyckel eller Unika index. Värdet är noll om kolumnen inte ingår i tabellens Primärnyckel. |