Zu Hauptinhalt springen

Beschreibung der Metadatendatei

Wenn die Option Metadatendateien im Zielordner erstellen ausgewählt ist, erstellt die Data Lake-Bereitstellungsaufgabe für jede CSV/JSON/Parquet-Datei eine entsprechende Metadatendatei unter dem angegebenen Zielordner.

Die Metadatendatei bietet verschiedene Vorteile: bessere Validierung mit benutzerdefinierten Prozessen, Unterstützung detaillierterer Automatisierung, Bereitstellung von Herkunftsinformationen und zuverlässigere Verarbeitung.

Die Metadatendateien werden in den Tabellen unten beschrieben.

Informationshinweis

Alle Zeitstempel haben das ISO-8601-Format, beispielsweise 2016-08-02T10:05:04.802.

Aufgabeninformationsdatei
Feld Beschreibung

name

Der Name der Data Lake-Bereitstellungsaufgabe.

sourceEndpoint

Der in den Quellendpunkt-Einstellungen definierte Name.

sourceEndpointType

Der Quellkonnektortyp (z. B Oracle, MySQL usw.).

sourceEndpointUser

Der in den Quellendpunkt-Einstellungen definierte Benutzer.

replicationServer

Der Hostname des Computers, auf dem das Data Movement Gateway installiert ist.

operation

Wenn eine Zieldatendatei erstellt wurde, enthält dieses Feld den folgenden Wert: dataProduced

Dateiinformationsdatei
Feld Beschreibung

name

Der Name der Datendatei ohne die Erweiterung.

extension

Die Erweiterung der Datendatei (.csv oder .json, je nach dem ausgewählten Zieldateiformat).

location

Der Speicherort der Datendatei.

startWriteTimestamp

UTC-Zeitstempel, der angibt, wann mit dem Schreiben der Datei begonnen wurde.

endWriteTimestamp

UTC-Zeitstempel, der angibt, wann das Schreiben der Datei beendet wurde.

firstTransactionTimestamp

UTC-Zeitstempel des ersten Datensatzes in der Datei.

lastTransactionTimestamp

UTC-Zeitstempel des letzten Datensatzes in der Datei.

content

Die Werte können entweder data (für Bereitstellung mit vollständigem Laden) oder changes (für CDC-Bereitstellung) sein, je nach den Daten in der zugehörigen CSV-Datei.

recordCount

Die Anzahl der Datensätze in der Datei.

errorCount

Die Anzahl der Datenfehler, die während der Dateierstellung gefunden wurden.

Formatinformationsdatei
Feld Beschreibung

format

delimited oder json , je nach dem ausgewählten Zieldateiformat.

options

Die Optionen für das delimited -Dateiformat. Diese Optionen werden für das json -Format nicht angezeigt, da sie nicht relevant sind.

recordDelimiter

Das Trennzeichen, das zum Trennen von Datensätzen (Zeilen) in den Zieldateien verwendet wird. Der Standardwert ist „neue Zeile“ (\n).

fieldDelimiter

Das Trennzeichen, das zum Trennen von Feldern (Spalten) in den Zieldateien verwendet wird. Das Standardzeichen ist ein Komma.

nullValue

Die Zeichenfolge, die zum Angeben eines Null-Werts in der Zieldatei verwendet wird.

quoteChar

Das Zeichen, das am Anfang und am Ende einer Spalte verwendet wird. Der Standardwert sind gerade doppelte Anführungszeichen (").

escapeChar

Das Zeichen, das als Escape-Zeichen einer Zeichenfolge verwendet wird, wenn sowohl die Zeichenfolge als auch die Spalte, die die Zeichenfolge enthält, in doppelte Anführungszeichen eingeschlossen sind. Beachten Sie, dass die Anführungszeichen der Zeichenfolge entfernt werden, wenn keine Escape-Zeichen vorhanden sind.

Beispiel (wobei " das Anführungszeichen und \ das Escape-Zeichen ist):

1955,"old, \"rare\", Chevrolet",$1000

Benutzerdefinierte Informationsdatei
Feld Beschreibung

customInfo

Dieser Abschnitt enthält alle benutzerdefinierten Parameter, die mit dem internen Parameter dfmCustomProperties festgelegt wurden.

Der interne Parameter dfmCustomProperties muss in folgendem Format angegeben werden:

Parameter1=Value1;Parameter2=Value2;Parameter3=Value3

Beispiel:

Color=Blue;Size=Large;Season=Spring

Eine Erläuterung zum Festlegen interner Parameter finden Sie unter Amazon S3.

Dateninformationsdatei
Feld Beschreibung

sourceSchema

Das Schema, das die Quelltabelle enthält.

sourceTable

Der Name der Quelltabelle.

targetSchema

Der Name des Zieltabellenschemas (wenn der Name des Quellschemas geändert wurde).

targetTable

Der Name der Zieltabelle (wenn der Name der Quelltabelle geändert wurde).

tableVersion

Die Data Lake-Bereitstellungsaufgabe weist der Tabelle eine interne Versionsnummer zu. Die Versionsnummer wird erhöht, sooft eine DDL-Änderung in der Quelltabelle eintritt.

columns

Informationen über die Tabellenspalten.

ordinal

Die Position der Spalte im Datensatz (1, 2, 3 usw.).

name

Der Spaltenname.

type

Der Spaltendatentyp. Weitere Informationen finden Sie unter Supported data types.

width

Die maximale Größe der Daten (in Byte), die für die Spalte zulässig ist.

scale

Die maximale Anzahl Stellen rechts neben dem Dezimalpunkt, die für eine Zahl zulässig sind.

primaryKeyPos

Die Position der Spalte im Primärschlüssel oder eindeutigen Index der Tabelle. Der Wert ist Null, wenn die Spalte nicht zum Primärschlüssel der Tabelle gehört.

Hat diese Seite Ihnen geholfen?

Wenn Sie Probleme mit dieser Seite oder ihren Inhalten feststellen – einen Tippfehler, einen fehlenden Schritt oder einen technischen Fehler –, teilen Sie uns bitte mit, wie wir uns verbessern können!