Zu Hauptinhalt springen Zu ergänzendem Inhalt springen

Erstellen von Datensätzen

Wie gehen Sie vor, um einen vollständig neuen Datensatz zu erstellen?

Prozedur

  1. Gehen Sie zu Datasets (Datensätze) > Add dataset (Datensatz hinzufügen).
  2. Geben Sie im Fensterbereich Add a new dataset (Neuen Datensatz hinzufügen) einen Namen für den Datensatz an und wählen Sie die Verbindung aus, in der Sie den Datensatz erstellen möchten.
    Wenn Sie einen Datensatz für eine Verbindung hinzufügen möchten, die nicht existiert, können Sie die Verbindung direkt in der Dropdown-Liste connection (Verbindung) erstellen.
  3. Fügen Sie nach Bedarf eine Beschreibung hinzu und legen Sie die erforderlichen Eigenschaften des Datensatzes fest.
    • Bei S3- und HDFS-File-Storage-Verbindungen können Sie über die Schaltfläche Auto detect (Autom. erkennen) das Format Ihrer Daten (CSV, Excel, Avro oder Parquet) automatisch ermitteln und angeben.

    • Die Datensatztypen Abfrage und Tabelle sind nicht kompatibel, da eine Datenbank vom Typ Abfrage nicht als Zieldatensatz verwendet werden kann. Wenn Sie somit versuchen, in der Datenbankkonfiguration nach dem Speichern den Typ zu ändern, wird eine Prüfung der Pipeline ausgelöst, um zu ermitteln, ob dieser Vorgang durchgeführt werden kann.

  4. (Optional) Klicken Sie auf View sample (Sample anzeigen), um eine Vorschau der ersten Datensätze Ihres Datensatz-Samples anzuzeigen.
  5. Klicken Sie auf Validate (Validieren), um den Datensatz zu speichern.

Ergebnisse

Der neue Datensatz wird in der Liste auf der Seite Datasets (Datensätze) hinzugefügt und kann jetzt verwendet werden.
Nach der Erstellung können Sie die Detailansicht des Datensatzes aufrufen, um ein Sample der Daten in verschiedenen Formaten anzuzeigen:
  • Grid (Raster): In dieser Ansicht werden die ersten 10.000 Datensätze Ihrer Daten in Tabellenform angezeigt.
  • Hierarchy (Hierarchie): In dieser Ansicht werden die ersten 10.000 Datensätze Ihrer Daten in Form einer Baumstruktur angezeigt.
  • Raw (Roh): In dieser Ansicht wird eine weder bearbeitete noch gefilterte Version der ersten 10.000 Datensätze Ihrer Daten angezeigt.

Erstellen lokaler Datensätze

Sie können lokale CSV-, Excel-, Avro- und Parquet-Dateien direkt in Ihren Datenbestand importieren. Mit der Schaltfläche Add dataset (Datensatz hinzufügen) können Sie Datensätze über unterschiedliche Verbindungen hinzufügen. Wenn Sie jedoch nur eine Ihrer lokalen Dateien importieren möchten, können Sie das ganz einfach über die Option Drag a file or browse (Datei ablegen oder suchen) durchführen.

Procedure

Für den direkten Import eines lokalen Datensatzes stehen Ihnen folgende Möglichkeiten zur Auswahl:
  • Ziehen Sie die lokale Datei und legen Sie sie an einer beliebigen Stelle im Fenster der Datensätze ab.
    Drag&Drop-Fenster
    Fenster, in dem Sie die lokale Datei in Ihrer Cloud-Anwendung ablegen können.
  • Klicken Sie auf die Schaltfläche Drag a file or browse (Datei ablegen oder suchen), um den Explorer zu öffnen und die zu importierende Datei auszuwählen.
    Schaltfläche „Drop a file or browse (Datei ablegen oder suchen)“ zur Auswahl der zu importierenden Datei

Die Datei wird hochgeladen und der lokale Datensatz erstellt. Daraufhin wird die Seite Overview (Übersicht) geöffnet. Wenn noch keine lokale Verbindung eingerichtet wurde, wird das unmittelbar während des Betriebs durchgeführt.

Diese neue Verbindung basiert auf der Cloud Engine for Design, sofern möglich, und verwendet nur dann eine vorhandene Remote Engine Gen2, wenn nur diese zur Verfügung steht.

Sollten Sie bereits über eine lokale Verbindung verfügen, wird beim lokalen Import vorzugsweise auf die älteste, in der Cloud Engine for Design erstellte Verbindung zurückgegriffen und die in einer Remote Engine Gen2 erstellte Verbindung nur nach Bedarf verwendet.

Wenn jedoch zum Zeitpunkt des Imports keine Engine verfügbar ist, wird der lokale Import deaktiviert.

Die Informationen zu den Eigenschaften der CSV-Datei, wie z. B. Maskierungszeichen, Feldbegrenzer usw., wurden automatisch im Hintergrund erfasst. Sie können diese Informationen jedoch jederzeit in Datensatzeigenschaften ändern.

Results

Die lokale Datei wird in der Liste der Datensätze hinzugefügt und eine Local connection (Lokale Verbindung) wird erstellt, wenn bisher noch keine vorhanden war.

Erstellen von Testdatensätzen

Wie erstellen Sie einen Datensatz basierend auf einem von Ihnen manuell eingegebenen Schema?

Testdatensätze stellen eine vorgegebene Gruppe von Werten bereit, ohne dass dazu ein realer Datensatzspeicher vorhanden sein muss, sodass das Produkt ganz problemlos getestet werden kann.

Procedure

  1. Gehen Sie zu Datasets (Datensätze) > Add dataset (Datensatz hinzufügen).
  2. Geben Sie im Fensterbereich Add a new dataset (Neuen Datensatz hinzufügen) einen Namen für den Testdatensatz ein.
  3. Wählen Sie die Testverbindung aus, die Sie zuvor erstellt haben und über die Sie Ihre Daten hinzufügen möchten.
  4. Wählen Sie das Format der Daten aus:
    • CSV: In diesem Fall wird für die Schemafelder folgendes Format erwartet:
      • Muss mit den Zeichen [A-Za-z_] beginnen.
      • Darf nur die Zeichen [A-Za-z0-9_] enthalten.
      • Darf nur durch Semikola getrennt werden.
      Beispiel: Vorname;Nachname;Telefon1;Telefon2;Adresse;Land;Firma
      InformationshinweisNote: Wenn Sie kein Format angeben, wird standardmäßig ein generisches Format erstellt.
    • JSON: In diesem Fall müssen die JSON-Werte einem spezifischen Format entsprechen und konsistent sein: Folge von Datensätzen, einer nach dem anderen, jeweils durch einen Zeilenvorschub (oder nicht) voneinander getrennt. Jeder einzelne Datensatz braucht nicht unbedingt auf einer einzelnen Zeile untergebracht zu sein. Letztendlich entsprechen die Daten im Textbereich nicht einem typischen JSON-Dokument mit eckigen Klammern.

      Beispiel:

        {
          "Id": 3146717,
          "PosTime": 1525097499899,
          "Latitude": 48.8585,
          "Longitude": 2.4921,
          "Operator": "Air France"
        }
        {
          "Id": 3757865,
          "PosTime": 1525097474634,
          "Latitude": 48.5018,
          "Longitude": 2.2246,
          "Operator": "Lufthansa"
        }
    • AVRO: In diesem Fall müssen Sie ebenfalls das Schema Ihrer Avro-Datensätze eingeben. Dieses entspricht einem JSON-Dokument mit spezifischer Syntax, siehe die Beschreibung in der Avro Apache-Dokumentation.
  5. Geben Sie im Bereich Values (Werte) Ihre Daten ein bzw. fügen Sie sie ein.
    Die Größe der Daten darf 32 Kilobyte nicht überschreiten.
    Konfigurationsseite für neuen Datensatz mit manuell eingegebenen JSON-Werten
  6. (Optional) Klicken Sie auf View sample (Sample anzeigen), um zu prüfen, ob die Daten gültig sind.
  7. Klicken Sie auf Validate (Validieren), um den Datensatz zu speichern.

Results

Sie werden zum Fensterbereich „Overview (Übersicht)“ des Datensatzes weitergeleitet, in dem verschiedene Informationen und Metadaten angezeigt werden.

Um den Inhalt des Datensatzes zu visualisieren und zu verstehen, öffnen Sie den Fensterbereich Sample. Sie können dann prüfen, ob Ihre Daten gültig sind.

Fensterbereich mit Datensatz-Sample
Sample-Fensterbereich mit Tabellenansicht der JSON-Datensatzwerte

Hat diese Seite Ihnen geholfen?

Wenn Sie ein Problem mit dieser Seite oder ihrem Inhalt feststellen, sei es ein Tippfehler, ein ausgelassener Schritt oder ein technischer Fehler, informieren Sie uns bitte!