Erstellen und Verwalten von Data Marts
Nach dem Onboarding Ihrer Daten können Sie Data Marts erstellen, indem Sie die Daten aus den Speicher- oder Umwandlungs-Aufgaben verwenden. Je nach Ihren geschäftlichen Anforderungen können Sie eine beliebige Anzahl Data Marts erstellen. Im Idealfall enthalten Ihre Data Marts Repositorys zusammengefasster Daten, die für die Analyse eines bestimmten Bereichs oder einer Abteilung in einer Organisation erfasst wurden, beispielsweise der Vertriebsabteilung.
Das Verfahren für die Erstellung eines Data Mart ist immer gleich, unabhängig davon, ob der Data Mart auf einer Speicheraufgabe oder einer Umwandlungsaufgabe basiert. In den Anweisungen in diesem Abschnitt wird angenommen, dass der Data Mart auf einer Speicheraufgabe basiert.
Voraussetzungen
Bevor Sie einen Data Mart erstellen, müssen Sie wie folgt verfahren:
- Füllen Sie den Speicher mit Daten (aus der Bereitstellung), die Sie im Data Mart verwenden möchten. Weitere Informationen finden Sie unter Eingliederung von Daten.
-
Erstellen Sie ein relationales Datensatzmodell, um die Beziehungen zwischen den Quelldatensätzen zu definieren. Weitere Informationen finden Sie unter Erstellung eines Datenmodells.
WarnhinweisAlle Quelldatensätze müssen Schlüssel haben.
Erstellen eines Data Mart
So erstellen Sie einen Data Mart:
-
Öffnen Sie Ihr Projekt.
-
Gehen Sie folgendermaßen vor:
- Klicken Sie oben rechts auf Neu hinzufügen und wählen Sie Data Mart erstellen aus.
-
Klicken Sie in der Speicherdatenaufgabe unten rechts auf und wählen Sie Data Mart erstellen aus.
Das Dialogfenster Data Mart erstellen wird geöffnet.
-
Geben Sie einen Namen und optional auch eine Beschreibung für den Data Mart an.
-
Wenn Sie den Data Mart später konfigurieren möchten, deaktivieren Sie das Kontrollkästchen Öffnen und klicken Sie dann auf Erstellen. Klicken Sie andernfalls einfach auf Erstellen
Der Data Mart wird auf der Registerkarte Data Mart geöffnet.
- Wählen Sie Ihre Quelldaten wie in Auswählen der Quelldaten beschrieben aus.
- Wenn Sie möchten, dass der Data Mart Dimensionen enthält, fügen Sie Dimensionen wie in Hinzufügen von Dimensionen und eines Fakts zum Data Mart beschrieben hinzu.
- Wenn Sie möchten, dass der Data Mart einen Fakt enthält, fügen Sie einen Fakt wie in Hinzufügen eines Fakts beschrieben hinzu.
- Wenn der Data Mart sowohl Dimensionen als auch einen Fakt enthalten soll, fügen Sie die Dimensionen wie in Erstellen eines Sternschemas beschrieben zu Ihrem Sternschema hinzu.
- Erstellen Sie die Datensätze im Data Mart und füllen Sie sie wie in Auffüllen des Data Mart beschrieben mit Daten.
Auswählen der Quelldaten
Ihre Quelldaten wählen Sie in den Datensätzen in der Speicherdatenaufgabe aus.
Gehen Sie wie folgt vor:
-
Klicken Sie in der Mitte der Registerkarte auf die Schaltfläche Quelldaten auswählen, oder klicken Sie in der Symbolleiste auf Quelldaten auswählen.
Das Dialogfeld Quelldaten auswählen wird geöffnet.
-
Wählen Sie in der Dropdown-Liste Datenobjekte eine Speicheraufgabe oder eine Umwandlungsaufgabe (wenn Sie Umwandlungen erstellt haben) aus.
-
Behalten Sie den Standardwert „%“ bei, um nach allen Datensätzen zu suchen, oder geben Sie den Namen eines bestimmten Datensatzes für die Suche ein. Klicken Sie dann auf Suchen.
-
Wählen Sie die gewünschten Datensätze aus und klicken Sie dann auf Ausgewählte Tabellen hinzufügen.
-
Klicken Sie auf OK, um das Dialogfeld zu schließen, und fahren Sie mit Fakt hinzufügen bzw. mit Dimensionen hinzufügen fort.
Hinzufügen von Dimensionen und eines Fakts zum Data Mart
Nachdem Sie Ihre Datenquelle ausgewählt haben, können Sie mit dem Erstellen des Data Mart fortfahren. Ein Data Mart kann einen Faktdatensatz, Dimensionsdatensätze oder eine Kombination aus beiden enthalten (wenn die Dimensionsdatensätze eine logische Beziehung zu dem Faktdatensatz haben).
Hinzufügen von Dimensionen
So fügen Sie eine Dimension hinzu:
-
Klicken Sie auf die Schaltfläche Dimension hinzufügen.
Das Dialogfeld Dimension hinzufügen wird geöffnet.
-
Die folgenden Einstellungen sind verfügbar:
- Datensatz mit höchster Granularität: Wählen Sie einen Datensatz aus.
- Name: Geben Sie einen Anzeigenamen für die Dimension an. Der Standard ist der Datensatzname mit der höchsten Granularität.
- Beschreibung: Geben Sie optional eine Beschreibung an.
- Verlaufstyp: Wählen Sie eine der folgenden Optionen aus:
- Typ 1: Der vorhandene Datensatz in der Dimension wird aktualisiert, sooft der zugehörige Datensatz im Speicher aktualisiert wird.
- Typ 2: Ein neuer Datensatz wird der Dimension hinzugefügt, sooft der zugehörige Datensatz im Speicher aktualisiert wird.
-
Zu denormalisierender zugehöriger Datensatz: Alle Datensätze, die im Dimensionsdatensatz denormalisiert werden können (entsprechend der Beziehungen im Modell des Quelldatenobjekts) können hier ausgewählt werden.
-
Klicken Sie auf OK, um Ihre Einstellungen zu speichern.
Die Dimension wird links zur Liste Dimensionen hinzugefügt.
Siehe auch Dimensionen mit unterschiedlichen Rollen.
Anzeigen von Informationen über eine Dimension
Wenn Sie eine Dimension auswählen, wird im mittleren Bereich die Registerkarte Relationales Quellmodell angezeigt. Diese Registerkarte enthält die Quelldatensätze, die in der Dimension konsolidiert sind. Datensätze, für die Sie beim Hinzufügen der Dimension die Denormalisierung gewählt hatten, werden ausgewählt (ausgegraut) angezeigt.
Hinzufügen eines Fakts
So fügen Sie einen Fakt hinzu:
-
Klicken Sie auf die Schaltfläche Fakt hinzufügen.
Der Dialog Fakt hinzufügen wird geöffnet.
-
Die folgenden Einstellungen sind verfügbar:
- Fakt: Wählen Sie einen Datensatz als Fakt aus. Im Datensatz muss die Granularität des erstellten Fakts definiert sein.
- Name: Geben Sie einen Anzeigenamen für den Fakt an. Der Standardwert ist der Faktname.
- Beschreibung: Geben Sie optional eine Beschreibung an.
- Zu denormalisierende zugehörige Datensätze: Alle Datensätze in Ihrem Faktdatensatz, die denormalisiert werden können, können hier ausgewählt werden.
- Erweitert
- Aktuelle Daten verwenden: Wenn die Option ausgewählt ist (Standard), enthält der Fakt keine Transaktionsdatumsspalte.
-
Transaktionsdatum auswählen: Um Daten für ein bestimmtes Transaktionsdatum zu finden, wählen Sie diese Option aus und wählen Sie dann eine Datumsspalte aus. Das ist nützlich, wenn Ihr Sternschema Dimensionen vom Typ 2 enthält und Sie die korrekten Daten für eine bestimmte Transaktion finden müssen. Wenn beispielsweise ein Kunde mehrere Adressen hat, kann es möglich sein, die richtige Adresse anhand des Bestelldatums zu finden.
Beispiel-Anwendungsfall:
Ein Einzelhändler möchte einen Data Mart erstellen, um die Beziehung zwischen Bestellungen und Kunden zu analysieren. Der Data Mart sollte Fragen wie die folgende beantworten können: Welcher US-Bundesstaat hatte den höchsten Bestellbetrag in Q4 2022?
Wenn der Einzelhändler die Option Aktuelle Daten verwenden auswählt, wird nur die aktuellste Datensatzversion in der Tabelle Customers in die Berechnung einbezogen.
Wenn das Transaktionsdatum ignoriert wird, führt dies wie unten gezeigt zu ungenauen Daten:
Wenn der Einzelhändler dagegen die Option Transaktionsdatum auswählen auswählt, werden die Kundenbestellungen mit der korrekten Datensatzversion in der Tabelle Customers verknüpft.
Damit kann der Einzelhändler auch die Gesamtsumme der Bestellungen pro Bundesstaat in Q4 2022 korrekt berechnen.
TipphinweisBeachten Sie, dass das Transaktionsdatum in jedem Data Mart unterschiedlich eingesetzt werden kann, je nach den geschäftlichen Anforderungen. Beispielsweise können in einem Data Mart damit das Bestelldatum analysiert werden, während es in einem anderen Data Mart um das Versanddatum geht.
-
Klicken Sie auf OK, um Ihre Einstellungen zu speichern.
Der Fakt wird dann links zur Liste Fakte hinzugefügt.
Anzeigen von Informationen über den Fakt
Wenn Sie einen Fakt auswählen, werden die folgenden Registerkarten im mittleren Bereich angezeigt:
- Sternschemamodell (Standard): Zeigt eine grafische Darstellung der Datensatzbeziehungen innerhalb des Data Mart.
-
Faktmodell: Zeigt jegliche Datensätze mit Beziehung zum Faktdatensatz. Datensätze, für die Sie beim Hinzufügen des Fakts die Denormalisierung gewählt hatten, werden ausgewählt (ausgegraut) angezeigt.
- Transaktionsdatum: Der Name der Transaktionsspalte, wenn Sie beim Hinzufügen des Fakts die Option Transaktionsdatum auswählen ausgewählt haben.
Erstellen eines Sternschemas
Nachdem Sie Dimensionen zu Ihrem Data Mart hinzugefügt haben, können Sie sie mit Ihrem Faktdatensatz verbinden und damit ein Sternschema erstellen.
Gehen Sie wie folgt vor:
- Wählen Sie den Fakt in der Liste Fakte auf der linken Seite aus.
-
Wählen Sie, welche Dimensionen aus Empfohlene Dimensionen auf der rechten Seite hinzugefügt werden sollen.
Empfohlene Dimensionen werden mit einer gestrichelten Linie als mit dem Faktdatensatz verbunden angezeigt.
In der Abbildung unten wurden einige Dimensionen früher hinzugefügt und sind daher mit einer durchgezogenen grauen Linie verbunden.
-
Klicken Sie auf Anwenden, um die Dimensionen hinzuzufügen.
Die Dimensionen werden mit einer durchgezogenen grauen Linie als mit dem Faktdatensatz verbunden angezeigt.
-
Klicken Sie auf , um das Fenster Empfohlene Dimensionen zu schließen.
Auffüllen des Data Mart
Nachdem Sie den Data Mart entworfen haben, können Sie ihn auffüllen.
Gehen Sie wie folgt vor:
-
Klicken Sie oben rechts auf die Symbolleistenschaltfläche Vorbereiten.
Zum Vorbereitungsprozess gehören das Erstellen von Datenbanken und Ansichten im Data Mart und das Aktualisieren des Katalogs.
Sie können den Fortschritt unter Vorbereitungsfortschritt unten im Bildschirm verfolgen.
Nachdem die Vorbereitung abgeschlossen ist, ändert sich die Schaltfläche Vorbereiten zu Ausführen.
-
Validieren Sie optional den Data Mart wie in Validieren und Synchronisieren des Data Mart beschrieben.
-
Klicken Sie auf die Schaltfläche Ausführen.
Das Fenster wechselt zur Ansicht Überwachen und zeigt den Ladefortschritt und den Status der Datensätze in Ihrem Data Mart.
Jeder Quelldatensatz wird vom Data Mart verarbeitet, auch gelöschte Datensätze. Damit soll sichergestellt werden, dass Verlaufsinformationen beibehalten werden.
Validieren und Synchronisieren des Data Mart
Mit der Validierung des Data Mart wird sichergestellt, dass die Metadaten des Data Mart mit den entsprechenden Metadaten im Speicher (oder der Umwandlung, falls definiert) übereinstimmen. Beim Validieren des Data Mart werden auch die erstellten Metadaten mit dem aktuellen Sternschemadesign verglichen. Wenn Sie beispielsweise die Validierung ausführen, nachdem eine Dimension zu einem bereits erstellten Data Mart hinzugefügt wurde, schlägt die Validierung fehl.
So validieren Sie den Data Mart:
-
Wählen Sie entweder im Menü rechts neben der Schaltfläche Ausführen die Option Datensätze validieren aus, oder klicken Sie unten rechts im Fenster auf die Schaltfläche Datensätze validieren.
Eine Meldung Validierung abgeschlossen wird angezeigt.
-
Wenn die Metadaten nicht synchronisiert sind oder wenn Sternschema-Designkonflikte vorliegen, wird das Fenster Validieren und anpassen unten im Fenster automatisch mit dem Validierungsbericht geöffnet.
Beispiel für einen Data Mart mit Sternschema-Designkonflikt: Beispiel für einen Data Mart mit Validierungsfehlern:
-
Um etwaige Probleme mit Anstehende Designänderungen zu beheben, klicken Sie oben rechts auf die Schaltfläche und wählen Sie Vorbereiten aus. Wenn der Wert der Spalte Kann ohne Datenverlust geändert werden Ja lautet, wird ein ALTER-Vorgang durchgeführt. Andernfalls werden die Data Mart-Tabellen neu erstellt.
Beachten Sie, dass alle Validierungsfehler manuell behoben werden müssen.
Verwalten von Data Marts
In diesem Abschnitt werden die verschiedenen Optionen beschrieben, die zum Verwalten Ihrer Datensätze und Data Marts verfügbar sind.
Verfeinern von Fakten oder Dimensionen
Auf der Registerkarte Datensätze können Sie verschiedene Vorgänge durchführen, um Ihre Fakten und Dimensionen zu verfeinern. Sie können beispielsweise Umwandlungsregeln erstellen (z. B. zum Ersetzen von Spaltenwerten) und Formeln auf Spaltenebene hinzufügen. Die Registerkarte Datensätze befindet sich rechts auf der Registerkarte Data Mart.
Hinzufügen von Regeln
Eine Erklärung zum Hinzufügen von globalen Regeln finden Sie unter Erstellen von Regeln zur Umwandlung von Datensätzen
Hinzufügen neuer Spalten
Sie können dem Zieldatensatz neue Spalten hinzufügen.
-
Hinzufügen einer vollständig neuen Spalte
Klicken Sie auf + Hinzufügen.
Geben Sie einen Namen für die Spalte an, und legen Sie eine Formel fest, um die Daten der Spalte zu definieren.
Weitere Informationen finden Sie unter Hinzufügen von Spalten zu einem Dataset.
-
Hinzufügen einer Spalte aus der Quelle
Klicken Sie auf neben Hinzufügen und wählen Sie Spalte aus Quelle hinzufügen.
Wählen Sie eine Spalte aus dem Quelldatensatz aus.
Neuanordnung von Spalten
Sie können die ordinale Position einer Spalte ändern.
-
Wählen Sie eine Spalte aus.
-
Klicken Sie auf und dann auf Neu ordnen.
-
Verwenden Sie die Pfeile, um die Spalte nach oben oder unten zu verschieben.
-
Schließen Sie Ordinal ändern, wenn Sie fertig sind.
Dimensionen mit unterschiedlichen Rollen
Eine Dimension mit unterschiedlichen Rollen ist die gleiche Dimension, die im gleichen Sternschema mehrfach, aber in verschiedenen Bedeutungen verwendet wird. Dieser Fall tritt häufig bei den Dimensionen „Datum“ und „Kunde“ ein. Beispiel: Ihr Sternschema enthält zwei Elemente „Datum“, wobei eines das „Bestelldatum“ und das andere das „Empfangsdatum“ darstellt.
So fügen Sie einen Rollennamen zu einer Dimension hinzu oder bearbeiten ihn:
- Klicken Sie auf das Symbol im Dimensionsknoten und wählen Sie Rolle bearbeiten aus.
Geben Sie im Dialogfeld Rolle bearbeiten einen Namen in das Feld Rollenname in Sternschema ein (bzw. bearbeiten Sie den vorhandenen Namen), und klicken Sie auf OK.
Der Rollenname wird unter dem Dimensionsnamen angezeigt.
Weitere Verwaltungsoptionen
In der folgenden Tabelle sind weitere Verwaltungsoptionen beschrieben:
Zweck | Behebung |
---|---|
Hinzufügen weiterer Quelldatensätze | Weitere Informationen finden Sie unter Auswählen der Quelldaten. |
Zusätzliche Fakten hinzufügen | Siehe Hinzufügen eines Fakts |
Zusätzliche Dimensionen hinzufügen | Weitere Informationen finden Sie unter Hinzufügen von Dimensionen und eines Fakts zum Data Mart. |
Dimension löschen | Wählen Sie die Dimension im Fenster Dimensionen aus und wählen Sie dann Löschen im Menü aus. |
Fakt löschen | Wählen Sie den Fakt im Fenster Fakte aus und wählen Sie dann Löschen im Menü aus. |
Data Mart neu erstellen | Klicken Sie oben rechts auf die Schaltfläche und wählen Sie Tabellen neu erstellen aus. Das Neuerstellen eines Data Marts kann z. B. erforderlich werden, wenn Änderungen im Speicher vorliegen, die nicht automatisch mit dem Data Mart synchronisiert werden können. |
Ausführung einer Data Mart-Aufgabe anhalten | Klicken Sie oben rechts auf die Schaltfläche Anhalten. |
Eine Data Mart-Aufgabe vorbereiten | Klicken Sie oben rechts auf die Schaltfläche und wählen Sie Vorbereiten aus, um die Datensätze mit den Umwandlungs- oder Speicherobjekten zu synchronisieren und etwaige Designkonflikte zu beheben. Dadurch wird eine Aufgabe für die Ausführung vorbereitet. Der Vorgang umfasst Folgendes:
Sie können den Fortschritt unter Vorbereitungsfortschritt unten im Bildschirm verfolgen. |
Planen einer Data Mart-Aufgabe
Sie können eine Data Mart-Aufgabe planen, damit sie regelmäßig aktualisiert wird. Sie können einen zeitbasierten Plan festlegen oder die Aufgabe so einrichten, dass sie nach dem Abschluss von Eingabedatenaufgaben ausgeführt wird.
Klicken Sie in einer Datenaufgabe auf ... und wählen Sie Planung aus, um einen Plan zu erstellen. Die Standardplanungseinstellung wird aus den Einstellungen im Projekt übernommen. Weitere Informationen zu Standardeinstellungen finden Sie unter Data Mart-Standardwerte.
Sie müssen Planung auf Ein festlegen, um den Plan zu aktivieren.
Zeitbasierte Pläne
Sie können zeitbasierte Pläne verwenden, um Aufgaben unabhängig davon auszuführen, wann die einzelnen Eingabequellen aktualisiert werden.
Wählen Sie in Datenaufgabe ausführen die Option Zu einer bestimmten Uhrzeit aus.
Sie können einen stündlichen, täglichen, wöchentlichen oder monatlichen Plan erstellen.
Ereignisbasierte Pläne
Sie können einen ereignisbasierten Plan festlegen oder die Aufgabe so einrichten, dass sie nach dem Abschluss von Eingabedatenaufgaben ausgeführt wird.
Wählen Sie in Datenaufgabe ausführen die Option Bei einem bestimmten Ereignis aus.
Sie können auswählen, ob die Aufgabe ausgeführt werden soll, nachdem eine der Eingabeaufgaben erfolgreich abgeschlossen wurde, oder nachdem eine Auswahl an Eingabeaufgaben erfolgreich abgeschlossen wurde.
Laden von Daten
Sie können einen manuellen Datenladevorgang ausführen. Das ist nützlich, wenn Probleme mit einer oder mehreren Tabellen vorliegen.
Öffnen Sie die Datenaufgabe und wählen Sie die Registerkarte Überwachen aus.
Wählen Sie die Tabellen aus, die Sie laden möchten.
Wenn eine Dimension für einen Ladevorgang ausgewählt wird, werden alle Fakten, die diese Dimension verwenden, ebenfalls geladen, um die Integrität beizubehalten.
Klicken Sie auf Tabellen laden.
Sie können den Ladevorgang für Tabellen mit ausstehendem Laden abbrechen, indem Sie auf Ladevorgang abbrechen klicken. Bereits geladene Tabellen sind davon nicht betroffen, und aktuell laufende Ladevorgänge werden abgeschlossen.
Der Ladevorgang wird wie folgt durchgeführt:
Die ausgewählten Dimensionen und Fakten werden abgeschnitten.
Die ausgewählten Dimensionstabellen werden aus der vorgelagerten Datenaufgabe geladen.
Die Fakttabellen werden aus der vorgelagerten Datenaufgabe geladen. Der Vorgang umfasst Folgendes:
Ausdrücklich ausgewählte Fakttabellen.
Fakttabellen, die mit einer erneut geladenen Dimension in Beziehung stehen.
Data Mart-Einstellungen
Klicken Sie auf die Symbolleistenschaltfläche Einstellungen, um das Dialogfeld Einstellungen: <data-mart-name> zu öffnen.
Allgemeine Einstellungen
Auf der Registerkarte Allgemein stehen die folgenden Einstellungen zur Verfügung:
- Datenbank: Die Datenbank, in der der Data Mart erstellt wird
- Datenaufgabenschema: Das Schema, in dem die Datensätze erstellt werden
- Internes Schema: Das Schema, in dem die internen Datensätze erstellt werden
- Präfix für alle Tabellen und Ansichten
Sie können ein Präfix für alle Tabellen und Ansichten festlegen, die mit dieser Aufgabe erstellt wurden.
InformationshinweisSie müssen ein eindeutiges Präfix verwenden, wenn Sie ein Datenbankschema in mehreren Datenaufgaben nutzen möchten.
Laufzeiteinstellungen
Auf der Registerkarte Laufzeit stehen die folgenden Einstellungen zur Verfügung:
- Parallele Ausführung: Geben Sie die maximale Anzahl der Datenbankverbindungen ein, die Qlik Cloud für die Aufgabe öffnen darf. Die Standardanzahl ist 10.
- Warehouse: Nur für Snowflake relevant. Der Name des Snowflake Data Warehouse.
Katalogeinstellungen
In Katalog veröffentlichen
Wählen Sie diese Option aus, um diese Version der Daten als Datensatz im Katalog zu veröffentlichen. Der Kataloginhalt wird aktualisiert, wenn Sie diese Aufgabe zum nächsten Mal vorbereiten.
Weitere Informationen zu Katalog finden Sie unter Verstehen Ihrer Daten mit Katalogwerkzeugen.