Zu Hauptinhalt springen Zu ergänzendem Inhalt springen

Hierarchiedaten laden

Unregelmäßige Hierarchien mit n Ebenen gibt es u. a. häufig bei Daten, die geografische oder organisatorische Dimensionen in Daten repräsentieren.

Solche Hierarchien werden zumeist in Form von Tabellen dargestellt, in der benachbarte Knoten einander zugeordnet werden. Jede Zeile der Tabelle repräsentiert einen Knoten und enthält ein Feld mit einer Referenz zum direkt übergeordneten Knoten.

Tabelle mit Knoten
NodeIDParentNodeIDTitel
1-Geschäftsführer
21Manager für die Region
32Niederlassungsleiter
43Abteilungsleiter

Jeder Knoten wird in dieser Tabelle durch eine Zeile repräsentiert, auch wenn der Knoten mehrere untergeordnete Knoten hat. Natürlich kann die Tabelle auch weitere Felder enthalten, etwa mit Attributen.

Eine Tabelle mit benachbarten Knoten ist optimal für die Wartung, aber schwierig für die tägliche Arbeit. Stattdessen werden in Abfragen und Analysen andere Repräsentationen verwendet. Im Allgemeinen werden dazu die Ebenen der Hierarchie so aufgeschlüsselt, dass für jede Ebene ein separates Feld entsteht. Die Ebenen einer Tabelle mit erweiterten Knoten lassen sich gut in einer Baumstruktur darstellen. Das Schlüsselwort hierarchy kann im Datenladeskript zum Umwandeln einer Tabelle mit benachbarten Knoten in eine Tabelle mit erweiterten Knoten verwendet werden.

Beispiel:  

Hierarchy (NodeID, ParentNodeID, Title, 'Manager') LOAD NodeID, ParentNodeID, Title FROM 'lib://data/hierarchy.txt' (txt, codepage is 1252, embedded labels, delimiter is ',', msq);
Tabelle mit erweiterten Knoten
NodeIDParentNodeIDTitelTitle1Title2Title4Title4
1-GeschäftsführerGeschäftsführer---
21Manager für die RegionGeschäftsführerManager für die Region--
32NiederlassungsleiterGeschäftsführerManager für die RegionNiederlassungsleiter-
43AbteilungsleiterGeschäftsführerManager für die RegionNiederlassungsleiterAbteilungsleiter

Ein Problem der Tabelle mit erweiterten Knoten ist jedoch, dass die Felder für die Ebenen sich nicht besonders gut für Suchen und Auswahlen eignen, da bereits im Vorfeld bekannt sein muss, auf welcher Ebene das betreffende Element zu finden ist. Eine Vorfahrentabelle ist eine andere Darstellung, mit der sich dieses Problem lösen lässt. Dieses Problem wird mit einer dritten Darstellung gelöst, der Vorfahrentabelle, auch Brückentabelle genannt.

Eine Vorfahrentabelle enthält einen Datensatz für jede untergeordnete Vorfahrenbeziehung, die in den Daten vorhanden ist. Sie enthält Schlüssel und Namen für die untergeordneten und auch die übergeordneten Knoten. Das heißt, dass jeder Datensatz beschreibt, zu welchem Knoten ein bestimmter Knoten gehört. Um eine solche Darstellung zu erreichen, dient der Zusatz hierarchybelongsto im Datenladeskript.

Weitere Informationen

 

Hat diese Seite Ihnen geholfen?

Wenn Sie Probleme mit dieser Seite oder ihren Inhalten feststellen – einen Tippfehler, einen fehlenden Schritt oder einen technischen Fehler –, teilen Sie uns bitte mit, wie wir uns verbessern können!