Was ist eine vertikale Datenbank?

Eine vertikale Datenbank ist eine Datenbank, bei der das physische Layout der Daten spaltenweise und nicht zeilenweise erfolgt. Anstatt in horizontalen Datensatzstrukturen angeordnet und vertikal verarbeitet zu werden, werden Daten in einer vertikalen Datenbank in vertikalen Strukturen, die als Prädikatsbäume oder P-Bäume bekannt sind, angeordnet und horizontal verarbeitet.

Data-Mining

Horizontale Datenbanken eignen sich für Anwendungen, bei denen das angeforderte Ergebnis ein Satz horizontaler Datensätze ist, jedoch weniger für Anwendungen wie Data Mining, bei denen Forscher typischerweise an prägnant ausdrückbaren Ergebnissen interessiert sind. P-Bäume hingegen eignen sich gut für Data Mining. P-Bäume werden normalerweise erzeugt, indem jedes Attribut oder jede Spalte einer Tabelle von horizontalen Datensätzen in separate Bitvektoren oder Array-Datenstrukturen zerlegt wird. P-Bäume können eindimensional, zweidimensional oder mehrdimensional sein; Wenn die in der Datenbank zu speichernden Daten natürliche Dimensionen haben – zum Beispiel Geodaten oder geografische Informationen – werden die Dimensionen des P-Baumes mit denen der Daten abgeglichen.

Performance

Daten in einer vertikalen Datenbank werden durch schnelle logische Operatoren wie UND, ODER, Exklusiv-ODER und Komplement verarbeitet. Darüber hinaus ist es durch die spalten- statt zeilenweise Anordnung der Daten möglich, Abfragen oder Suchen in den Daten auszuführen, ohne auf Seiten auf einer Festplatte zuzugreifen, die von der Abfrage nicht betroffen sind, und so die Geschwindigkeit des Datenabrufs zu erhöhen . Dies ist eine wichtige Überlegung beim Data Mining in sehr großen Daten-Repositorys.

Seitengröße

Ein weiterer Vorteil vertikaler Datenbanken besteht darin, dass Daten in großen Seiten gespeichert werden können. Eine große Seitengröße bedeutet, dass eine große Anzahl relevanter Datenelemente in einem einzigen Lesevorgang abgerufen werden können. Im Gegensatz dazu ruft ein einzelner Lesevorgang in einer horizontalen Datenbank nicht nur relevante Datenelemente ab, sondern auch Attribute oder Spalten, die für die fragliche Abfrage nicht relevant sind, und bevorzugt kleine Seitengrößen.

Wissenschaftliche Anwendungen

Vertikale Datenbanken haben in den letzten Jahren ein erneutes Interesse der wissenschaftlichen Gemeinschaft gefunden. Die Anzahl der gleichzeitigen Benutzer in wissenschaftlichen Datenbankanwendungen ist typischerweise viel geringer als in kommerziellen Anwendungen, aber Benutzer neigen dazu, komplexere, unvorhergesehene Anfragen zu stellen. Darüber hinaus müssen wissenschaftliche Datenbankanwendungen aufgrund des Fehlens von Datenbank- und Systemunterstützungspersonal in der Regel eine stärker automatisierte Antwort auf komplexe Anfragen bieten. Wissenschaftliche Benutzer bevorzugen in der Regel die Arbeit mit dedizierten internen Computersystemen, daher müssen wissenschaftliche Datenbankanwendungen zwischen verschiedenen Computermodellen portierbar sein. Vertikale Datenbanken sind in all diesen Punkten besser als ihre horizontalen Gegenstücke.