Universität Jena, Lehrstuhl für Datenbanken und Informationssysteme

Forschung - aktuelle Themen


Multi-Tenancy-Datenbanksysteme

Kontakt: Andreas Göbel

Das an Bedeutung und Akzeptanz gewinnende Modell Software as a Service (SaaS) ermöglicht Unternehmen die Konzentration auf ihr Kerngeschäft durch das Beziehen von Dienstleistungen über das Internet. Um die Angebote einer Vielzahl von Unternehmen verschiedener Betriebsgröße bereitzustellen, bedarf es einer hohen Individualisierbarkeit und Wirtschaftlichkeit des Services. In der Folge liegt aus Sicht des Anbieters die Konsolidierung von Daten mehrerer Unternehmen (Mandanten) auf den physischen Ressourcen in Form einer Multi-Tenancy-Anwendungen nahe, um die Kosten des Services gering zu halten.

Insbesondere in Bezug auf SaaS führt Multi-Tenancy zu neuen Herausforderungen für Datenbankmanagementsysteme wie Mandantenkonsolidierung, Elastizität, Skalierbarkeit, Isolation von Mandantendaten und -anwendungen, Verfügbarkeit, hoher Automatisierungsgrad sowie individuelle Datenbankschemata und -administration für Mandanten. Herkömmliche Datenbanksysteme sind nur bedingt geeignet, um allen Herausforderungen gerecht zu werden und insbesondere Mandanten in diesem Zusammenhang festgelegte Dienstgütevereinbarungen zu garantieren. Im Vordergrund der Untersuchungen stehen daher Konzepte hinsichtlich Datenbanksystemen mit nativer Unterstützung von Multi-Tenancy und Datenverwaltung auf Basis von Dienstgütevereinbarungen.

Publikationen


Forschung - abgeschlossene Themen


Aspektorientierte Datenhaltung in Produktkonfiguratoren

Kontakt: Matthias Liebisch

Der Einsatz von sogenannten Produktkonfiguratoren ist für viele Unternehmen der Schlüssel, um einerseits dem Kundenwunsch nach individualisierten Produkten gerecht zu werden und andererseits im Zuge der Globalisierung im Marktwettbewerb bestehen zu können. Erreicht werden diese Ziele durch eine konsequente Modularisierung der Produktpalette, wodurch eine gemeinsame Nutzung gleichartiger Baugruppen bzw. Bauteile in verschiedenen Produkten möglich ist. Unter Beachtung von gepflegten Regeln können dann im Konfigurator nach dem Baukastenprinzip die verschiedenen Module bzw. Komponenten zum gewünschten Produkt kombiniert werden. Die so entstehenden Konfigurationen lassen sich speichern oder in nachgelagerten System weiterverarbeiten, beispielweise als Stücklistenbeschreibung in der Produktionsplanung.

Zur Verwaltung und Speicherung der im Kontext von Produktkonfiguratoren anfallenden Daten (Modellierungsdaten, Konfigurationen) dienen üblicherweise Relationale Datenbankmanagementsysteme. Die dafür notwendigen logischen Datenmodelle werden dabei entsprechend den fachlichen Anforderungen des jeweiligen Konfigurationssystems entwickelt und gepflegt. Zusätzlich haben jedoch sogenannte funktionale Aspekte (cross-cutting concerns) Einfluss auf das gesamte Datenmodell und lassen sich nicht ohne Weiteres modularisiert und wiederverwendbar abbilden. Vertreter diese querschnittlichen Belange sind beispielweise die Internationalisierung und Versionierung eines Datenmodells.

Dem Problem der querschnittlichen Belange wurde im Bereich der Software-Entwicklung seit der Jahrtausendwende mit dem Konzept der Aspektorientierten Programmierung (AOP) basierend auf Objektorientierten Programmiersprachen (z.B. AspectJ) begegnet. In analoger Art und Weise soll mit dem Paradigma der Aspektorientierten Datenhaltung (AOD) die Erweiterung von Datenmodellen um funktionale Aspekte möglich sein, ohne dabei den Prozess der primär fachlich geprägten Datenmodellierung zu beeinflussen. Dabei hierfür notwendige Anforderungen, Konzepte und Konsequenzen stehen im Vordergrund der Forschung.

Publikationen


Autonomic Database Performance Tuning

Kontakt: David Wiese, Gennadi Rabinovitch

Die Computer-Industrie hat Jahrzehnte damit verbracht immer komplexere Systeme zu entwickeln. Heute jedoch ist die Komplexität als limitierender Faktor in der Systemweiterentwicklung und -administration selbst das Problem. Moderne IT-Landschaften zeichnen sich durch eine diverse Komponenten- und Architekturvielfalt aus. Angefangen von Stand-Alone-Systemen bis hin zu komplexen n-Schichten-Architekturen mit verteilten Daten und Ressourcen auf verschiedenen, heterogenen Plattformen. Die systeminhärente Gesamt-Komplexität sowie die schwer übersehbare Vielfalt an Installations- und Betriebsoptionen ist durch bloße menschliche Intervention kaum noch manuell kontrollier- und handhabbar. Neben einer vernünftigen Ressourcenplanung, Installation und Vorab-Konfiguration ist die Bedienung, Administration (Backup/Recovery, Reorganisation, Einhalten von Aktualität, ...) und Optimierung (Monitoring, Tuning, ...) im laufenden Betrieb unabdingbar um die Zuverlässigkeit (Verfügbarkeit, Ausfallsicherheit), Performance und diverse von Gesetzgebern oder Managern vorgegebenen Richtlinien (Policies) einzuhalten.

Administration im heutigen laufenden Betrieb erfolgt meist manuell und reaktiv durch die Administratoren auf mehreren Ebenen (System-, Netzwerk-, Datenbankadministrator, ...) ohne koordinative Kommunikation untereinander. Diese manuelle Form der Systemoptimierung ist zeitaufwendig, kostspielig, in den meisten Fällen nur noch durch erfahrene und gut ausgebildete Spezialisten durchführbar und zudem überaus fehleranfällig. Der Verwaltungsaufwand, die Anforderungen and die Kompetenz, Anzahl und Lernfähigkeit der Fachkräfte und damit die laufenden Betriebskosten steigen überproportional mit dem Umfang und der Komplexität.

Ansätze wie das "Autonomic Computing" versuchen die in den letzten Jahrzehnten immens angewachsene Komplexität von IT-Systemen wieder zu reduzieren um deren Umgang und Verwaltung zu vereinfachen. Vorbild des Autonomic Computing ist das vegetative Nervensystem des Menschen. Es steuert einen Großteil der menschlichen Körperfunktionen automatisch, ohne dass wir darüber nachdenken müssen. So erkennt beispielsweise das Herz-Kreislaufsystem den Sauerstoffbedarf und pumpt die entsprechende Menge Blut durch unseren Körper, je nachdem ob wir gerade im Wald joggen oder im Sessel ein Buch lesen. Ähnliches sollen autonome Computersysteme künftig leisten: analog zum menschlichen Organismus werden alle wichtigen Parameter überwacht und wird bei Abweichungen mit den richtigen Maßnahmen reagiert.

In Kooperation mit der Industrie hat sich der Lehrstuhl für Datenbanken und Informationssysteme in einem befristeten (vorerst 2 Jahre) Projekt die Konstruktion einer Infrastruktur zur Automatisierung typischer relationaler Datenbank-Tuning-Aufgaben unter Minimierung menschlicher Interaktion zum Ziel gesetzt. Dazu ist ein Formalisieren, Speichern, Verwalten, Austauschen (Community) und individuelles Anpassen von Tuning-Wissen (in Form von Experten-Strategien) erforderlich. Um eine gewisse Autonomie in das System zu integrieren muss zusätzlich die Vergangenheit und Zukunft betrachtet werden. In einem Langzeitarchiv wird eine Historie alle bisherigen Änderungen, Probleme, Aktionen protokolliert und eine entsprechende Vorhersagekomponente versucht künftige problematische Ereignisse mit möglichst hoher Genauigkeit zu detektieren.

Projektseite


XML und Datenbanksysteme

Kontakt: Thomas Müller

Seitdem die Meta-Auszeichnungssprache XML (eXtensible Markup Language) 1998 vom World Wide Web Consortium als Empfehlung verabschiedet wurde, hat sie kontinuierlich an Bedeutung gewonnen. Als Format zur Repräsentation und zum Austausch von Daten ist XML aus der heutigen IT-Landschaft nicht mehr wegzudenken. Ein Großteil der beispielsweise in einem Unternehmen zu verwaltenden Daten liegt un- bzw. semistrukturiert vor, so dass sich dabei die Nutzung des XML-Formats anbietet.

Mit der zunehmenden Verbreitung von XML wuchs das Bedürfnis, XML-Dokumente effizient speichern, anfragen und verarbeiten zu können. Unweigerlich ergab sich hieraus die Forderung an Datenbanksysteme, XML zu unterstützen. Ein von der Industrie eingeschlagener Weg, eine derartige XML-Unterstützung anzubieten, bestand darin, die - seit vielen Jahren zur Speicherung und Verwaltung großer Datenmengen etablierten - (objekt-)relationalen Datenbanksysteme um XML-Funktionalität zu erweitern. Die prominentesten Beispiele hierfür sind Oracle, IBM DB2 sowie der MS SQL Server.

Die Wichtigkeit, SQL um XML-Funktionalität zu erweitern, wurde auch von den SQL-Normungsgremien erkannt. Mit SQL:2003 wurden erstmals XML-Daten unterstützt, indem der SQL-Basisdatentyp "XML" eingeführt wurde. Die sich noch in Entwicklung befindende Folgeversion der SQL-Norm, gemeinhin als SQL:2007 bezeichnet, baut die XML-Unterstützung weiter aus, so dass als Attributwerte komplette XQuery-Sequenzen möglich sein werden. Auch SQL:2007-Anfrageergebnisse können komplette XQuery-Sequenzen als Attributwerte enthalten.

Es stellt sich somit die Frage, wie diese (im Anfrageergebnis enthaltenen) XQuery-Sequenzen vom Anwendungsprogramm verarbeitet werden können. An dieser Problemstellung setzen aktuelle Arbeiten am Lehrstuhl an. Den Schwerpunkt der Forschung bildet die Erweiterung des klassischen SQL-Cursorkonzepts um so genannte "Sequenzcursor". Mit Hilfe dieser neu eingeführten Cursorart werden Ausschnitte der im Anfrageergebnis enthaltenen XQuery-Sequenzen definiert, die dann ins Anwendungsprogramm übertragen werden, um lesend oder ändernd auf ihnen zu arbeiten. Die konzeptuellen Betrachtungen werden begleitet von der prototypischen Implementierung einer 4-Schichtenarchitektur zur Unterstützung des sequenzcursorbasierten Verarbeitungsmodells.

Publikationen


Spatial Data Analysis in Relational Database Systems

Kontakt: K. Stolze

Spatial Data is becoming an integral part of today's relational database systems. However, the majority of the tools that are grouped around database systems are oftentimes not aware of spatial data and cannot take advantage of it. ; The tools for tasks like replication, data warehousing, or data mining are very important in customer scenarios. My research focusses on the requirements and implementation of providing spatial capabilities for the more important areas of products that are available for managing and using relational database systems.

The following topics are addressed:

Federated & Replication
  • What is necessary to support the federated access to spatial data in general?
  • How to handle different spatial reference systems?
  • How should the different data models for spatial data be treated?
  • Implementation of high-performing wrappers to connect to foreign data sources.
  • Access to existing geographical information systems.
Data Mining
  • Several standalone spatial mining tools exist.
  • How can they be integrated with an RDBMS?
  • Which functionality can be provided with reasonable performance?
Network/Graph support
  • SQL, as a declarative language, has weak points for navigational data access as is needed for efficient network support (route planning, etc.).
  • What is necessary to overcome the shortcomings?
  • Is this possible with today's availabale database technology?
Data Warehousing
  • How can spatial analysis be exploited in data warehouse applications?
  • How should a warehouse be implemented if it includes a spatial component/dimension?
  • Which functionality is necessary for an efficient usage of spatial data? (geocoding, address cleansing, ...)
Raster data support
  • How to support huge images (several GB of data for a single image)?
  • Which data models can be used to represent images and provide an adequate performance? (compare different existing approaches)
All topics have two major aspects that have to be considered:
  1. Usability
  2. Performance in real-world applications

Publikationen


Datenbank-Reorganisation

Kontakt: S. Dorendorf

Während der Datenbanknutzung kommt es bei Datenbank-Verwaltungssystemen (DBVS) zu einer schleichenden Verschlechterung des Laufzeitverhaltens durch Degenerierungen der zur Datenspeicherung und zum Wiederauffinden der Daten verwendeten Strukturen. Um diese Degenerierungen zu beseitigen, wird eine Reorganisation der Datenbank notwendig. Im Rahmen der Forschungsarbeiten werden die bei verfügbaren DBVS auftretenden Degenerierungen auf ihre Auswirkungen auf das Leistungsverhalten einer Datenbank hin untersucht. Ebenso werden die Möglichkeiten, die verfügbare DBVS zur Reorganisation zur Verfügung stellen, analysiert. Da die einzelnen Teile einer Datenbank unterschiedlich von Degenerierungen betroffen sind, stellt die gezielte Reorganisationsbedarfsanalyse einen weiteren Schwerpunkt der Arbeiten dar.

Publikationen


Normierung von SQL

Kontakt: P. Pistor

Publikationen


Physical Aspects of Object-Relational Database Management Systems

Contact: S. Skatulla

Relational database systems are steadily moving towards so-called object-relational features and extensions. With these, DBMS are not anymore limited to managing only simple types of data; instead, large and complex data can be handled and managed as well. Complex data types are especially needed in new application fields involving multimedia, image, video, text, XML, etc. Object-relational database systems integrate object-oriented techniques and traditional relational features in an evolutionary way.

Object-relational features have been a topic in the research community since the 1980s. Anyway, as further research is needed on various aspects of object-relational technology, our work contributes to two core aspects:

  1. Physical storage and handling of complex objects including nested collections.

    The challenge of this implementation aspect is how to integrate complex objects, esp. collections, into ORDBMSs with minimal changes to the existing DBMS architecture and code and without hurting the performance of traditional data operations.

    Major topics are:

  2. Evaluation of functional and performance aspects of object-relational extensions to existing ORDBMS products.

    We are looking at extensibility features, for instance related to geographic (spatial) data, from a functional and a performance point of view: How do the features in products such as DB2, Oracle and Informix look like, what can be said about the performance of these implementations, etc.

    Major topics are:

Publications


Mobile Datenbanksysteme

Erweiterung und Anpassung der Funktionalität von DBS zur Unterstützung neuer mobiler Anwendungen

Kontakt: C. Gollmick

Die schnell fortschreitende technologische Entwicklung im Bereich mobiler Endgeräte und Kommunikation erlaubt es immer mehr Anwendungen, auch mobile Nutzer einzubeziehen. Zunächst wurden traditionellen Anwendungen wie ein Zugriff auf das firmeneigene SAP R/3-System, eine Lagerverwaltung oder ein Workflowmanagementsystem für mobile Nutzer bereitgestellt. Charakteristische Merkmale dieser Anwendungen sind zentrale Administration replizierter Daten, organisatorische Trennung und geringer Ortsbezug von Tätigkeiten.

Die Mobilität von Nutzern bietet darüber hinaus aber auch Chancen für die Erschließung neuer Anwendungsfelder mit explizitem Ortsbezug, wie die Unterstützung mobiler Infrastruktur- und Landschaftsplaner, Katastrophenhilfskräfte oder ein interaktives Reiseinformationssystem (s.u.). Charakteristisch für diese "neuen mobilen Anwendungen" sind die nutzergesteuerte, orts-, aufgaben-, und zeitabhängige Auswahl zu replizierender Daten sowie die mobile und insbesondere unverbundene Erfassung neuer Daten und Änderungen an gemeinsam genutzten Daten.

Heutige kommerzielle mobile Datenbanklösungen bieten für die Realisierung dieser neuen Anwendungen nur unzureichende Funktionalität. Unter anderem benötigen wir Konzepte für:

Das Promotionsvorhaben beschäftig sich allgemein mit den Auswirkungen der Nutzermobilität auf die Funktionalität von Datenbanksystemen und speziell mit der Konzeption und Realisierung der genannten Erweiterungen. Dazu wird am Lehrstuhl ein mobiles Reiseinformationssystem von Nutzern für Nutzer (m-RIS) als Beispielszenario entwickelt.

Im Unterschied zu klassischen Touristenführern wird in m-RIS nur ein kleiner Teil der Informationen, etwa demographische Daten über Orte, zentral bereitgestellt. Der weitaus größte Teil soll von den mobilen Nutzern selbst und in der Regel vor Ort erstellt und ergänzt werden. Hierzu zählen Reiseberichte, besuchte Routen, geänderte Öffnungszeiten von Gebäuden, Preise und Erfahrungen mit Hotels oder Speisekarten von Restaurants.

Publikationen


Objektrelationale Datenbanksysteme

Kontakt: J. Lufter

Im Rahmen eines Drittmittelprojekts mit der SAP AG Walldorf wurden u.a. Fragen der Nutzung objektrelationaler Datenbanksysteme für die Persistenz von Objekten im SAP System R/3 untersucht. Aktuelle Arbeiten befassen sich mit der zu SQL:1999 normkonformen Abbildung objektorientierter Schemata und Daten auf reale objektrelationale Datenbanksysteme und verwandten Themen.

Publikationen


Partitionierung von Datenbanktabellen

Kontakt: J. Nowitzky

In Zusammenarbeit mit der SAP AG Walldorf werden neue Datenbankkonzepte zur Leistungssteigerung laufzeit- und datenintensiver Anwendungen im Umfeld des SAP Systems R/3 untersucht. Die Datenarchivierung mit dem ADK ist eine solche datenintensive Anwendung, die von der Tabellenpartitionierung hinsichtlich ihres Laufzeitverhaltens profitieren kann. Ein Konzept zur Nutzung der Partitionierung wurde entwickelt, prototypisch realisiert und bewertet.

Im Rahmen des Projektes werden fortführend der Nutzen der Tabellenpartitionierung für die Optimierung in relationalen Datenbanken untersucht. Die Ergebnisse sollen in die Implementierung des Business Information Warehouse der SAP einfließen.

Publikationen


Backup und Recovery in Datenbanksystemen

Kontakt: U. Störl

Während des Betriebs eines Datenbanksystems können eine Reihe von Fehlern auftreten, die zum Abbruch einer einzelnen Transaktion oder der Unterbrechung des gesamten Datenbankbetriebs führen. Diese lassen sich in Transaktionsfehler, Systemausfall und Externspeicherfehler einteilen. Unter Externspeicherfehlern wird dabei die teilweise oder komplette Zerstörung eines Datenträgers durch physische Einwirkung o.ä. verstanden. Um sich gegen den damit verbundenen Datenverlust zu schützen, bieten Datenbanksysteme verschiedene Backup- und Recovery-Techniken an. Sie dienen dazu, die Datenbank nach Wiederanlauf des Systems in einen möglichst aktuellen, transaktionskonsistenten Zustand zu bringen. Aufgrund der zunehmenden Datenmenge und den immer höheren Verfügbarkeitsanforderungen treten dabei bei den heute verwendeten Ansätzen erhebliche Performance-Probleme auf, welche die Entwicklung und Implementierung neuer Konzepte notwendig machen.

Im Rahmen unserer Forschungsarbeiten auf diesem Gebiet wurde u.a. ein Werkzeug zur Analyse von DB2-Log-Einträgen entwickelt.

Publikationen


Archivierung in Datenbanksystemen

Kontakt: R. Schaarschmidt

Zunehmend müssen Daten aus betriebswirtschaftlichen und jurististischen Gründen archiviert, d.h. langfristig wiederverwendbar aufbewahrt werden. Ziel dieses Projektes ist die Untersuchung von Integrationsmöglichkeiten einer Archivierungskomponente in zukünftige Datenbanksysteme. Durch Datenarchivierung kann zudem eine unnötige Belastung des Sekundärspeichers durch Daten, mit denen längere Zeit nicht gearbeitet wird, vermieden werden. Die weniger interessanten Daten werden aus dem operationalen Datenbestand ausgeblendet und beispielsweise auf kostengünstigere, aber dafür langsamere Tertiärspeicher ausgelagert. Moderne Tertiärspeichersysteme werden derzeit nur unzureichend von Datenbanksystemen unterstützt.

Publikationen


Interoperabilität von Datenbanksystemen und Migration von Datenbanken

Kontakt: F. Hüsemann

In fast allen Bereichen der Informationsverarbeitung werden heute Datenbestände heterogen verwaltet, d.h. sowohl auf verschiedenen Systemplattformen als auch in verschiedenen Datenbanksystemen. Eines der Hauptprobleme hierbei ist der fehlende gemeinsame Zugriff. Insbesondere beim Wechsel auf neue Datenbanktechnologie stellt sich die Frage, wie sich Altdatenbestände, die schließlich eine wertvolle Ressource darstellen, aus dem neuen System heraus zugreifen und weiterverwerten lassen. Sogenannte Middleware (etwa in Form von Datenbank-Gateways) ermöglicht dem Benutzer eines bestimmten Datenbanksystems einen transparenten Zugriff auf den Datenbestand eines anderen Datenbanksystems. Für die in diesem Zusammenhang auftretenden Probleme sollen Lösungsmöglichkeiten untersucht und bewertet werden. Einen Schwerpunkt hierbei bilden Migration und Koexistenz relationaler und objektorientierter Datenbanksysteme.

Publikationen


DBIS Web; 2011-05-09