Die automatische Handlungsplanung --- ein Teilgebiet der KI --- beschäftigt sich mit der Erzeugung eines zielgerichteten Verhaltens für Agenten (Roboter, Menschen, Technische Systeme). In der KI-Forschung wurden in den letzen Jahrzenten die Grundlagen der automatischen Handlungsplanung in beschränkten Weltmodellen ausgiebig untersucht. Verfahren zur Lösung für diese vereinfachten Planungsprobleme werden als sog. "klassische Planung" bezeichnet. Sie basieren auf der Annahme eines vereinfachten Weltmodells. Die Planungsdomänen für realistische Planungsprobleme weichen jedoch wesentlich von den vereinfachten Weltmodellen ab, da sie einen hohen Grand an Unsicherheit und Dynamik aufweisen. Die Arbeitsgruppe befasst sich daher im Kern mit der Frage, wie sich die klassischen Planungsmethoden im Hinblick auf ihre Anwendbarkeit für dynamische Umgebungen erweitern lassen.
Dynamische Umgebungen sind durch die Möglichkeit plötzlich eintretender Ereignisse charakterisiert, wodurch ein planausführender Agent an der planmäßigen Ausführung des Planes gehindert werden kann. Das zum Teil unvollständige Wissen über die Planungsdomäne und die potentielle Unsicherheit über das tatsächliche Ergebnis von Aktionen, die der Planausführer bereits durchgeführt hat, verlangt nach einem robusten, d.h. fehlertoleranten Planungssystem. Die Herausforderung besteht hier zum einem darin, robuste Pläne zu generieren und zum anderen im Entwurf einer Ausführungsüberwachung, die bei Bedarf eine Plankorrektur zur Laufzeit ausführen kann.
In der Arbeitsgruppe werden die Besonderheiten des Einsatzes von KI-Planungsmethoden im Bereich automatischer (Web) Service Composition (SC), eine Teilproblematik des Service Oriented Architecture (SOA)-Ansatzes, untersucht. Ein Schwerpunkt der Forschung liegt hier auf der Fragestellung, was genau unter SC verstanden wird? Da der Begriff der SC in der Literatur oft je nach Kontext viel Raum zur Interpretation lässt, sehen wir den Bedarf einer klaren Begriffsklärung. Darauf aufbauende wichtige Fragestellungen lauten: In welchen Bereichen ist eine automatische SC hilfreich? Nach welchen Prinzipien muss eine automatische SC erfolgen? Und wie lässt sich eine sichere Ausführung eines komponierten Services in einer dynamischen Umgebung sicherstellen?
Als konkretes Anwendungsszenario sollen die gewonnenen Erkenntnisse speziell im Hinblick auf ihre Anwendbarkeit für eine IT-unterstützte Einsatzplanung zur Bewältigung von Großschadensereignissen (Katastrophen) untersucht werden. Wir untersuchen daher die Fragestellung, wie die Standardarbeitsanweisungen (sog. Standard Operating Procedures - SOPs) der beteiligten Rettungskräfte (Rettungsdienst, Feuerwehr, Polizei, etc.) als Workflows modelliert und elektronisch erfasst werden können. Hier ist von Interesse, inwieweit Techniken aus dem Bereich Business Process Management (BPM) im Katstrophenschutz-Kontext anwendbar sind und ob etablierte Prozess-Ausführungssprachen, wie z.B. die Business Process Execution Language (BPEL), wie auch die für menschliche Handlungen erweiterte BPEL4People-Sprache den Anforderungen als Basis für einen automatischen Planer genügen. Erst eine erfolgreiche formale Abbildung der Workflows (SOPs) ermöglicht die darauf Aufbauende Untersuchung geeigneter automatischer Planungsmethoden für eine ad-hoc-Generierung und Ausführungsüberwachung komplexer Handlungsabläufe in einem Katastrophenszenario. Technisch gesehen, sollen die einzelnen Akteure in einem solchen Workflow durch Services repräsentiert werden. Zur Bewältigung einer Großschadenslage, sollen effektive und effiziente Handlungspläne auf der Grundlage von Services verfügbar sein. Da dieses Szenario naturgemäß in hochgradig dynamischen Umgebungen abläuft, bedarf es für Workflow- bzw. Plangenerierung Techniken, die einen möglichst robuste automatische Planungskomponente ermöglicht.
Komplexe Systeme in Natur und Kultur verwenden Information, um ihre interne Organisation zu entwickeln und ihre funktionalen Mechanismen zu regeln. Ohne die Speicherung, Übertragung und Verarbeitung von Information wäre die Evolution von Komplexität unmöglich. Information hat immer eine semantische Dimension, die in Begriffen wie Bedeutung, Sinn, Referenz und Funktion beschrieben werden kann. Die Erforschung der Semantik muß daher eine entscheidende Rolle in der Analyse komplexer Systeme spielen. Komplexe Systeme sind immer auch semantische Systeme. Prinzipielle Fragen, die von einer allgemeinen Theorie semantischer Systeme beantwortet werden müssen, lauten: Was sind paradigmatische Beispiele für semantische Systeme? Gibt es universelle Prinzipien der Evolution und Organisation semantischer Systeme? Existiert eine strikte Abgrenzungslinie zwischen semantischen und nicht-semantischen Systemen, oder ist der Übergang zwischen beiden Arten von Systemen stetig? Impliziert das Verständnis der Evolution semantischer Systeme notwendigerweise eine Naturalisierung der Semantik? Wie sieht die Beziehung zwischen der Meta-Ebene und der Objekt-Ebene in Theorien der Evolution semantischer Systeme aus?
Das vorrangige Ziel des Projekts "Evolution semantischer Systeme" ist der Aufbau einer entsprechenden interdisziplinären und internationalen Forschergruppe mit institutionellem Hauptsitz in Jena. Diese Forschergruppe soll die Entstehung und Entwicklung bedeutungstragender Strukturen in der Absicht untersuchen, eine allgemeine Theorie der Evolution semantischer Systeme zu erarbeiten, die sich vor allem auf computerbasierte Modellierungen stützt. Dabei sollen die Disziplinen der Philosophie, der Linguistik, der Kognitionswissenschaft und der Informatik eine initiierende Funktion übernehmen. Alle vier Disziplinen beschäftigen sich nicht nur von Hause aus mit der Analyse und Synthese semantischer Systeme, sondern sie bewegen sich auch von je her strukturwissenschaftlich zwischen den Geistes-, Natur- und Formalwissenschaften. Kristallisationspunkt der geplanten Forschergruppe ist eine zum Teil mehrjährige, interdisziplinäre Kooperation zwischen dem Institut für Philosophie (Prof. Dr. Bernd-Olaf Küppers, Dr. Stefan Artmann), dem Institut für Germanistische Sprachwissenschaft (Prof. Dr. Udo Hahn) und dem Institut für Informatik (Prof. Dr. Clemens Beckstein, Dr. Peter Dittrich, Dr. Harald Sack) der FSU Jena.
Im Zuge dieser Kooperation wurde im Herbst 2007 ein internationales Symposion zum Thema "Evolution Semantischer Systeme" in Jena veranstaltet, das großzügig von der VolkswagenStiftung gefördert wurde. Auf diesem Symposion konnte das gemeinsame Projekt erstmals der Fachöffentlichkeit in kompakter Form vorgestellt werden. Es bot ein Forum, auf dem die eingeladenen, alle international ausgewiesenen Referenten über ihre Sicht auf die möglichen Beiträge der Strukturwissenschaften zu einer Theorie der Evolution semantischer Systeme Stellung nehmen konnten. Durch das Symposion und die Publikation seiner Resultate wird -- davon gehen übereinstimmend alle Organisatoren aus -- die philosophische und strukturwissenschaftliche Beschäftigung mit Fragen der Semantik neue Impulse erhalten, die in der anschließenden kontinuierlichen Arbeit der Forschergruppe aufgegriffen und systematisch entfaltet werden sollen. Insbesondere das Problem des Zusammenhangs von Semantik und Pragmatik wurde durch das Symposion in seiner fundamentalen Bedeutung für das Verständnis des Bedeutungswandels in den unterschiedlichsten Bereichen deutlich hervorgehoben.
Für die Erreichung des Projektziels spielte zudem ein weiterer Faktor eine entscheidende Rolle: In den Monaten vor dem Symposion entwickelten die Antragsteller die Idee, die Gründung eines Frege-Zentrums für Strukturwissenschaften in Jena zu betreiben, mit der Absicht, das Thema des Symposions zum Arbeitsgebiet des ersten Forschungsprojekts, das im Frege-Zentrum angesiedelt wird, weiterzuentwickeln. Während des Symposions konnte diese neue Entwicklung erstmals einer internationalen Forschergruppe vorgestellt werden. Die Gründung des Frege-Zentrums wurde dabei nicht nur einhellig begrüßt, sondern es fanden sich alle Teilnehmer, die von den Veranstaltern auf eine aktive Mitarbeit im Frege-Zentrum angesprochen wurden, zu einem solchen Engagement bereit. Das nun seit dem Frühjahr 2009 offiziell etablierte Frege-Zentrum kann daher bereits seiner Gründung eine interdisziplinäre und international renommierte Anzahl von Wissenschaftlern als Mitglieder aufweisen.
Die Anfang 2004 begonnene Promotion zum Thema "Formale Semantik von dynamischen Modellen" biologischer Phänomene wurde im Berichtszeitraum fortgesetzt. Das interdisziplinäre Promotionsvorhaben wird weiterhin von Prof. Dr. Clemens Beckstein (Künstliche Intelligenz) und Dr. Peter Dittrich (Systembiologie) betreut. Im Zeitraum von März bis September 2007 wurde eine Kooperation mit Nicolas Le Novere am EBI in Hinxton/Cambridge, Großbritannien durchgeführt.
Bis Ende März 2007 bestand eine Förderung des Promotionsvorhaben durch ein Promotionsstipendium der Rosa-Luxemburg-Stiftung (RLS). Die maximale Förderdauer von drei Jahren wurde damit vollständig ausgenutzt. Von Mitte März bis Mitte September 2007 wurde das Vorhaben durch das EMBL-EBI in Cambridge über ein Marie Curie Fellowship gefördert.
Im letzten Drittel des Jahres 2006 ergab sich eine zunehmende thematische Nähe zu einem in starker Entwicklung befindlichen Projekt, der BioModels Database. Um zu starke Überschneidungen der Arbeit mit diesem Projekt zu vermeiden und um eventuelle Synergie-Effekte zwischen beiden Projekten abzuschätzen, war eine stärkere Beschäftigung mit dem anderen Projekt notwendig. Gegen Ende 2006 ist Herr Knüpfer mit dem Leiter des Projektes, Nicolas Le Novère, in Kontakt getreten, um eine mögliche Zusammenarbeit auszuloten. Dabei wurde beschlossen, eine gemeinsame Kooperation aufzubauen. Im Rahmen dieser Kooperation konnte Herr Knüpfer für ein halbes Jahr in der Arbeitsgruppe von Novère (Computational Neurobiology Group) am EBI in Hinxton/Cambridge (Großbritannien) mitarbeiten. Die dortige Arbeit ermöglichte ihm die praktische Umsetzung der theoretischen Überlegungen seiner Promotion, eingebettet in ein großes internationales Projekt.
Während des Forschungsaufenthalts am EBI wurde von Herrn Knüpfer die Ontologie TEDDY (Terminology for the Description of Dynamics) für die Beschreibung des dynamischen Verhaltens von Bio- Modellen entwickelt und implementiert. Dabei bestand neben der Konzipierung und eigentlichen inhaltlichen Gestaltung der Ontologie (derzeit etwa 130 Konzepte) eine wesentliche Aufgabe darin, die notwendige Infrastruktur (Website, SourceForge-Projekt, Mailingliste, Term Request Tracker, Versionsverwaltung, ChangeLog) aufzubauen. Da abzusehen war, dass eine derart anspruchsvolle Ontologie in einem halben Jahr nur ansatzweise entwickeln werden kann, musste durch die entsprechende Infrastruktur eine vereinfachte Fortführung des Projektes gesichert werden.
Seit Ende 2006 wird in der AG KI im Rahmen einer Promotion an den "Wissenschaftstheoretische(n) Grundlagen der Konstruktion komplexer wissensbasierter Softwaresysteme" gearbeitet. Ziel des Projektes ist es, das bereits weit entwickelte Theorikonzept der Wissenschaftstheorie derart auf Werkzeuge und Formalismen der Wissensrepräsentation zu bertragen, daß damit empirische Theorien, welche bereits im Kern formalisiert vorliegen, rechnerverarbeitbar dargestellt werden können. Das Vorhaben schließt zum einen die Analyse der benötigten formalen beschreibungslogischen Ausdrucksmittel im Verhältnis zu deren Traktabilität und Komplexität ein, zzm anderen die Integration und Modellierung des sogenannten strukturalistischen Theoriekonzeptes der Wissenschaftstheorie nach J.D. Sneed. Nach dessen Grundidee handelt es sich bei empirischen Theorien nicht einfach um eine homogene Ansammlung von Sätzen (statement-view), sondern um eine mit anderen Theorien vernetzte Struktur von Modellmengen samt einem spezifischen und expliziten Vokabular.
Während der anfänglichen Systematisierung hat sich gezeigt, daß formale Ontologien im Sinne der Informatik und empirische Theorien (im statement-view) annäherungsweise ein gegenseitiges Pendant zur formalen Repräsentation von Wissen darstellen. Folgt man der modernen, vor allem durch P. Suppes, T.S. Kuhn und I. Lakatos weiterentwickelten Theoriekonzeption und deren Erweiterung des statement-views hin zur strukturalistischen Theoriekonzeption, wirkt sich das in zwei wesentlichen Punkten aus: Erstens muß die erweiterte, strukturalistische Theoriekonzeption durch bzw. als eine spezielle formale Ontologie rekonstruiert werden. Die resultierende Ontologie des Strukturalismus stellt eine Upper-Level-Ontologie wissenschaftlicher Theorien dar. Zweitens ist zu untersuchen, ob sich die moderne, strukturalistische Konzeption empirischer Theorie nicht generell auch für formale Ontologien im Sinne der Informatik übernehmen läßt. Es besteht Grund zur Annahme, daß die daraus resultierende, erweiterte Ontologiekonzeption für schwere, unterbestimmte Probleme der Ontologieverarbeitung (merging, mapping, matching) Vorteile mit sich bringt.
Das Promotionsvorhaben wird seit Beginn am 01. Oktober 2006 durch ein Landesstipendium des Freistaates Thüringen gefördert.
Ebenso wie die Entwicklung komplexer Software erfordert das rechnergestützte Erstellen, Verarbeiten, Verwalten und zweckgerechte Wiederfinden von komplexen, heterogenen und räumlich verteilten Dokumentbeständen eine zielorientierte Bereitstellung und systematische Verwendung von Prinzipien, Methoden und Werkzeugen für deren arbeitsteilige, ingenieurmäßige Entwicklung und Anwendung. Aufgrund dieser Verwandtschaft mit dem etablierten Gebiet des Software Engineering nennen wir daher die Disziplin, die diese Prinzipien, Methoden und Werkzeuge entwickelt, "Document Engineering".
Wie im Software Engineering kämpft man beim Document Engineering mit der sog. Semantischen Lücke, also dem bedeutungsbezogenen Unterschied zwischen zwei Beschreibungen eines Objekts, der dadurch entsteht, dass dabei verschiedene Repräsentationsformen gewählt werden. Das Document Engineering erfordert nämlich u.a. eine Abbildung von natürlichsprachlichen Modellen der realen Welt in eine formale, maschinell verarbeitbare Repräsentation. Problematisch wird diese Abbildung, wenn das Ausgangsmodell in einer mächtigeren Sprache formuliert ist als die Zielsprache, da dann bei der Abbildung notwendigerweise Details verloren gehen. Dieser Fall liegt z.B. vor, wenn es sich bei der Ausgangssprache um eine natürliche Sprache handelt und als Zielsprache eine beliebige, rechnerverarbeitbare formale Sprache im Spiel ist. Damit rechnergestützte Anwendungen derartige Dokumente ihrer Funktion gemäß korrekt verarbeiten können, werden die betroffenen Dokumente üblicherweise semantisch annotiert, d. h. explizit um maschinenverarbeitbare Zusatzinformationen angereichert, die für mögliche Anwendungen eindeutig signalisieren, ob und ggf. wie das vorliegende Dokument für den durch die Anwendung verfolgten Zweck genutzt werden kann.
Schon das Erstellen eines Dokumentenindexes ist eine inhaltlich anspruchsvolle und nicht triviale Annotationsaufgabe. Textabschnitte müssen inhaltlich unter einem Schlagwort zusammengefasst werden und mit anderen Textabschnitten desselben Dokuments in dessen Index zusammengestellt werden. Dabei können einzelne, thematisch zusammengehörige Indexeinträge unter einem gemeinsamen Oberbegriff angeordnet werden, um dessen Auffindbarkeit zu erhöhen. Die Aufgabe des Indexes ist die zielgenaue, schlagwortbasierte Navigation innerhalb eines Dokuments. Ein Dokumentenindex kann als eine spezielle Art der Annotation des zugrunde liegenden Dokumentes betrachtet werden. Graphisch aufbereitet kann diese Annotation als Navigationshilfe durch den Dokumenteninhalt führen und bei der Ableitung (Lernen) von Domain-Ontologien hilfreich sein.
Ein derart indexiertes Dokument läßt sich im Rahmen eines semantischen Retrievals nutzen. Im Dokumentenindex wird dafür unterschieden zwischen definierenden Indexeinträgen, d.h. Referenzen auf einen Dokumentenabschnitt, der das Index-Schlagwort definiert, und referenzierenden Indexeinträgen, die lediglich einen Abschnitt des Dokuments referenzieren, die sich inhaltlich mit dem Index-Schlagwort befassen, dieses aber nicht definieren oder erklären. Innerhalb des Dokumentenabschnitts eines definierenden Indexeintrags können wieder (referenzierende) Schlagwörter auftauchen, die einer Erklärung/Definition bedürfen, die aber an anderer Stelle eines Dokumenten-Corpus definiert werden. Um eine vollständige Definition eines Index-Schlagworts zu erreichen, müssen rekursiv alle definierenden Indexeinträge zum Dokumentenabschnitt eines definierenden Indexeintrags ermittelt werden. Die sich dabei ergebenden Abhängigkeitsbeziehungen lassen sich durch einfache Regeln formalisieren. Um mithilfe dieser Regeln Schlussfolgerungen ziehen zu können, kann ein automatisches Inferenzverfahren zum Einsatz kommen. In Zusammenarbeit mit Herrn Büttner und Dr. Sack wurde zu diesem Zweck die Möglichkeit der Implementierung eines ATMS (Assumption Based Truth Maintenance System) im Kontext des Semantic Web untersucht. Dazu wurde ein verteilt arbeitendes, web-basiertes ATMS auf Grundlage von OWL (Web Ontology Language), SWRL (Semantic Web Rule Language) und dem JENA-API entwickelt, das neben dem bereits skizzierten Einsatz im Bereich des Document Engineering auch zur semantisch unterstützten Suche in Videodaten angewandt werden soll.
Dieses Projekt wird in Zusammenarbeit mit und unter Federführung der Arbeitsgruppe Biogeochemische Systeme am MPI für Biogeochemie (Prof. Heimann) durchgeführt.
Um den Kohlenstoffhaushalt von verschiedenen ökosystemen wie Wäldern besser zu verstehen, wurden in den letzten zehn Jahren weltweit mehrere Hundert Messtürme aufgestellt, die Kohlenstoffflüsse mit der Eddy-Kovarianz-Methode messen. Allerdings ist diese Eddy-Flussmessung nur unter bestimmten atmosphärischen Bedingungen gültig, wodurch es Datenlücken von ungefähr 40% gibt. Diese Datenlücken werden mit den verschiedensten Techniken wie nicht-linearer Regression, aber auch künstlichen neuronalen Netzen gefüllt.
In diesem Projekt wurden eine umfassende Vergleichsstudie dieser Füllmethoden gestartet und fast alle weltweit existierenden Techniken miteinander verglichen (Moffat et al, 2007). Der Studie zufolge liefern die besten Techniken vergleichbare (gute) Ergebnisse. Dabei sind die Methoden, die auf neuronalen Netzen beruhen, den anderen Methoden leicht überlegen. Zudem lässt sich die Methodik dieser Vergleichsstudie auch auf künftig entwickelte Techniken übertragen. Wie die Studie zeigt, ist eine solche Evaluierung wichtig, da einige Techniken signifikante Schwachstellen aufweisen. Nur theoretisch gut verstandene Techniken und eine standardisierte Vergleichsmethodik ermöglichen es, die Qualität zu sichern und die weltweiten Messergebnisse vergleichen und in gemeinsamen Projekten verwenden zu können. Fast alle Teilnehmer dieser Studie konnten der Einladung zu einem Workshop in Jena im September 2006 folgen, um die Ergebnisse zu besprechen und weitere Aktivitäten zu starten (Desai et al., 2007, in Revision; Richardson et al., 2007).
Im nächsten Abschnitt dieser Doktorarbeit wird es um die Interpretation der modellierten Kohlenstoffflüsse gehen: Künstliche neuronale Netze sind eine geeignete Methode um die Relevanz der Eingaben zu bestimmen und somit qualitative Information über die modellierten Daten zu gewinnen. Diese Methode soll genutzt werden, um Rückschlüsse über die klimatischen Treiber der Kohlenstoffflüsse zu ziehen.
Studien- und Diplomarbeiten, Dissertationen
Veröffentlichungen und eingeladene Vorträge
Wissenschaftliche Zusammenarbeit