e-Book

Consistency analysis and improvement of metabolic databases

for the integration of metabolic models

Stephan Richter
Wissenschaftliche Arbeiten

Moderne Ansätze der Systembiologie basieren auf der Analyse und Modellierung von metabolischen Netzwerken im großen Maßstab. Derartige Modelle sind nur durch das Verweben von Daten aus verschiedenen Quellen erreichbar; beispielsweise Dateien im Systembiologie-Markup-Format (SBML) oder im Internet verfügbare Datenbanken. Die Zusammenführung dieser Daten stellt uns vor große Herausforderungen, da oft wichtige Informationen in für das menschliche Auge gedachten Texten versteckt sind. Teilweise sind Daten auch in Notations-Ebenen versteckt, die sich herkömmlichen Verfahren nicht direkt erschließen. In dieser Schrift wird unter anderem aufgezeigt, wie algebraische Analysen genutzt werden können um strukturelle Informationen freizulegen, die in den Massenwirkungsgesetzen von SBML-Dateien annotiert sind. Des weiteren wird der Organisationstheorie-Ansatz und dessen Anwendung für die Detektion von Unschlüssigkeiten in der Biomodels-Datenbank demonstriert. Ein Vergleich der Ergebnisse dieser Kombination von algebraischer Analyse und Organisationstheorie mit anderen Methoden wie der Fluss-Balance-Analyse (FBA) soll dann die Nützlichkeit dieses Verfahrens belegen. Die damit zugänglich gemachten versteckten Daten zeigen, wie fehleranfällig wissenschafltiche Methoden sind, wenn die zu Grunde liegenden Daten fehlerbehaftet oder ungeeignet formatiert sind. Die Analyse der Biomodels-Datenbank, einer einfachen Sammlung von Modellen im SBML-Format, wird ergänzt durch ein Programm, das entworfen wurde um bestimmte Bakteriengemeinschaften zu ergründen: Diese Bakteriengemeinschaften sollen genutzt werden um auf biologischem Wege Altlasten zu vermindern. In dem entsprechenden Abschnitt dieser Arbeit werden die dafür notwendigen Voraussetzungen erörtert. Des weiteren wird auf die Schwierigkeiten eingegangen, die unweigerlich auftreten, wenn versucht wird eine automatisierte Lösung für dieses Problem zu finden. Dabei werden problematische Datensätze erörtert, die auch bei anderen Ansätzen