Eine Unterzuckerung kommt bei einem Diabetiker meist nicht zufällig. Genauso wenig wie ein Börsenkurs ohne Grund abstürzt. Zumindest theoretisch ist deshalb auch beides vorhersehbar. «In der Praxis gelingen derartige Prognosen bisher allerdings nur in den seltensten Fällen», schreibt die
ETH-Zürich. Sollte Alexander Marx mit seinem Projekt Erfolg haben, werde sich das für Kinder mit Typ 1 Diabetes in Zukunft aber ändern:
«Wir arbeiten an Vorhersagemodellen, die frühzeitig erkennen sollen, ob in der Nacht eine Unterzuckerung droht», wird der Fellow am ETH AI Center zitiert. «Wenn sich Kinder am Tag stark körperlich betätigen, kann ihr Blutzuckerspiegel im Schlaf unter eine kritische Schwelle fallen. Mit einem verlässlichen Prognosemodell liesse sich dieses Risiko vermeiden.»
Theorie und Praxis zusammenführen
Marx befasst sich mit dieser Fragestellung in der Forschungsgruppe für medizinische Datenwissenschaften von Julia Vogt. «Ich komme mehr aus der theoretischen Ecke und habe bisher vor allem mit künstlich erzeugten Daten gearbeitet. Das AI Center hat den Anspruch, Theorie und Praxis zusammenzuführen. Das finde ich spannend. Ich muss jetzt die theoretischen Konzepte auch mit realen Daten zum Funktionieren bringen.»
Sein wissenschaftliches Rüstzeug hat sich Marx an der Universität des Saarlandes im deutschen Saarbrücken erarbeitet. Nach einem Masterabschluss in Bioinformatik befasste er sich am dort ansässigen Max Planck Institut für Informatik im Rahmen seiner Doktorarbeit mit Causal Discovery. Mit diesen statistischen Methoden lassen sich aus Beobachtungsdaten sogenannte kausale Graphen erstellen, die Ursache-Wirkungs-Netzwerke sichtbar machen.
So geht's
Dabei werden beispielsweise aus Umfragedaten alle Faktoren eruiert, bei denen ein Wirkungszusammenhang mit einer bestimmten Grösse vermutet wird. Ein allgemeines Beispiel laut ETH ist die Abhängigkeit des Einkommens einer Person von Alter, Wohnort, Geschlecht, Bildung, Zivilstand oder Kinderzahl.
Auf Basis der gefundenen Zusammenhänge können dann Vorhersagen für Personen, die nicht befragt wurden, gemacht werden. «Dafür müssen nicht einmal die gesamten Abhängigkeitsketten bekannt sein», präzisiert Marx. Es reiche, die kleinste Menge an Faktoren zu eruieren, die für eine Prognose ausreicht.
Von synthetischen Daten in die klinische Realität
Marx hat mit diesen Methoden und mit Unterstützung von künstlicher Intelligenz unter anderem anhand von simulierten Daten untersucht, wie die Aktivitäten von etwa 500 selektierten Genen in einer menschlichen Zelle zusammenhängen.
Im Idealfall könne man diese Verfahren in Zukunft so skalieren, sodass sie alle rund 25'000 Gene einer Zelle miteinbeziehen können, sagt er. Derartige Computer-Analysen von Gennetzwerken würden der biologischen und der medizinischen Forschung einfach und schnell ein umfassendes Verständnis der Vorgänge in einer Zelle eröffnen.
Um das Gleiche mit Laborexperimenten zu erreichen, wäre ein enormer Aufwand nötig. Es müsste nämlich jedes Gen einzeln mit gentechnologischen Werkzeugen abgeschaltet und dann die Auswirkungen auf die Aktivität aller anderen Gene gemessen werden.
«Wir stossen mit unserem Projekt in Bereiche vor, die wir mit den zur Verfügung stehenden Methoden bisher noch nicht beherrschen.»
Für die Projekte, die Marx am AI Center in Angriff nimmt, muss er die Causal-Discovery-Methoden auf ein neues Komplexitätsniveau heben. Anstelle von vollständigen Beobachtungsdatensätzen oder synthetischen Daten, wie bei der Genexpression, arbeitet er jetzt mit echten Daten aus der klinischen Praxis.
Das mache die Aufgabenstellung markant schwieriger: «In der Realität fehlen häufig einzelne Informationen, Messwerte oder ganze Datensätze und die Erhebung unterscheidet sich auch immer von Spital zu Spital und manchmal sogar von Arzt zu Arzt», stellt Marx fest.
Zusammenarbeit mit UKBB
Die klinischen Daten, die Marx für sein Vorhersagemodell in Zusammenarbeit mit Ärztinnen und Ärzten des Universitäts-Kinderspital beider Basel (UKBB) auswertet, enthalten unter anderem Zeitreihen der Pulsfrequenz und des Blutzuckerspiegels sowie Informationen zu physischen Aktivitäten, zur Kalorienaufnahme, zu Insulininjektionen und zur Schlafqualität.
In einem ersten Schritt werden Daten gefiltert und allfällige Korrelationen, die nicht mit der Fragestellung zusammenhängen, aus dem Modell ausgeschlossen.
Um künftig robuste und für einen behandelnden Arzt auch nachvollziehbare Prognosen abgeben zu können, muss die Anzahl der Faktoren nämlich möglichst tiefgehalten werden.
So oder so lasse sich heute noch nicht vorhersagen, ob das Modell in der Praxis erfolgreich sein werde: «Wir stossen mit unserem Projekt in Bereiche vor, die wir mit den zur Verfügung stehenden Methoden bisher noch nicht beherrschen.»