Fördermaßnahme

CompLS – Computational Life Sciences

Veröffentlichung der Bekanntmachung: 2017
Förderzeitraum: 2019 - 2026
Gesamte Fördersumme: bis zu 51 Mio. Euro
Anzahl der Projekte: 47 Verbünde und 27 Einzelprojekte, insgesamt 157 Zuwendungsempfänger

1. Ziele der Fördermaßnahme

Der Fortschritt im Bereich experimenteller Methoden und moderner (Hochdurchsatz-)Technologien ist ein wichtiger Treiber für Innovationen in der biologischen und medizinischen Forschung. Zukünftig werden vermehrt quantitative, zeitaufgelöste Messungen zellulärer Systeme durchgeführt. Gleichzeitig nimmt auch die Menge der digitalisierten Daten in der Patientenversorgung und klinischen Forschung rasant zu. Um all diese stark heterogenen Daten wirkungsvoll zu analysieren, zu interpretieren und nutzbar zu machen sind intelligente Algorithmen und integrative systemmedizinische Workflows erforderlich.

Hier setzt die Fördermaßnahme „Computational Life Sciences“ an. Ziel ist es, durch die Entwicklung innovativer Methoden und Softwarewerkzeuge zur bioinformatischen Verarbeitung, Modellierung und Simulation auf aktuelle Bedarfe in den Lebenswissenschaften einzugehen. Dadurch sollen der lebenswissenschaftlichen Forschung in Deutschland effiziente und zuverlässige Hilfsmittel zur Verfügung gestellt werden, um die durch neueste experimentelle Methoden oder die Zusammenführung verschiedener Modalitäten gewonnenen Daten geeignet zu modellieren und zu analysieren. Insgesamt sind bis 2024 sechs Auswahlrunden mit einem jährlichen Förderaufruf im Rahmen der Fördermaßnahme geplant.

2. Stand der Fördermaßnahme

Alle 2018 zur Förderung ausgewählten Projekte der ersten Auswahlrunde (13 Verbünde und 14 Einzelprojekte mit insgesamt 47 Zuwendungsempfängern, themenoffen) und der zweiten Auswahlrunde (11 Verbünde und 5 Einzelprojekte mit insgesamt 34 Zuwendungsempfängern) mit dem Fokusthema „Deep Learning in der Biomedizin“ haben mit ihren Forschungsarbeiten begonnen.

Die Projekte der dritten Auswahlrunde (5 Verbünde und 6 Einzelprojekte mit insgesamt 18 Zuwendungsempfängern) mit dem thematischen Fokus „Maschinelles Lernen für die Krebsforschung“ sind erfolgreich im ersten Halbjahr 2021 gestartet. Die Projekte der vierten Auswahlrunde (9 Verbünde mit insgesamt 28 Zuwendungsempfängern), die den Fokus auf das Themengebiet „KI-Methoden für die Infektionsforschung“ legt, sind im 2022 gestartet, während die 10 Forschungsverbünde mit 25 Partnern (fünfte Auswahlrunde) zur Erforschung von „KI-Methoden für die Systemmedizin“ ein Jahr später in 2023 starteten.

Im November 2023 erfolgte der Förderaufruf zur sechsten Auswahlrunde mit dem Themenschwerpunkt „Digitale Methoden zur Erforschung postakuter Infektionssyndrome“.  Im Rahmen der Fördermaßnahme sollen durch die Zusammenarbeit von Expertinnen und Experten aus den Bereichen der künstlichen Intelligenz sowie der Lebenswissenschaften neue innovative Methoden, Software-Werkzeuge und Computermodelle entwickelt werden, um biomedizinische Forschungsdaten effizienter auswerten zu können. Ziel ist es, die Erforschung von postakuten Infektionssyndromen voranzutreiben, die durch verschiedene virale und nichtvirale Erreger verursacht werden und ein relativ ähnliches Symptomprofil aufweisen. Die Forschungsvorhaben sollen KI-gestützte Methoden und Analysewerkzeuge entwickeln, die das Verständnis für Krankheitsmechanismen der postakuten Infektionssyndrome erweitern.

Einzelprojekte

Abgeschlossen

AutoXRayCell – Computergestützte automatische Auswertung von Bilddaten aus der Röntgentomographie von Zellen mittels machine-learning

Förderkennzeichen: 031L0195
Gesamte Fördersumme: 391.296 EUR
Förderzeitraum: 2020 - 2022
Projektleitung: Prof. Dr. Helge Ewers
Adresse: Freie Universität Berlin - Institut für Chemie und Biochemie
Thielallee 63
14195 Berlin

AutoXRayCell – Computergestützte automatische Auswertung von Bilddaten aus der Röntgentomographie von Zellen mittels machine-learning

Das Einzelprojekt AutoXrayCell beschäftigt sich mit dem Thema Zellbiologie, genauer gesagt mit der Aufklärung intrazellulärer Strukturen und der Wechselwirkung von Zellorganellen miteinander. Störungen dieser intrazellulären Wechselwirkungen wurden inzwischen als Ursache verschiedener Erkrankungen identifiziert. Bisherige Methoden können die Organell-Organisation in kompletten Zellen nur schwer abbilden. Oft ist die benötigte Auflösung nicht erreichbar oder eine ausreichende Durchdringung der Zellen nicht möglich. Auch die erforderliche Aufnahmedauer stellt häufig ein Problem dar. AutoXRayCell verfolgt daher nun einen neuen Ansatz mit einer Technik aus dem Bereich der Kryo-Elektronenmikroskopie, der sogenannten Kryo-Röntgenmikroskopie-Tomographie-Technik (Kryo-SXT). Derzeit kommt diese Technik noch kaum zum Einsatz, da sie aufgrund der sehr aufwendigen Datenverarbeitung immer noch einen zu niedrigen Durchsatz aufweist, um einen quantitativen Zellatlas aufzustellen.

Hier setzt AutoXRayCell an: Im Rahmen des Projekts soll die Kryo-SXT-Technik verbessert und damit Analysen erheblich beschleunigt werden. Es ist vorgesehen, eine auf künstlicher Intelligenz basierende Software zu entwickeln, mit der sich die verschiedenen Verarbeitungsschritte der Kryo-SXT-Technik – von den Rohdaten bis hin zu den annotierten Bildern – komprimieren lassen. Mithilfe dieser neuen Analysesoftware wird es künftig möglich sein, einen quantitativen Zellatlas zu erstellen, der in Kombination mit Omics-Technologien weit umfassendere Einblicke als bislang in intrazelluläre Vorgänge zulassen wird. Auch zellbiologische Assays werden sich mit der verbesserten Kryo-SXT-Technik durchführen lassen, so dass intrazelluläre Vorgänge und deren Bedeutung im Krankheitsgeschehen zukünftig schneller und detaillierter aufgeklärt werden können.

Abgeschlossen

BINDA - Neues Softwarepaket und Mustererkennungsalgorithmen für große, hochdimensionale neuronale Datensätze

Förderkennzeichen: 031L0167
Gesamte Fördersumme: 447.907 EUR
Förderzeitraum: 2019 - 2022
Projektleitung: Dr. Martin Vinck
Adresse: Ernst Strüngmann Institut gGmbH
Deutschordenstr. 46
60528 Frankfurt am Main

BINDA - Neues Softwarepaket und Mustererkennungsalgorithmen für große, hochdimensionale neuronale Datensätze

Das Einzelprojekt BINDA beschäftigt sich mit dem Thema Datenverarbeitung in den Neurowissenschaften. In den vergangenen 30 Jahren hat sich die Messtechnik, mit der einzelne Nervenzellen und Hirnströme untersucht werden können, stark verbessert. Waren früher nur Einzelmessungen mit einer einzigen Elektrode möglich, so können heute mehr als 1000 Messkanäle gleichzeitig Daten liefern. Dank dieses technologischen Fortschrittes stehen nun sehr große Datensätze zur Verfügung, mit denen beispielsweise das kollektive Verhalten von Nervenzellen erforscht werden kann. Die für eine solche Datenanalyse notwendigen Software-Werkzeuge müssen jedoch immer komplexere Berechnungen ausführen und stoßen in immer kürzeren Abständen an ihre Kapazitätsgrenzen.

Hier setzt BINDA an: Im Rahmen des Projekts soll ein Paket neuer Softwarewerkzeuge und mathematischer Techniken entwickelt werden, mit dem in Hochleistungsrechnern hochkomplexe neuronale Datensätze untersucht werden können. Es soll künftig möglich sein, elektrophysiologische Daten des Gehirns effektiv zu analysieren und zu visualisieren. Ein Schwerpunkt der geplanten Analysemöglichkeiten liegt auf der Darstellung von Interaktionen und der Frage nach Korrelationen zwischen Nervenzellen. Es ist vorgesehen, entsprechende Algorithmen zu entwickeln und mit ihrer Hilfe aus den Datensätzen signifikante Muster zu extrahieren. Die geplante Open-Source-Plattform soll unter anderem über modernste Methoden des maschinellen Lernens verfügen, mit denen immer wiederkehrende Aktivitätsmuster von Nervenzellen erkannt werden können.

Die neu entwickelten Methoden und Softwarewerkzeuge werden die Grundlagenforschung in den Neurowissenschaften wesentlich verbessern und mittelfristig auch im klinischen Umfeld Anwendung finden.

ChemoTox-AI - Kombination von Physiologie und Künstlicher Intelligenz zur Personalisierten Modellierung von Chemotherapietoxizität – Entwicklung eines Ansatzes und Werkzeugs

Förderkennzeichen: 031L0261
Gesamte Fördersumme: 364.515 EUR
Förderzeitraum: 2021 - 2024
Projektleitung: Prof. Dr. Markus Scholz
Adresse: Universität Leipzig - Medizinische Fakultät - Institut für Medizinische Informatik, Statistik und Epidemiologie (IMISE)
Härtelstr. 16-18
04107 Leipzig

ChemoTox-AI - Kombination von Physiologie und Künstlicher Intelligenz zur Personalisierten Modellierung von Chemotherapietoxizität – Entwicklung eines Ansatzes und Werkzeugs

Das Einzelprojekt ChemoToxAI beschäftigt sich mit Chemotherapien und ihrer Auswirkung auf die Blutbildung. Chemotherapien gegen Krebs wirken nicht nur effektiv gegen sich schnell teilende Tumorzellen, sondern auch gegen die sich ständig teilenden Stammzellen des Knochenmarks, die die Vorläuferzellen für unsere Blutzellen liefern. Die starke Beeinträchtigung der Blutbildung ist einer der häufigsten Gründe dafür, Chemotherapien zu unterbrechen, bis sich die Blutbildung wieder erholt hat und damit einhergehende Nebenwirkungen ausreichend abgeklungen sind. Die Auswirkung einer Chemotherapie auf die Blutbildung ist jedoch individuell sehr verschieden. Um jedes unnötige Risiko auszuschließen wird derzeit die Stärke einer Standardtherapie von der Verträglichkeit einer relativ kleinen Gruppe von sehr empfindlichen Patientinnen und Patienten festlegt, was die eigentlich mögliche Therapieeffizienz für die gesamte Patientenpopulation limitiert.

Hier setzt ChemoToxAI an: Im Rahmen des Projekts sollen bereits vorhandene physiologische Prognose-Modelle zur Verträglichkeit, die bereits sehr gute Vorhersagen bei „Standard“-Patientinnen und -Patienten liefern, mit speziellen sogenannten „Artificial Neural Networks“ kombiniert werden. Diese computergestützten Netzwerke ermöglichen ein selbständiges und systematisches Lernen der Modelle über Feedback-Mechanismen. Die Prognose-Modelle sollen zunächst mit vorhandenen Daten von Patientinnen und Patienten mit aggressiven non-Hodgkin B-Zell-Lyphomen trainiert und validiert werden. Im letzten Projektjahr sind dann auch Tests mit weiteren Krebserkrankungen vorgesehen. Mit den verbesserten Modellen ließe sich künftig bereits vor einer Chemotherapie das persönliche Risiko von Patientinnen und Patienten deutlich präziser vorhersagen, so dass auf Basis dieser Prognose individuell die optimale Therapie mit den größten Heilungschancen festgelegt werden könnte.

Abgeschlossen

CLARITY - Die Entwicklung einer kombinierten physisch-genetischen Karte für eine Milchrindrasse in Deutschland

Förderkennzeichen: 031L0166
Gesamte Fördersumme: 238.337 EUR
Förderzeitraum: 2019 - 2022
Projektleitung: Dr. Dörte Wittenburg
Adresse: Leibniz-Institut für Nutztierbiologie
Wilhelm-Stahl-Allee 2
18196 Dummerstorf

CLARITY - Die Entwicklung einer kombinierten physisch-genetischen Karte für eine Milchrindrasse in Deutschland

Das Einzelprojekt CLARITY beschäftigt sich mit dem Thema Populationsgenetik am Beispiel der Züchtung von Milchkühen. In der Tierzucht spielt das detaillierte Verständnis der komplexen Zusammenhänge bei der Rekombinationsrate sowie der exakten genetischen Verortung von Eigenschaften auf dem Chromosom eine entscheidende Rolle. Für die gezielte Vererbung von Eigenschaften ist es wichtig, sowohl den physischen Abstand (gemessen in Zentimetern) als auch den genetischen Abstand (gemessen in Basenpaaren) zwischen den einzelnen molekularen Markern genau zu kennen. Diese Werte unterscheiden sich bei jedem Tier und werden daher in Genomdatenbanken gesammelt. Die Datenbanken müssen regelmäßig auf den neusten Stand gebracht und mit einem aktuellen Index versehen werden, was sehr zeitaufwändig und rechenintensiv ist. Im Rahmen des Projekts soll dieser Prozess beschleunigt und erleichtert werden.

Es ist geplant, geeignete Analysewerkzeuge zu entwickeln bzw. zu verbessern und mit ihrer Hilfe am Beispiel einer deutschen Milchrindrasse eine Übersichtskarte der verschiedenen molekularen Markerabstände zu entwickeln. Dafür sollen umfangreiche Genotypdaten detailliert analysiert sowie ein bereits vorhandenes statistisches Modell weiter verfeinert werden. Die Analyseergebnisse werden anschließend in einer Datenbank veröffentlicht, die im Rahmen von Open Access allen Forscherinnen und Forschern zur Verfügung steht.

Die Datenbank wird offen für Erweiterungen um andere Rinderrassen sein und den Vergleich mit weiteren Spezies erlauben. Die im Rahmen des Projekts entwickelten Analysewerkzeuge werden sich zudem gut auf weitere Anwendungsfelder übertragen lassen.

Abgeschlossen

Cohort-SV - Auffinden und Genotypisieren von struktureller Variation in Sequenzierungsdaten ganzer Genome für große Kohorten

Förderkennzeichen: 031L0180
Gesamte Fördersumme: 324.066 EUR
Förderzeitraum: 2019 - 2022
Projektleitung: Dr. Birte Kehr
Adresse: Charité - Universitätsmedizin Berlin - Berliner Institut für Gesundheitsforschung - JRG Genome Informatics
Charitéplatz 1
10117 Berlin

Cohort-SV - Auffinden und Genotypisieren von struktureller Variation in Sequenzierungsdaten ganzer Genome für große Kohorten

Das Einzelprojekt Cohort-SV beschäftigt sich mit Verbesserungen bei der Analyse von Genom-Sequenzierungsdaten. Mit diesen Analysen können verschiedene Formen der genetischen Variation aufgedeckt werden, neben Varianten einzelner Nukleotide und kleinen Insertionen bzw. Deletionen insbesondere auch sogenannte genomische Strukturvarianten (SV). Untersuchungen dieser Strukturvarianten tragen wesentlich zu einem besseren Verständnis von menschlichen Merkmalen und von Krankheiten bei. Die Identifizierung und Genotypisierung der Strukturvarianten ist derzeit jedoch – insbesondere bei umfangreichen Kohorten – eine große rechnerische Herausforderung, da die aktuell zur Verfügung stehenden Analyseprogramme trotz hohen Personaleinsatzes und großer Rechenkapazität oft nur ungenaue Ergebnisse liefern.

Im Rahmen von Cohort-SV soll nun ein neues Analysetool entwickelt werden, mit dem sich genomische Strukturvarianten künftig besser, d.h. skalierbarer, effizienter, mit höherer Genauigkeit und benutzerfreundlicher als bislang analysieren lassen. Das neue Analyseprogramm soll insbesondere in der Lage sein, die Daten von vielen Personen zusammen zu analysieren, so dass eine genomische Strukturvariante schneller identifiziert werden kann. Gleichzeitig ist geplant, auch die Arbeitsleistung des Programms in Bezug auf die Laufzeit und den Rechenspeicherverbrauch zu optimieren, indem die zur Analyse benötigte Datenmenge reduziert wird.

Mit dem neuen Analysetool lassen sich künftig eine Vielzahl komplexer biologischer Studien – beispielsweise zu Mutationsraten und ihren Auswirkungen auf Krankheiten – durchführen und wesentlich effizienter als bislang die vorhandenen genomischen Daten nutzen.

Abgeschlossen

Data2Dynamics - Modellierung großer biologischer Systeme – Erweiterung der Modellierungssoftware

Förderkennzeichen: 031L0179
Gesamte Fördersumme: 275.108 EUR
Förderzeitraum: 2019 - 2022
Projektleitung: Prof. Dr. Jens Timmer
Adresse: Albert-Ludwigs-Universität Freiburg - Fakultät für Mathematik und Physik - Physikalisches Institut - Abt. Dynamische Prozesse in den Lebenswissenschaften
Hermann-Herder-Str. 3
79104 Freiburg

Data2Dynamics - Modellierung großer biologischer Systeme – Erweiterung der Modellierungssoftware

Das Einzelprojekt Data2Dynamics beschäftigt sich mit der Verbesserung bzw. Erweiterung des systembiologischen Softwarepaketes Data2Dynamics (D2D). Das in der Arbeitsgruppe von Prof. Timmer entwickelte Softwarepaket ermöglicht es, nichtlineare dynamische Modelle im Bereich der Systembiologie zu erstellen. Das Hauptaugenmerk liegt dabei auf der Datenanalyse sowie der Parameter- und Unsicherheitsschätzung. D2D kann eine Vielzahl an Daten und Messmethoden einfach miteinander verknüpfen, so Modelle und Parameter gemeinsam trainieren und Vorhersagen daraus ableiten. Insbesondere die Möglichkeit der Unsicherheitsabschätzung hat dazu beigetragen, dass das frei zugängliche Softwarepaket bei vielen Fragestellungen erfolgreich eingesetzt wird. Bislang ist die Anwendung jedoch auf relativ kleine Modelle beschränkt, auch werden für die Erstellung und die Analyse der dynamischen Modelle sowohl Expertenwissen als auch Programmierkenntnisse benötigt.

Hier setzt das Vorhaben Data2Dynamics an: Im Rahmen des Projekts soll das D2D-Softwarepaket in drei Richtungen weiterentwickelt werden. Es ist geplant, die Leistungsfähigkeit bei der Modellierung zu erhöhen, die Benutzerfreundlichkeit zu steigern sowie durch das Einbeziehen weiterer Tests die Zuverlässigkeit zu verbessern. Künftig sollen insbesondere auch große Datenmengen zur Modellierung herangezogen werden können. Es ist zudem vorgesehen, die Unterstützung bekannter Datenstandards zu erweitern und eine Schnittstelle für etablierte Programme aus den Bereichen Datenanalyse und Modellierung zu integrieren.

Durch die geplanten Änderungen werden künftige Analysen und Simulationen von dynamischen biologischen Systemen wesentlich realitätsnäher als bislang modelliert werden können, und auch das biotechnologische bzw. medizinische Anwendungspotential wird durch die geplanten Verbesserungen deutlich erhöht.

Abgeschlossen

DeepCurate – Entwicklung eines Tools zur Unterstützung der Kuratierung von Text- und Biodaten durch multimodales Deep Learning

Förderkennzeichen: 031L0204
Gesamte Fördersumme: 642.000 EUR
Förderzeitraum: 2020 - 2022
Projektleitung: PD Dr. Wolfgang Müller
Adresse: HITS gGmbH - Abteilung Scientific Databases and Visualization (SDBV)
Schloß-Wolfsbrunnenweg 35
69118 Heidelberg

DeepCurate – Entwicklung eines Tools zur Unterstützung der Kuratierung von Text- und Biodaten durch multimodales Deep Learning

Das Einzelprojekt DeepCurate beschäftigt sich mit der Entwicklung eines intelligenten Systems zur Kuratierung experimenteller Daten aus biochemischen Reaktionen sowie deren reaktionskinetische Eigenschaften. Der größte Teil dieser Daten wird in der herkömmlichen Fachliteratur publiziert, wo die Daten zwar für die menschliche Lektüre optimiert, aber gar nicht oder nur punktuell – etwa in Tabellenform – strukturiert sind. Die Extraktion und Kuratierung all dieser Daten erfolgt derzeit manuell, was sehr arbeits- und zeitaufwändig ist. Bereits bestehende Methoden der automatischen Sprachverarbeitung verfügen noch nicht über die Robustheit, Abdeckung und Effektivität, um die Daten in der erforderlichen Qualität zu extrahieren.

Hier setzt DeepCurate an: Auf Basis eines bereits vorhandenen komplexen und strukturierten Workflows soll ein neues System entwickelt werden, das die menschlichen Expertinnen und Experten, die die Daten auslesen, intelligent unterstützt. Das neue System soll die kognitive Belastung während der Bearbeitung verringern, triviale Teilaufgaben wie beispielsweise die Suche automatisieren und dadurch die Effektivität und Effizienz der manuellen Kuratierung steigern. Es ist geplant, mithilfe von Deep-Learning-Methoden Textdaten, Bilddaten (wie farbkodierte, gescannte Publikationen) und Blickbewegungsdaten zu integrieren. Die Forschungsergebnisse sollen regelmäßig in wissenschaftlichen Fachzeitschriften publiziert und auf internationalen Fachkonferenzen vorgestellt werden.

Abgeschlossen

DeepNI - Innovative Deep Learning Methoden für die Rechnergestützte Neuro-Bildgebung

Förderkennzeichen: 031L0206
Gesamte Fördersumme: 1.008.975 EUR
Förderzeitraum: 2020 - 2023
Projektleitung: Prof. Dr. Martin Reuter
Adresse: Deutsches Zentrum für Neurodegenerative Erkrankungen e.V. (DZNE) in der Helmholtz-Gemeinschaft
Venusberg-Campus 1, Gebäude 99
53127 Bonn

DeepNI - Innovative Deep Learning Methoden für die Rechnergestützte Neuro-Bildgebung

Das Einzelprojekt DeepNI beschäftigt sich mit Verbesserungen bei der Analyse großer Datensätze aus der medizinischen Bildgebung, insbesondere aus dem neurowissenschaftlichen Bereich. In großen Populationsstudien – beispielsweise in der Demenzforschung – werden oft Bilder des menschlichen Gehirns im sogenannten Magnet-Resonanz-Tomographie-Verfahren (MRT) aufgenommen. Für die Auswertung der MRT-Bilder existieren zwar etablierte Analyse-Pakete, jedoch benötigen diese lange Rechen-zeiten. Insbesondere MRT-Bilder großer Studien lassen sich so häufig nicht mehr auswerten.

Hier setzt DeepNI an: Im Rahmen des Projekts soll eine neue Software-Plattform mit schnelleren Analysemethoden entwickelt werden, die auf Deep-Learning-Techniken basieren. Es ist geplant, erweiterte Funktionalitäten einzubauen, mit denen sich künftig beispielsweise auch hochaufgelöste und multi-modale Bilddaten verarbeiten lassen. Großer Wert wird dabei insbesondere auf eine verbesserte Interpretierbarkeit der Ergebnisse gelegt. Die neuen Algorithmen sollen als Analyse-Paket validiert und für alle interessierten Wissenschaftlerinnen und Wissenschaftler frei zugänglich gemacht werden, indem sie in existierende und weitverbreitete Open-Source-Software integriert werden.

Die neue Software-Plattform wird modernste Bildanalyse-Methoden für den Bereich des Neuro-Imaging zu Verfügung stellen. Diese werden es ermöglichen, auch sehr große Datensätze aus Populationsstudien auszuwerten, so dass neue Anwendungsmöglichkeiten insbesondere in den Bereichen Big Data, Präzisionsmedizin und personalisierte Medizin erschlossen werden können.

Deep-PLS – Eine Graph-basierte Methode für Multi-omics und Integration von Bilddaten bei Krebserkrankungen

Förderkennzeichen: 031L0266
Gesamte Fördersumme: 202.131 EUR
Förderzeitraum: 2021 - 2024
Projektleitung: Prof. Dr. Jan Korbel
Adresse: Europäisches Laboratorium für Molekularbiologie (EMBL)
Meyerhofstr. 1
69117 Heidelberg

Deep-PLS – Eine Graph-basierte Methode für Multi-omics und Integration von Bilddaten bei Krebserkrankungen

Das Einzelprojekt Deep-PLS beschäftigt sich mit Verbesserungen bei der Erstellung von Krebsdiagnosen. Derzeit basieren Krebsdiagnosen in erster Linie auf histopathologischen Gewebe-Begutachtungen, die mithilfe bildgebender Verfahren erstellt werden. Die Diagnosen werden bei Bedarf um molekulare Gewebsanalysen ergänzt. Die den beiden Diagnoseverfahren zugrundeliegenden Datensätze werden dabei in der Regel getrennt voneinander analysiert. Dies schränkt die Möglichkeit ein, die Krebsentwicklung ganzheitlich – von der molekularen Entstehung bis zum mikroskopisch sichtbaren, pathologischen Gewebe – –zu betrachten und zu verstehen.

Hier setzt Deep-PLS an: Im Rahmen des Projekts soll eine neue Diagnosemethode entwickelt werden, die in der Lage ist, molekulare Daten aus verschiedenen Omics-Bereichen und histopathologische Bilddaten effizient miteinander zu kombinieren. Die neue Graph-basierte Methode soll zu einem besseren Verständnis der Krebsentstehung beitragen, indem der gesamte Mutationsverlauf einer Krebserkrankung dargestellt wird, einschließlich der transkriptionellen und epigenetischen Messungen und der Veränderungen in der Gewebemikrostruktur. Es ist geplant, systematische Analysen durchzuführen, mit deren Hilfe entsprechende Verlaufsmodelle erstellt werden sollen. Die Modelle sollen zeigen, wie molekulare Ereignisse zu Zell- und Gewebeveränderungen und somit zu Krebs führen. Auch eine Unterscheidung von Krebserkrankungen in unterschiedliche Subtypen soll künftig möglich sein. Beides wird dazu beitragen, den Prozess der Krebsentstehung künftig besser zu verstehen.

Abgeschlossen

DeepPath – Deep learning based identification of pathogens from next generation sequencing data

Förderkennzeichen: 031L0248
Gesamte Fördersumme: 255.728 EUR
Förderzeitraum: 2020 - 2023
Projektleitung: Prof. Dr. Bernhard Renard
Adresse: Hasso-Plattner-Institut für Digital Engineering gGmbH
Prof.-Dr.-Helmert-Str. 2-3
14482 Potsdam

DeepPath – Deep learning based identification of pathogens from next generation sequencing data

Im Einzelprojekt DeepPath sollen Deep-Learning-Ansätze genutzt werden, um das pathogene Potenzial von Nukleotidsequenzen vorherzusagen. Ziel ist es, auf diese Weise schnell neue mikrobielle Krankheitserreger und Risiken aus synthetischen biologischen Experimenten zu erkennen. Dank immer effizienterer Analysetechniken wie dem sogenannten Next Generation Sequencing (NGS) können inzwischen Milliarden von kurzen DNA- oder RNA-Sequenzen innerhalb eines Tages produziert werden. Für ihre Auswertung stehen verschiedene Analyseprotokolle zur Verfügung, diese basieren bislang jedoch überwiegend auf dem Prinzip der Homologie-Suche und können nur Sequenzen mit Ähnlichkeiten zu bekannten Krankheitserregern zuordnen.

Hier setzt DeepPath an: Im Rahmen des Projekts sollen diese Einschränkungen durch die Entwicklung einer neuen Analyse-Software überwunden werden. Es ist geplant, künstliche neuronale Netze mit den großen Sammlungen von Krankheitserregern und Nicht-Pathogenen aus öffentlichen und internen Datenbanken (Repositorien) zu trainieren, die verschiedene Aspekte der Pathogenität und des Wirtsspektrums abdecken. Um auch Krankheitserreger entdecken zu können, für die es bislang keine großen Datenbanken gibt, sollen sogenannte Transfer-Lernmethoden zum Einsatz kommen. Mit diesen sollen bereits erstellte Netze übertragen werden. Die Analysen sollen zukünftig in Echtzeit bereits bei laufenden Sequenzierungen eingesetzt werden können, um bei zeitkritischen Analysen schnellstmöglich Krankheitserreger zu identifizieren. Es ist vorgesehen, die Ergebnisse nachvollziehbar und benutzerfreundlich – beispielsweise in Form von Graphiken – darzustellen. Die neu entwickelte Software wird es so künftig ermöglichen, die Erkennung unbekannter Pathogene in der modernen Versorgung deutlich zu beschleunigen.

Abgeschlossen

DeProVIDEO – Deep Learning für die Detektion von Proteinvarianten

Förderkennzeichen: 031L0201
Gesamte Fördersumme: 272.608 EUR
Förderzeitraum: 2020 - 2022
Projektleitung: PD Dr. Martin Eisenacher
Adresse: Ruhr-Universität Bochum - Medizinische Fakultät und Klinikum - Medizinisches Proteom-Center
Gesundheitscampus 4 Gebäude ProDi E2.269
44801 Bochum

DeProVIDEO – Deep Learning für die Detektion von Proteinvarianten

Das Einzelprojekt DeProVIDEO beschäftigt sich mit der Analyse von Proteinen. Ziel ist es, mithilfe neuer computerbasierter Auswertungsmethoden die Identifizierung von Proteinvarianten bei modernen massenspektrometrischen Protein-Analyseverfahren zu verbessern. Im Hochdurchsatzverfahren müssen Proteine üblicherweise vor ihrer Analyse im Massenspektrometer zunächst in kleinere Einheiten (sogenannte Peptide) verdaut werden, bevor die entsprechenden Peptid-Fragmente als Spektren im Massenspektrometer vermessen werden können. Anschließend kommen datenbankgestützte Peptidsuchmaschinen zum Einsatz, um die Sequenz des Gesamtproteins zu identifizieren. Die hierbei normalerweise genutzten Proteindatenbanken enthalten jedoch nur die gebräuchlichsten Proteinsequenzen, so dass die Identifizierung von Varianten nicht möglich ist. Zwar existieren Datenbanken, die auch Sequenzen von Peptidvarianten beinhalten, die Zuordnung zu den tatsächlich gemessenen Spektren erfolgt jedoch immer über sogenannte virtuelle Spektren. Diese werden von speziellen Suchmaschinen über die Datenbanksequenzen vorhergesagt, was je nach Anzahl der möglichen Peptidvarianten zu einer hohen Falschidentifikationsrate (FDR) führt.

Hier setzt DeProVIDEO an: Im Rahmen des Projekts soll – über zwei unterschiedliche Verfahren – die Identifikation der tatsächlichen Proteinsequenzen, die über die Spektren der einzelnen Peptide ermittelt werden, wesentlich verbessert werden. Die erste Methode setzt an den virtuellen Spektren an: Über sogenanntes „Maschinelles Lernen“ soll bei diesen die Genauigkeit erhöht und eine exaktere Zuordnung zu den gemessenen Spektren ermöglicht werden. Bei der zweiten Methode ist geplant, die Peptidsequenz direkt durch eine genauere Analyse der gemessenen Spektren ohne Datenbankabgleich zu ermitteln, was künftig auch die Identifikation von Sequenzen bislang völlig unbekannter Peptide ermöglichen würde.

Abgeschlossen

DIAS - Datenintegration, Analyse und Services in ProteomicsDB

Förderkennzeichen: 031L0168
Gesamte Fördersumme: 987.712 EUR
Förderzeitraum: 2019 - 2022
Projektleitung: Prof. Dr. Bernhard Küster
Adresse: Technische Universität München - Wissenschaftszentrum Weihenstephan - Forschungsdepartment Biowissenschaftliche Grundlagen - Lehrstuhl für Proteomik und Bioanalytik
Emil-Erlenmeyer-Forum 5
85354 Freising

DIAS - Datenintegration, Analyse und Services in ProteomicsDB

Das Einzelprojekt DIAS beschäftigt sich mit dem Thema Proteomik, der systematischen Erforschung der Gesamtheit aller Proteine. Proteine zählen zu den wichtigsten aller Biomoleküle und steuern nahezu alle Vorgänge in lebenden Organismen. Wie überall in der modernen biowissenschaftlichen Forschung wurden auch bei der Erforschung der Proteine in den vergangenen Jahren große Datenmengen erzeugt. Um diese Daten effizient nutzen zu können, werden immer komplexere bioinformatische Anwendungen benötigt. Insbesondere die Verknüpfung der heterogenen Daten untereinander gewinnt derzeit stark an Bedeutung und erfordert große Innovationsanstrengungen im bioinformatischen Bereich.

Im Rahmen von DIAS sollen daher nun Bioinformatik-Werkzeuge weiterentwickelt und verbessert werden. Hauptziel dabei ist es, künftig einfach und zuverlässig proteomische Daten mit Daten aus anderen biowissenschaftlichen Forschungsbereichen zusammenzubringen und analysieren zu können. Die geplanten Arbeiten bauen auf der in der Arbeitsgruppe von Prof. Küster entwickelten und bereits erprobten Datenbank ProteomicsDB auf und sollen deren Funktionen und Möglichkeiten in wichtigen Bereichen erweitern. Es ist unter anderem vorgesehen, den Wissenschaftlerinnen und Wissenschaftlern künftig programmgesteuert Zugriff auf alle in ProteomicsDB gespeicherten Daten zu ermöglichen. Auch eine benutzerdefinierte Datenanalyse der eigenen Daten innerhalb der Datenbank sowie der Zugriff auf verschiedene Massenspektren-Bibliotheken für beliebige Organismen mit sequenziertem Genom sollen künftig möglich sein.

Durch die geplanten Verbesserungen werden sich in Zukunft neue Modelle für komplexe biologische Zusammenhänge erzeugen lassen, die mittelfristig bei klinischen Entscheidungsfindungsprozessen eingesetzt werden könnten.

Abgeschlossen

GeoMine: Methoden zur geometrischen Mustersuche in Proteinstruktursammlungen

Förderkennzeichen: 031L0172
Gesamte Fördersumme: 388.952 EUR
Förderzeitraum: 2019 - 2022
Projektleitung: Prof. Dr. Matthias Rarey
Adresse: Universität Hamburg - Fakultät für Mathematik, Informatik und Naturwissenschaften - Zentrum für Bioinformatik (ZBH)
Bundesstr. 43
20146 Hamburg

GeoMine: Methoden zur geometrischen Mustersuche in Proteinstruktursammlungen

Das Einzelprojekt GeoMine beschäftigt sich mit Verbesserungen bei der Erforschung von Proteinstrukturen. Die Untersuchung von Proteinstrukturen spielt seit vielen Jahren eine Schlüsselrolle in der molekularbiologischen Forschung. Alle verfügbaren Informationen darüber werden weltweit in einer zentralen Protein-Datenbank gesammelt und gespeichert. Lebenswissenschaftlerinnen und -wissenschaftler der ganzen Welt haben dank eines internetbasierten Dienstes freien Zugriff auf die vorhandenen Daten. Der bestehende Dienst ermöglicht bislang die Anwendung zahlreicher elementarer Untersuchungsmethoden, nicht jedoch komplexere Ansätze wie die Erforschung dreidimensionaler Proteinstrukturen oder die räumliche Arbeitsweise von Proteinen.

Hier setzt GeoMine an: Im Rahmen des Projekts sollen neue Analysemethoden entwickelt werden, um künftig auch räumliche Proteinstrukturen detailliert erforschen zu können, insbesondere die Bindung von Stoffen oder anderen Proteinen an ein Protein. Mit dem neuen Softwarewerkzeug ließen sich beispielsweise geometrische Muster in Proteinen unabhängig von der Proteinsequenz oder der exakten chemischen Struktur des bindenden Moleküls untersuchen. Ausgehend von dem in der Arbeitsgruppe von Prof. Rarey entwickelten Softwarewerkzeug PELIKAN sollen Algorithmen, Datenbanken und eine einfach zu bedienende Nutzeroberfläche entwickelt und zu einem erweiterten internetbasierten Dienst ausgebaut werden. Neben der Möglichkeit, künftig individuell maßgeschneiderte Untersuchungen durchführen und Arbeitshypothesen überprüfen zu können, liegt der Schwerpunkt der Werkzeugentwicklung auf der praktischen Ausgestaltung des neuen Dienstes. Durch neuartige Schnittstellen mit zwei- und dreidimensionalen Elementen soll insbesondere die Anfrageerstellung intuitiv gestaltet werden und ohne große Vorkenntnisse bedienbar sein.

Es ist geplant, das neue Softwarewerkzeug in den ProteinPlus-Dienst des Deutschen Netzwerks für Bioinformatik-Infrastruktur (de.NBI) zu integrieren, es so schnell und effizient bekannt zu machen und seine Reichweite rasch zu erhöhen.

Abgeschlossen

horizontal4meta - Ein neues Paradigma der Sequenzsuche ermöglicht die Hochdurchsatz-Funktionvorhersage mikrobieller Proteine in metagenomischen Sequenzierdaten

Förderkennzeichen: 031L0185
Gesamte Fördersumme: 540.601 EUR
Förderzeitraum: 2019 - 2022
Projektleitung: Dr. Johannes Soeding
Adresse: Max-Planck-Institut für biophysikalische Chemie
Am Faßberg 11
37077 Göttingen

horizontal4meta - Ein neues Paradigma der Sequenzsuche ermöglicht die Hochdurchsatz-Funktionvorhersage mikrobieller Proteine in metagenomischen Sequenzierdaten

Das Einzelprojekt horizontal4meta beschäftigt sich mit der Entwicklung neuer Ansätze für die Analyse sogenannter metagenomischer Sequenzierdaten. Mithilfe dieser Daten lässt sich die Funktion eines Proteins alleine anhand einer abgelesenen Nukleotid-Sequenz sowie eines Vergleiches mit verwandten und funktionell ähnlichen Proteinen bestimmen. Die für diesen sogenannten vertikalen Informationstransfer zur Verfügung stehenden Referenzdatenbanken und Computerprogramme stoßen mittlerweile an ihre Grenzen, da die Menge der metagenomischen Sequenzierdaten durch den Einsatz neuer Sequenziertechnologien in immer größerem Umfang und Tempo steigt. Für sorgfältige Untersuchungen fehlt die Zeit, so dass nur noch schnelle, aber weniger genaue Analyseverfahren Anwendung finden.

Im Rahmen von horizontal4meta soll daher mit einem völlig neuen Ansatz eine innovative bioinformatische Analysesoftware entwickelt werden, mit der künftig die Proteinfunktion schneller und präziser als derzeit vorhergesagt werden kann. Die neue Suchmethode basiert auf der Idee des horizontalen Informationstransfers und baut auf der in der Arbeitsgruppe von Dr. Söding entwickelten schnellen und empfindlichen Sequenzsuch-Software MMseqs2 auf. Es ist geplant, zunächst Gruppen von benachbarten Genen zu identifizieren, die eine gemeinsame Funktion ausüben (horizontaler Ansatz). Die Ergebnisse sollen anschließend durch Sequenzprofil-Suchen mit dem vertikalen Informationstransfer verknüpft werden und so das gesamte Potential der vorhandenen Daten ausschöpfen. Der neue Ansatz wird damit wesentlich dazu beitragen, mikrobiologische Forschung und biotechnologische Entdeckungen in Zukunft zu beschleunigen.

Abgeschlossen

InCelluloProtStruct - Hybridansatz zur Vorhersage der Supertertiär- und Quartärstruktur von Proteinen und Proteinkomplexen in Zellen

Förderkennzeichen: 031L0182
Gesamte Fördersumme: 478.375 EUR
Förderzeitraum: 2019 - 2022
Projektleitung: Prof. Dr. Holger Gohlke
Adresse: Heinrich-Heine-Universität Düsseldorf - Mathematisch-Naturwissenschaftliche Fakultät - Pharmazie - Institut für Pharmazeutische und Medizinische Chemie - Abt. Pharmazeutische Biochemie
Universitätsstr. 1
40225 Düsseldorf

InCelluloProtStruct - Hybridansatz zur Vorhersage der Supertertiär- und Quartärstruktur von Proteinen und Proteinkomplexen in Zellen

Das Einzelprojekt InCelluloProtStruct beschäftigt sich mit der Aufklärung von komplexen Proteinstrukturen. Viele biologische Prozesse werden nicht nur durch einzelne Proteine, sondern durch Proteinkomplexe gesteuert, die aus mehreren Proteinen bestehen und eine sogenannte Quartärstruktur bilden. Erst wenn man weiß, wie die Struktur eines solchen Proteinkomplexes aussieht, kann man seine Funktionen auch verstehen und von ihm gesteuerte Signalwege gezielt beeinflussen. Es gibt bereits Methoden, mit denen die Struktur eines Proteinkomplexes teilweise untersucht werden kann. Diese Methoden stoßen jedoch immer wieder an ihre Grenzen, insbesondere dann, wenn Wechselwirkungen innerhalb des Proteinkomplexes Einfluss auf die Struktur nehmen. Benötigt werden neue innovative Strukturaufklärungsansätze, die die Gesamtheit der molekularen Wechselwirkungen in einem zellulären Kontext berücksichtigen.

Hier setzt InCelluloProtStruct an: Im Rahmen des Projekts soll ein vollautomatischer computergestützter Arbeitsablauf entwickelt und validiert werden, mit dem qualitativ hochwertige Proteinkomplexmodelle vorhergesagt werden können. Grundlage für die geplante Software-Entwicklung sind verschiedene Softwarewerkzeuge, die in den vergangenen Jahren in der Arbeitsgruppe von Prof. Gohlke entwickelt wurden. Es ist geplant, sogenannte Meta-Ansätze zu verwenden, die mehrere Strukturvorhersagemethoden und Quellen verfügbarer biologischer Informationen miteinander verknüpfen. Es ist vorgesehen, mithilfe experimenteller Daten aus Strukturanalysen die Modellbildung zu überprüfen und zu steuern.

Die fertige Softwarelösung soll den Wissenschaftlerinnen und Wissenschaftlern frei zur Verfügung gestellt werden. Für die Kooperation mit der Industrie sind zusätzliche Lizenzmodelle geplant.

ReinfChemo – Regelkreissystem zur Optimierung von Konzentrationstrajektorien chemotherapeutischer Medikamente

Förderkennzeichen: 031L0270
Gesamte Fördersumme: 464.935 EUR
Förderzeitraum: 2021 - 2024
Projektleitung: Dr. Dr. Stefan Kallenberger
Adresse: Universitätsklinikum Heidelberg - Health Data Science Unit
Im Neuenheimer Feld 267
69120 Heidelberg

ReinfChemo – Regelkreissystem zur Optimierung von Konzentrationstrajektorien chemotherapeutischer Medikamente

Das Einzelprojekt ReinfChemo beschäftigt sich mit der Art und Weise der Chemotherapeutika-Gabe bei Krebspatientinnen und -patienten. Nach etablierten Therapieprotokollen zur Einzel- oder Kombinationstherapie werden Krebsmedikamente üblicherweise mit konstanter Infusionsrate verabreicht, ohne weitere individuelle Besonderheiten zu berücksichtigen.

Hier setzt ReinfChemo an: Im Rahmen des Projekts soll ein selbstlernendes Steuerungssystem entwickelt werden, das in der Lage ist, die optimalen Konzentrationszeitverläufe chemotherapeutischer Medikamente zu ermitteln. Ziel ist es, so die Effektivität der Medikamente zu maximieren und Nebenwirkungen zu reduzieren. Zur Entwicklung und Erprobung des geplanten Systems soll ein selbstentwickeltes automatisiertes Mikroskop für die Lebendzellmikroskopie namens „CytoScanner“ eingesetzt werden. Durch die im CytoScanner verwendete Software-Komponente lassen sich Zellzustände mithilfe des sogenannten Convolutional Neural Networks (CNN) erkennen. CNN gehören zur Gruppe der künstlichen neuronalen Netzwerke, die äußere Reize – beispielsweise visuelle Bilder – ähnlich wie das menschliche Nervensystem mithilfe von Computeralgorithmen maschinell filtern und verarbeiten können. Es ist geplant, mathematische Modelle damit so zu kalibrieren, dass die optimale Chemotherapeutika-Gabe während des Experiments vorhergesagt und über gesteuerte Perfusoren verabreicht werden kann. Es ist geplant, das System an drei verschiedenen Krebszellkulturen zu testen und zu optimieren.

Im Erfolgsfall ließen sich die Ergebnisse in die klinische Anwendung übertragen, um eine individuell optimierte Chemotherapie bei Krebspatientinnen und -patienten zu ermöglichen, die mit weniger Nebenwirkungen bei gleichzeitig verbesserter Therapie verbunden wäre.

Abgeschlossen

SABIO-VIS - Visualisierung und Validierung von kinetischen Daten in SABIO-RK für die Nutzung durch Modellierer, Kuratoren und Experimentalisten

Förderkennzeichen: 031L0178
Gesamte Fördersumme: 387.928 EUR
Förderzeitraum: 2019 - 2022
Projektleitung: Dr. Ulrike Wittig
Adresse: HITS gGmbH - Abt. Scientific Databases and Visualization (SDBV)
Schloß-Wolfsbrunnenweg 35
69118 Heidelberg

SABIO-VIS - Visualisierung und Validierung von kinetischen Daten in SABIO-RK für die Nutzung durch Modellierer, Kuratoren und Experimentalisten

Das Einzelprojekt SABIO-VIS beschäftigt sich mit der SABIO-RK-Datenbank, die biochemische Reaktionen und deren kinetische Parameter aus der Literatur speichert. In der Datenbank wurden in den letzten zehn Jahren über 230.000 kinetische Parameter in unterschiedlicher Qualität hinterlegt. Sowohl quantitativ als auch qualitativ hat die SABIO-RK-Datenbank damit nun ein Level erreicht, bei dem es sich lohnt, neue Datenanalyse-Werkzeuge zu entwickeln und zu nutzen. Konkret sollen im Rahmen des Projekts SABIO-VIS verschiedene Visualisierungsmethoden entwickelt werden, mit denen künftig gezielt die kinetischen Daten untersucht, validiert und in ihrer Qualität kontrolliert werden können.

Der Schwerpunkt der Methodenentwicklung liegt dabei auf den Anforderungen von Modelliererinnen und Modellierern, die die Hauptnutzergruppe der SABIO-RK-Datenbank darstellen. Für diese sollen verlässliche Visualisierungsmethoden entwickelt werden, die sie bei der Suche nach nützlichen Daten für eine Modellentwicklung unterstützen, ohne dabei die Korrektheit der einzelnen Daten erneut überprüfen zu müssen. Es ist geplant, eine Visualisierung der kinetischen Parameter zu ermöglichen, die nach bestimmten nutzerabhängigen Suchkriterien erfolgt. Auch mögliche Abweichungen oder Ungenauigkeiten der kinetischen Parameter sollen künftig bildlich hervorgehoben bzw. quantifiziert werden können. Es ist zudem vorgesehen, Methoden zur Analyse und zur Zusammenfassung der Daten aufgrund gemeinsamer Kriterien wie beispielsweise experimentelle Bedingungen zu entwickeln.

Die Ergebnisse des Projektes werden die Nutzbarkeit der SABIO-RK-Datenbank stark verbessern. Mit den neuen Möglichkeiten lassen sich größere Datensätze analysieren und neue Zusammenhänge darstellen, so dass sich zahlreiche neue Einblicke und Erkenntnisse aus den vorhandenen Daten gewinnen lassen werden.

SAGE - Zellsegmentierungsfreie Identifizierung von mRNA-Lokalisationsmustern in Tumoren

Förderkennzeichen: 031L0265
Gesamte Fördersumme: 289.060 EUR
Förderzeitraum: 2021 - 2025
Projektleitung: Dr. Naveed Ishaque
Adresse: Charité - Universitätsmedizin Berlin
Charitéplatz 1
10117 Berlin

SAGE - Zellsegmentierungsfreie Identifizierung von mRNA-Lokalisationsmustern in Tumoren

Das Einzelprojekt SAGE beschäftigt sich mit der Analyse der Gentranskription in Geweben. Die Transkription ist der erste Schritt der Protein-Biosynthese, bei dem die genetischen Informationen von der DNA auf die mRNA umgeschrieben werden. Im Rahmen von SAGE sollen nun Transkriptionsänderungen, die infolge einer Reaktion auf eine Veränderung entstehen, räumlich genau analysiert werden. So soll untersucht werden, welche Zellen eines Gewebeverbundes genau beispielsweise auf Medikamente reagieren oder sich im Krankheitsfall anders verhalten.

Es ist geplant, mithilfe von Methoden des maschinellen Lernens räumliche Zusammenhänge zwischen Zelltypen und der Gewebetopographie aufzudecken. Neben der räumlichen Identität sollen auch die Variabilität untersucht und Kommunikationsmuster identifiziert werden. Die gewonnenen Muster der räumlichen Zellorganisation sollen anschließend unter anderem mit den Ergebnissen aus Einzelzell-Sequenzierungen verglichen werden.

Im Erfolgsfall wird das Projekt ein anwenderfreundliches und aussagekräftiges Analysewerkzeug bereitstellen, welches es auch Wissenschaftlerinnen und Wissenschaftlern ohne große IT-Expertise erlauben wird, die räumlichen Änderungen der Gewebeaktivitäten zu untersuchen. Mögliche Anwendungsfälle dafür sind beispielsweise in der Präzisionsonkologie denkbar, bei der versucht wird, möglichst zielgerichtet Wirkstoffe für eine individuelle Krebstherapie zu identifizieren.

Abgeschlossen

SCTP - Standardisierung der CT Perfusion für die klinische Anwendung in der onkologischen Bildgebung

Förderkennzeichen: 031L0163
Gesamte Fördersumme: 230.228 EUR
Förderzeitraum: 2019 - 2022
Projektleitung: Dr. Stephan Skornitzke
Adresse: Ruprecht-Karls-Universität Heidelberg - Medizinische Fakultät und Universitätsklinikum Heidelberg - Radiologische Klinik - Diagnostische und Interventionelle Radiologie
Im Neuenheimer Feld 110
69120 Heidelberg

SCTP - Standardisierung der CT Perfusion für die klinische Anwendung in der onkologischen Bildgebung

Das Einzelprojekt SCTP beschäftigt sich mit dem Thema Computertomographie (CT), einem bildgebenden Verfahren in der Radiologie. Mit der 1972 eingeführten Untersuchungsmethode kann heute eine Vielzahl von Erkrankungen diagnostiziert werden. Neben der Untersuchung von Knochenbrüchen, Blutungen und Schwellungen wird die Computertomographie auch für Durchblutungsmessungen eingesetzt. Diese sogenannte CT-Perfusion ermöglicht es, nicht-invasiv den Blutfluss zu messen, womit das Verfahren zur verbesserten Diagnose und Therapieverfolgung von Tumorerkrankungen beiträgt. Ein großes Hindernis für den breiten Einsatz in der klinischen Praxis ist bislang die fehlende Standardisierung der für die CT-Perfusion verwendeten Aufnahmeprotokolle, der eingesetzten Software und bei der anschließenden Interpretation der Ergebnisse.

Im Rahmen des Projekts SCTP sollen daher die bestehenden Methoden und Verfahren in der CT-Perfusion vereinheitlicht werden. Es ist geplant, alle verwendeten Modelle zu untersuchen und zu validieren sowie die eingesetzte Verarbeitungs-Software für die Nachbereitung von Untersuchungsergebnissen einer fundierten Qualitätskontrolle zu unterziehen. Zudem ist vorgesehen, die Messunsicherheit in Abhängigkeit der Aufnahmeparameter abzuschätzen, um damit eine bessere Vergleichbarkeit der Ergebnisse herzustellen.

Die Ergebnisse des Projekts werden die Einsatzrate der CT-Perfusionstechnik in der klinischen Praxis deutlich steigern und wesentlich dazu beitragen, dass CT-Perfusion verlässlicher als bisher zur onkologischen Bildgebung im Rahmen einer Krebstherapie herangezogen werden kann.

Slide2Mol – Tiefe neuronale Netze für molekular interpretierbare und markerfreie digitale Pathologie an Gewebedünnschnitten

Förderkennzeichen: 031L0264
Gesamte Fördersumme: 295.286 EUR
Förderzeitraum: 2021 - 2024
Projektleitung: Prof. Dr. Axel Mosig
Adresse: Ruhr-Universität Bochum - Fakultät für Biologie und Biotechnologie – Arbeitsgruppe Bioinformatik
Gesundheitscampus 4
44801 Bochum

Slide2Mol – Tiefe neuronale Netze für molekular interpretierbare und markerfreie digitale Pathologie an Gewebedünnschnitten

Das Einzelprojekt Slide2Mol beschäftigt sich mit dem Thema der markerfreien digitalen Pathologie. In der Vergangenheit konnte gezeigt werden, dass Tumore in Infrarot-mikroskopischen Gewebebildern anhand von maschinellem Lernen identifiziert werden können. Aktuelle Ansätze zur Lokalisierung von Krankheitsmustern in der digitalen Pathologie können bislang jedoch nur die zu untersuchende Geweberegion orten.

Hier setzt Slide2Mol an: Durch die im vorliegenden Projekt geplanten Ansätze soll die Lokalisierung von Gewebeveränderungen bis zur Ebene von Zellen und Pixeln weitergetrieben werden. Ziel des Projektes ist es, die Analyse- und Anwendungsmöglichkeiten digitaler Pathologie an Gewebeschnitten so zu verbessern, dass diese Technik künftig bei der Bestimmung von krebsbedingten Gewebeveränderungen mit höchster Auflösung, verlässlich und automatisiert eingesetzt werden kann. Es ist außerdem geplant, am Beispiel sogenannter kolorektaler Karzinome molekulare Biomarker auf Gewebeschnitten per Infrarot-Mikroskopie zu bestimmen. Der große Vorteil der Infrarot-Analyse von Gewebeschnitten besteht darin, dass damit markerfrei gearbeitet werden kann. Das Gewebe bleibt ungefärbt und somit weitestgehend unverändert und steht so für weitere molekulare Analysen zur Verfügung.

Im Erfolgsfall ließe sich die etablierte Methodik nach Überführung in die klinische Routine nutzen, um Tumore einer einzelnen Patientin bzw. eines einzelnen Patienten besser zu beschreiben und aus den jeweiligen Ergebnissen weitere notwendige Analysen und Therapieoptionen individuell passend abzuleiten.

Abgeschlossen

SPlaT-DM - Computersimulationsplattform für Topologie-gesteuerte Morphogenese

Förderkennzeichen: 031L0160
Gesamte Fördersumme: 741.675 EUR
Förderzeitraum: 2019 - 2022
Projektleitung: Dr. Carl Modes
Adresse: Max-Planck-Institut für Molekulare Zellbiologie und Genetik
Pfotenhauerstr. 108
01307 Dresden

SPlaT-DM - Computersimulationsplattform für Topologie-gesteuerte Morphogenese

Das Einzelprojekt SPlaT-DM beschäftigt sich mit der Entwicklung von Computermodellen, die die Entstehung von Organen und Geweben – die sogenannte Morphogenese – simulieren. Derzeitige Modelle arbeiten mit statischen Organstrukturen, die auf gemittelte Werte zurückgreifen. Es existieren bislang keine belastbaren Computermodelle, mit denen beispielsweise die embryonale Entwicklung, das Wachstum von Organoiden oder die Heilung und Regeneration von Organen vorhergesagt werden kann. Ziel des Projektes ist es daher, mehrskalige, physikgetriebene Rechenmodelle zu entwickeln, um die Morphogenese virtuell am Computer darstellen zu können.

Es ist geplant, hierfür einen neuartigen Lösungsansatz zu entwickeln und ihn in eine bereits bestehende Simulationsplattform zu implementieren. Der innovative Ansatz greift dabei auf Fortschritte beim Verständnis der physikalischen Theorie aktiver Gewebemechanik zurück und soll eine Analogie zur Physik dreidimensionaler Flüssigkristalle nutzen. Dort können punktförmige topologische Defekte, die miteinander interagieren, nahezu beliebige Formänderungen herbeiführen. Die aktuellen Erkenntnisse aus diesem Bereich der Physik sollen im Rahmen des Projekts in die Simulationsplattform OpenFPM für biologische Gewebe integriert werden. Die biophysikalische Simulationsumgebung der Morphogenese soll dabei aus einer minimalen Anzahl von biologischen Eingabeparametern berechnet werden. Gleichzeitig wird angestrebt, sie modular zu gestalten, wodurch Nutzerinnen und Nutzer die Struktur und Funktionalität einer Simulation mit einfachen Mitteln an ihre jeweiligen Bedürfnisse anpassen können.

Abgeschlossen

STML - Werkzeuge für Zellbiologische Raum-Zeit-Modelle in den Lebenswissenschaften

Förderkennzeichen: 031L0158
Gesamte Fördersumme: 541.200 EUR
Förderzeitraum: 2019 - 2022
Projektleitung: Dr. Sven Sahle
Adresse: Ruprecht-Karls-Universität Heidelberg - Fakultät für Biowissenschaften - Centre for Organismal Studies (COS) - Modellierung Biologischer Prozesse
Im Neuenheimer Feld 267
69120 Heidelberg

STML - Werkzeuge für Zellbiologische Raum-Zeit-Modelle in den Lebenswissenschaften

Das Einzelprojekt STML beschäftigt sich mit der Entwicklung von zellbiologischen Raum-Zeit-Modellen. Die Modellierung am Rechner ist heute ein wichtiger und etablierter Bestandteil in der biologischen Forschung. Mit experimentellen Daten werden mathematische Modelle erstellt, mit deren Hilfe Hypothesen biologischer Fragestellungen simuliert und analysiert werden. Bisher war die Mehrheit der erstellten Modelle räumlich homogen, d.h. typische experimentelle Beobachtungen bezogen sich lediglich auf die Konzentration oder die Menge verschiedener biochemischer Komponenten. Die zugehörigen mathematischen Modelle beruhten auf gewöhnlichen Differentialgleichungen. In den letzten Jahren wurden zunehmend Techniken entwickelt, mit denen auch quantitative Untersuchungen an lebenden Zellen unter dem Mikroskop möglich sind. Die dabei erzeugten großen Raum-Zeit-Datenmengen stehen nun für detaillierte Raum-Zeit-Modelle zu Verfügung.

Im Rahmen des Projekts STML sollen jetzt Softwarewerkzeuge entwickelt werden, die diese Mikroskop-Daten nutzen, um solche neuen Modelle zu erstellen, zu simulieren und zu testen. Es ist geplant, dafür auf zwei Softwarewerkzeugen – COPASI und DUNE – aufzubauen, die im Bereich der mathematischen Modellierung biologischer Netzwerke bereits etabliert sind. Beide sollen weiterentwickelt und in einer Anwendung integriert werden. Ein besonderer Schwerpunkt wird dabei auf die Benutzerfreundlichkeit der Methoden und der Analysewerkzeuge gelegt. Anwenderinnen und Anwender sollten beim Arbeiten mit einem Raum-Zeit-Modell zwar über biologisches Spezialwissen, nicht aber notwendigerweise über spezielle Programmierungskenntnisse verfügen müssen. Im Gegensatz zur Arbeit mit homogenen Raum-Modellen fehlen bislang solche einfach zu bedienenden Werkzeuge bei der Raum-Zeit-Modellierung weitgehend.

Die geplante Anwendung wird der Öffentlichkeit frei zur Verfügung gestellt, so dass eine große Verbreitung der neuen Modelle sowohl in der Forschung als auch in der industriellen Entwicklung möglich sein wird.

SURPREME – Superfeine Struktur- und Fragment-basierte Inhibitor-Gestaltung

Förderkennzeichen: 031L0268
Gesamte Fördersumme: 630.892 EUR
Förderzeitraum: 2021 - 2024
Projektleitung: Dr. Grzegorz Popowicz
Adresse: Helmholtz Zentrum München Deutsches Forschungszentrum für Gesundheit und Umwelt (GmbH) - Institut für Strukturbiologie
Ingolstädter Landstr. 1
85764 Neuherberg

SURPREME – Superfeine Struktur- und Fragment-basierte Inhibitor-Gestaltung

Das Einzelprojekt SURPREME beschäftigt sich mit der Entwicklung von Krebstherapeutika. Durch die Einführung von Immuntherapien hat sich zwar die Wirksamkeit von Krebsbehandlungen erheblich verbessert, häufig gibt es aber immer noch keine zufriedenstellenden klinischen Erfolge. Niedermolekulare Wirkstoffe zur Hemmung von Protein-Protein-Interaktionen zeigen hier vielversprechende Ansätze, bei der Entwicklung hin zum finalen einsetzbaren Medikament gibt es jedoch noch große Herausforderungen. Insbesondere die Optimierung der Wirkstoffeigenschaften gestaltet sich sehr komplex und ist von vielen Variablen abhängig.

Hier setzt SURPREME an: Im Rahmen des Projekts soll ein maschinelles Lern-System aufgebaut werden, das die strukturbasierte Entwicklung neuartiger Hemmer von Protein-Protein-Interaktionen unterstützt. Es ist vorgesehen, den Anwendungsschwerpunkt auf die Interaktion von Krebs-Genen zu legen. Das Prinzip des neuen Systems soll darin bestehen, experimentelle Daten (beispielsweise aus Screening Assays), sogenannte Molekular-Dynamiken sowie strukturelle Daten aus Interaktions-Datenbanken zu nutzen, um das entsprechende Potential für die Generierung neuer chemischer Substanzen zu maximieren. Ziel ist es insbesondere, dass diese später eine hohe Aktivität im Körper aufweisen. Es ist geplant, eine Software zu erstellen, die es erlaubt, am Computer chemische Fragmente auf den Strukturen der Zielproteine zu platzieren. Gleichzeitig soll die Software in der Lage sein, eine Optimierung der chemischen Substanzen hinsichtlich guter wirkstoffähnlicher Eigenschaften vorzunehmen.

Abgeschlossen

TissueResolver - Eine Toolbox mit Webapplikation zur Berechnung zelltypspezifischer Genexpression

Förderkennzeichen: 031L0173
Gesamte Fördersumme: 531.275 EUR
Förderzeitraum: 2019 - 2022
Projektleitung: Prof. Dr. Rainer Spang
Adresse: Universität Regensburg - Institut für Funktionelle Genomik - Lehrstuhl für statistische Bioinformatik
Am BioPark 9
93053 Regensburg

TissueResolver - Eine Toolbox mit Webapplikation zur Berechnung zelltypspezifischer Genexpression

Das Einzelprojekt TissueResolver beschäftigt sich mit dem Thema Krebsforschung, genauer gesagt mit der Verknüpfung und Auswertung von Tumorgewebedaten. In den letzten 20 Jahren wurde Tumorgewebe detailliert und im großen Stil molekularbiologisch untersucht. Unter Berücksichtigung des klinischen Krankheitsverlaufs wurden für zahlreiche Tumorgewebeproben sogenannte Genexpressionsprofile ermittelt und bioinformatisch ausgewertet. Verbesserungen in der Analysetechnik ermöglichen es seit einigen Jahren, Genexpressions-Veränderungen auch in den einzelnen Tumor-Zelltypen aufzuklären und entsprechende Einzelzell-Profile zu erstellen. Da die jeweiligen Profile über unterschiedliche Zusatzinformationen verfügen, sollen sie nun noch stärker miteinander verknüpft werden, um dadurch ihr gesamtes Potential zu erschließen. Insbesondere im Bereich der personalisierten Medizin sollen so wertvolle neue Einsichten in die Funktion von Tumorgewebe gewonnen werden.

Hier setzt TissueResolver an: Im Rahmen des Projekts sollen neue Methoden und Software-werkzeuge entwickelt werden, mit deren Hilfe sich die verschiedenen existierenden Genexpressionsprofile zusammenführen und gemeinsam analysieren lassen. Es ist geplant, die zelltyp-spezifischen Profile mit den Genexpressionsprofilen der Tumorgewebe zu kombinieren und Informationen, die nur im Tumorgewebeprofil zu finden sind, auf die zelltyp-spezifischen Profile zu übertragen. Es ist unter anderem vorgesehen, mittels künstlicher Intelligenz aus Einzelzellprofilen zu lernen, wie sich aus älteren Tumorgewebeprofilen höher auflösende Informationen gewinnen lassen, die etwa zur weiteren Aufklärung der zelltyp-spezifischen Genexpression beitragen können.

Die geplanten Arbeiten werden durch den bioinformatischen Ansatz wesentlich schneller neue Daten und Erkenntnisse liefern als das mit klassischen Laborexperimenten möglich wäre und so die Aufklärung der einzelnen Genexpressionsprofile deutlich beschleunigen.

Abgeschlossen

UGEWS-HYBRID - Entwicklung eines Web Services zur Analyse von genomweiten Interaktionen durch einen FPGA-GPU-Hybridcomputer

Förderkennzeichen: 031L0165
Gesamte Fördersumme: 339.110 EUR
Förderzeitraum: 2019 - 2022
Projektleitung: Jun.-Prof. David Ellinghaus und Dr.-Ing. Jan Kässens
Adresse: Christian-Albrechts-Universität zu Kiel - Universitätsklinikum Schleswig-Holstein - Campus Kiel - Institut für Klinische Molekularbiologie
Arnold-Heller-Str. 3
24105 Kiel

UGEWS-HYBRID - Entwicklung eines Web Services zur Analyse von genomweiten Interaktionen durch einen FPGA-GPU-Hybridcomputer

Das Einzelprojekt UGEWS-HYBRID beschäftigt sich mit dem Thema Erbkrankheiten, die durch einen sogenannten Einzelnukleotid-Polymorphismus (SNP, gesprochen: „Snip“) ausgelöst werden. Ein SNP ist eine geerbte genetische Variation auf einem Chromosom, die aus einem einzelnen Basenpaar besteht und die vererbt werden kann. In den letzten zehn Jahren wurde in genomweiten Assoziationsstudien eine Vielzahl sogenannter Risiko-SNPs für komplexe, d.h. von mehreren Faktoren abhängige Erkrankungen identifiziert. Für die meisten komplexen Erkrankungen konnte die Wahrscheinlichkeit einer SNP-Vererbung bislang nicht aufgeklärt werden. Es wird vermutet, dass die Vererbbarkeit von der Interaktion der genetischen Varianten abhängt. Genomweite Vergleichsstudien dazu wurden begonnen, befinden sich aufgrund des enormen Rechenaufwandes für die Berechnung von Milliarden möglicher Kombinationen aber immer noch in ihrer Anfangsphase.

Hier setzt UGEWS-HYBRID an: Ziel des Projekts ist es, der internationalen Wissenschaftsgemeinde einen ultraschnellen internetbasierten Dienst zur Verfügung zu stellen, mit dem innerhalb kurzer Zeit Vergleichsstudien für genomweite Daten durchgeführt werden können. Es ist geplant, für den neuen Dienst bioinformatische Werkzeuge zu entwickeln, mit denen genetische Varianten, die für komplexe Erkrankungen verantwortlich sind, identifiziert werden können. Der Rechenaufwand soll dort, wo es möglich ist, reduziert werden, indem häufig genutzte Algorithmen auf schnellen und besonders energieeffizienten Hochleistungsrechnern implementiert werden. Zudem ist vorgesehen, Schnittstellen zu bereits bestehenden Infrastrukturen wie der Cloud des Deutschen Netzwerks für Bioinformatik-Infrastruktur (de.NBI) zu entwickeln und so die Anzahl der Nutzerinnen und Nutzer zu maximieren.

Mit dem neuen Computermodell wird eine Grundlage für zukünftige Forschungsplattformen auf nationaler und internationaler Ebene geschaffen, mit denen sich verschiedenste Krankheitsursachen künftig erfolgreich erforschen lassen werden.