Das Verbundprojekt LIFEDATA beschäftigt sich mit der konkreten Verbesserung von KI-Modellen in der Diagnostik. Durch die wachsende Digitalisierung in der Medizin entstehen immer mehr Daten, die zunehmend auch für die Diagnose von Krankheiten mittels KI eingesetzt werden. Für eine zuverlässige Vorhersage etwa mittels Deep Learning ist jedoch eine ausreichend große Basis an sogenannten annotierten – also mit zusätzlichen Informationen versehenen – Daten notwendig, die etwa auch seltene Diagnosen in ausreichender Anzahl enthält. Die Annotation aller verfügbaren Rohdaten ist jedoch sehr zeit- und kostenintensiv, da sie überwiegend manuell erfolgt.
Hier setzt LIFEDATA an: Im Rahmen des Projekts soll ein Open-Source-Framework entwickelt werden, dessen Konzept Aktives Lernen mit sogenannten tiefgehenden neuronalen Netzwerken (Deep Neural Networks) kombiniert. Damit sollen selbstständig Datenpunkte mit dem größten Informationsgewinn wie beispielsweise seltene Diagnosen ausgewählt werden können. Reale Expertinnen und Experten annotieren dann diese Datenpunkte und ermöglichen so ein effizientes Trainieren des maschinellen Lernens. Es ist geplant, dieses Konzept anhand zweier lebenswissenschaftlicher Anwendungsfälle zu überprüfen und den Mehrwert der Methodik für verschiedene Problemstellungen und Datentypen zu untersuchen. Im Erfolgsfall kann die neue Methodik nicht nur bestehende Diagnosemethoden unterstützen, sondern auch zur Entwicklung neuer Diagnosemethoden verwendet werden.