Das Verbundprojekt VALE beschäftigt sich mit Verbesserungen bei der Leukämie-Diagnostik. In Deutschland erkranken jährlich rund 14.000 Menschen an Leukämie. Da mehrere Leukämieformen existieren, ist es für die richtige Therapieentscheidung sehr wichtig, die korrekte Leukämieform zu diagnostizieren. Hierbei spielt insbesondere die molekulare Charakterisierung eine entscheidende Rolle, bei der spezielle genetische Veränderungen – sogenannte Driver-Mutationen – bestimmt werden. Um solche genetischen Varianten aus den häufig limitierten Datensätzen zuverlässig identifizieren zu können, werden dringend verbesserte Software-Werkzeuge benötigt, die auch Methoden des maschinellen Lernens verwenden. Trotz zuletzt bemerkenswerter Fortschritte im Bereich der Molekulargenetik stößt die derzeitige Diagnostik oft an ihre Grenzen, etwa weil „gesunde“ Kontrollproben fehlen. Auch die Unterscheidung relevanter Mutationen von Artefakten oder eine Vorhersage über die Auswirkungen identifizierter Mutationsvarianten gestaltet sich häufig als schwierig.
Hier setzt VALE an: Im Rahmen des Projekts sollen Deep-Learning-Methoden für die Analyse von Genomdaten entwickelt werden. Es ist geplant, diese Methoden auf einer Datenbasis von 5.000 vollständigen Patientengenomen in der Programmiersprache Python zu implementieren. Die entwickelten Modelle sollen dahingehend trainiert werden, dass neben der Bestimmung der Leukämievariante auch eine Prognose über das Therapieverhalten abgeleitet werden kann. Hierzu sollen weitere Datentypen aus der verfügbaren Patientenkohorte integriert werden. Die neu entwickelten Deep-Learning-Methoden werden die Genauigkeit der Leukämie-Diagnose erheblich verbessern und die behandelnden Ärztinnen und Ärzte zukünftig bei der Auswahl personalisierter Behandlungsempfehlungen unterstützen.