In der modernen Krebsforschung fallen immer umfangreichere Datensätze an (Big Data). Die Daten stammen aus molekularen und biochemischen Analysen, modernen Bildgebungsverfahren, klinischen Studien oder bilden Krankheitsverläufe von Patientinnen und Patienten ab. Diese Datenschätze gilt es in Zukunft zu heben. Neue computergestützte Ansätze der Datennutzung, modernste Methoden der Künstlichen Intelligenz (KI), des Maschinellen Lernens und der Statistik haben einen hohen Stellenwert für die verbesserte Analyse und Extraktion forschungsrelevanter Informationen. Mit dieser Förderrichtlinie im Rahmen der Nationalen Dekade gegen Krebs beabsichtigt das BMBF Forschungsgruppen aus dem Bereich der Datenanalyse einen niederschwelligen Zugang zu hochqualitativen Daten aus der translationalen, biomedizinischen Krebsforschung und der onkologischen Routineversorgung zu ermöglichen. Zeitgleich arbeiten Forschende aus den Bereichen der Datengewinnung und Datenanalyse eng zusammen, um miteinander klinisch relevante onkologische Fragen anzugehen. Darüber hinaus soll die Kultur des Datenteilens für Forschungszwecke gefördert werden.
Etwa 30 % aller Lymphome sind diffus-großzellige B-Zell Lymphome (DLBCL), eine klinisch, pathologisch und molekular sehr unterschiedliche Gruppe von Erkrankungen. Da eine standardisierte Chemotherapie oft versagt, werden die Erkrankten häufig mit intensiveren Chemotherapien behandelt. Um diese individueller anpassen zu können, ist eine genauere Lymphom-Typisierung und eine Verlaufsvorhersage notwendig. Mit dem FDLP-Vorhaben wird die Entwicklung von Methoden des föderierten maschinellen Lernens gefördert, um Modelle zu entwickeln, die die Vorhersage von prognostischen Subtypen ermöglichen. Probleme des Datenmanagements, der -sicherheit und der -teilung werden adressiert. Die Plattform soll genutzt werden, um hochdimensionale molekulare Daten mit hochauflösenden histologischen Bilddaten zu integrieren. Zusätzliche Pathologiestandorte sollen eingebunden werden.