In der modernen Krebsforschung fallen immer umfangreichere Datensätze an (Big Data). Die Daten stammen unter anderem aus molekularen und biochemischen Analysen, Bildgebungsverfahren, klinischen Studien. Teilweise bilden diese Daten auch Krankheitsverläufe von Patientinnen und Patienten ab. Neue computergestützte Ansätze der Datennutzung, modernste Methoden der Künstlichen Intelligenz bzw. des Maschinellen Lernens bergen ein großes Potenzial bei der Analyse und Extraktion solcher forschungsrelevanten Informationen.
Mit dieser Förderrichtlinie im Rahmen der Nationalen Dekade gegen Krebs beabsichtigt das BMBF, Forschungsgruppen aus dem Bereich der Datenanalyse einen niederschwelligen Zugang zu hochqualitativen Daten aus der translationalen biomedizinischen Krebsforschung und der onkologischen Routineversorgung zu ermöglichen. Zeitgleich arbeiten Forschende aus den Bereichen der Datengewinnung und Datenanalyse eng zusammen, um klinisch relevante onkologische Fragen anzugehen. Darüber hinaus soll die Kultur des Datenteilens für Forschungszwecke gefördert werden.
Im Forschungsverbund FAIrPaCT2 soll die Identifikation entscheidender genetischer sowie auch molekularer und histopathologischer Parameter, welche die Vorhersage von Behandlungsergebnissen erleichtern, ermöglicht werden. Dafür werden robuste computerbasierte Hochleistungssoftwaremodelle mit Multi-Omics-Daten und Histopathologie-Bilder in einem multimodalen Lernansatz trainiert. Alle im Projekt entwickelten Softwarepakete werden als Open Source veröffentlicht und die Nutzung der Modelle über eine interaktive Forschungsplattform etabliert.