In der modernen Krebsforschung fallen immer umfangreichere Datensätze an (Big Data). Die Daten stammen aus molekularen und biochemischen Analysen, modernen Bildgebungsverfahren, klinischen Studien oder bilden Krankheitsverläufe von Patientinnen und Patienten ab. Diese Datenschätze gilt es in Zukunft zu heben. Neue computergestützte Ansätze der Datennutzung, modernste Methoden der Künstlichen Intelligenz, des Maschinellen Lernens und der Statistik haben einen hohen Stellenwert für die verbesserte Analyse und Extraktion forschungsrelevanter Informationen. Mit dieser Förderrichtlinie im Rahmen der Nationalen Dekade gegen Krebs beabsichtigt das BMBF Forschungsgruppen aus dem Bereich der Datenanalyse einen niederschwelligen Zugang zu hochqualitativen Daten aus der translationalen, biomedizinischen Krebsforschung und der onkologischen Routineversorgung zu ermöglichen. Zeitgleich arbeiten Forschende aus den Bereichen der Datengewinnung und Datenanalyse eng zusammen, um miteinander klinisch relevante onkologische Fragen anzugehen. Darüber hinaus soll die Kultur des Datenteilens für Forschungszwecke gefördert werden.
Das Projekt SWAG entwickelt KI-Methoden zum Nierenzellkarzinom, die aus echten Patientendaten synthetische Daten generieren. Es werden generative KI-Algorithmen über mehrere Krankenhäuser hinweg mittels Schwarmlernen gemeinsam trainiert, ohne die eigentlichen Daten auszutauschen. Diese so entstandenen pseudonymisierten synthetischen Daten werden nach definierten Kriterien qualitätsgeprüft, damit die klinisch relevanten Informationen enthalten sind, aber kein Bezug mehr zu sensiblen Patientendaten besteht. Ziel ist ein multizentrisches, generatives Modell, das realistische synthetische Daten erzeugt. In einem Datenanalyse-Wettbewerb werden diese Daten genutzt, um vorhersagbare KI-Modelle zu verbessern. Digitale Lehrmaterialien werden für Betroffene sowie Fachkräfte erstellt, welche die Theorie hinter und den Nutzen von synthetischen Daten in der Medizin erklären.