In der modernen Krebsforschung fallen immer umfangreichere Datensätze an (Big Data). Die Daten stammen unter anderem aus molekularen und biochemischen Analysen, Bildgebungsverfahren, klinischen Studien. Teilweise bilden diese Daten auch Krankheitsverläufe von Patientinnen und Patienten ab. Neue computergestützte Ansätze der Datennutzung, modernste Methoden der Künstlichen Intelligenz bzw. des Maschinellen Lernens bergen ein großes Potenzial bei der Analyse und Extraktion solcher forschungsrelevanten Informationen. Mit dieser Förderrichtlinie im Rahmen der Nationalen Dekade gegen Krebs beabsichtigt das BMBF, Forschungsgruppen aus dem Bereich der Datenanalyse einen niederschwelligen Zugang zu hochqualitativen Daten aus der translationalen, biomedizinischen Krebsforschung und der onkologischen Routineversorgung zu ermöglichen. Zeitgleich arbeiten Forschende aus den Bereichen der Datengewinnung und Datenanalyse eng zusammen, um klinisch relevante onkologische Fragen anzugehen. Darüber hinaus soll die Kultur des Datenteilens für Forschungszwecke gefördert werden.
In dem Projekt MAST wird erstmalig ein vollständig volumetrisch annotierter Datensatz aus computertomografischen Bildern von Metastasen erstellt. Konkret werden Aufnahmen von ca. 10.000 Metastasen von 413 Patientinnen und Patienten mit zusätzlichen Informationen etikettiert, um sie für Maschinen lesbar und für weitere Analysen verfügbar zu machen. Ziel ist es, dass dieser Datensatz zum Training für Algorithmen der Künstlichen Intelligenz genutzt werden kann. Der qualitätsgesicherte Testdatensatz wird nach Projektende öffentlich zugänglich gemacht, um auch anderen Wissenschaftlerinnen und Wissenschaftlern zu ermöglichen, ihre informationstechnologischen Werkzeuge trainieren und verbessern zu können.