Verbund

ICGC-Data Mining

Das Gesamtziel des Vorhabens ICGC-Data-Mining ist die tiefergreifende Auswertung (Mining) der in den drei deutschen ICGC-Verbünden in der bisherigen Förderung erhobenen Hochdurchsatzdaten. Dafür soll insbesondere der Teil der Erbinformation (Genom) untersucht werden, der nicht in Proteine übersetzt wird. Dieser nicht-kodierende Teil macht ca. 98% des gesamten Genoms aus. Die Datensätze sind im ICGC bereits erstellt worden, um die Profile tumorspezifischer Genveränderungen zu erfassen und der wissenschaftlichen Öffentlichkeit zugänglich zu machen. Im ICGC-Data-Mining sollen diese Daten, die nur rudimentär verstanden werden, erstmals umfassend bioinformatisch ausgewertet werden. Die Analyse der zusätzlichen genomischen Informationen verspricht tiefgreifende neue Erkenntnisse über grundlegende biologische und krankheitsrelevante Prozesse. Die vorhandenen Daten wurden vornehmlich durch deutsche ICGC-Verbünde generiert. Die Daten zeichnen sich durch eine nie dagewesene Komplexität aus, können aber von Forschergruppen weltweit abgerufen und genutzt werden. In dem Verbundprojekt werden die Daten von drei verschiedenen Tumortypen ausgewertet, die auch bereits im ICGC Gegenstand der Förderung waren. Inhaltlich werden entsprechend drei Teilprojekte bearbeitet. Es sind dies: Teilprojekt 1 – Mining Lymphome, Teilprojekt 2 – Mining Prostatakarzinome und Teilprojekt 3 – Mining kindliche Hirntumore.
Die Analysen werden sowohl Krebsarten-spezifisch als auch Krebsarten-übergreifend durch Integration der Hochdurchsatzdaten durchgeführt. Das Arbeitsprogramm liefert zugleich mehrere Schnittstellen zu parallel laufenden internationalen ICGC-Aktivitäten. So soll vor allem das internationale Großprojekt „PanCancer-Analyse“ unterstützt werden, das im ICGC gestartet wurde.

Teilprojekte

Abgeschlossen

Standort Heidelberg DKFZ

Förderkennzeichen: 01KU1505A
Gesamte Fördersumme: 924.154 EUR
Förderzeitraum: 2015 - 2017
Projektleitung: Prof. Dr. Peter Lichter
Adresse: Deutsches Krebsforschungszentrum (DKFZ), Abt. Molekulare Genetik
Im Neuenheimer Feld 280
69120 Heidelberg

Standort Heidelberg DKFZ

In diesem Vorhaben (Teilprojekt (TP)2 und TP3) werden, neben koordinativen Aufgaben, weiterführende bioinformatische Analysen an den vorhandenen Datensätzen auf den Ebenen, Genom, Transkriptom, Methylom und Chromatin, durchgeführt. Dabei werden die Analysen sowohl Entitäten-spezifisch als auch Entitäten-übergreifend durch Integration der Hochdurchsatzdaten durchgeführt. In TP2, Arbeitspaket (AP)3 findet die Analyse des Epigenoms an den Prostatakarzinomdatensätzen statt. Die integrierte Datenanalyse von genomischen Aberrationen, Methylom- und Transkriptom-Daten erfolgt in AP4. In TP3, AP1 findet die Teilprojekt-Koordination statt. In TP3, AP2 werden Analysen durchgeführt, um neue Enhancer und deren Zielgene, die selektiv in verschiedenen pädiatrischen Hirntumoren aktiv sind, zu finden. Transkriptomanalysen und speziell lange nicht-kodierenede RNA, alternative Promotoren, alternativ gesplicte Transkripte werden in TP3, AP3 sowie Analysen der Chromatinlandschaft in pädiatrischen Hirntumoren werden in AP4 analysiert. In TP3, AP5 findet die Integration der Daten (Hirntumoren) in enger Zusammenarbeit mit der übergreifenden Integration der Hochdurchsatzdaten statt.

Abgeschlossen

Standort Hamburg

Förderkennzeichen: 01KU1505B
Gesamte Fördersumme: 166.532 EUR
Förderzeitraum: 2015 - 2017
Projektleitung: Prof. Dr. Guido Sauter
Adresse: Universitätsklinikum Hamburg-Eppendorf, Institut für Pathologie
Martinistr. 52
20251 Hamburg

Standort Hamburg

Das langfristige Ziel im Teilprojekt 2 - Mining Prostatakarzinom - ist es, mit der detaillierten bioinformatischen Auswertung der erhobenen Genom- und Epigenomdatensätze neuartige, klinisch anwendbare molekulare Test-Verfahren zu entwickeln, um zuverlässig zwischen aggressiven und milden Prostatakarzinom-Verläufen unterscheiden zu können. In Hamburg werden im TP 2 die Arbeitspakete AP1 und AP5 bearbeitet. Im AP1 erfolgt die Projektkoordination. Im AP5 werden distinkte molekulare Muster innerhalb des Datensatzes identifiziert und mit den molekularen Markern der TMA-Datenbank (komplettes molekulares Spektrum) verglichen. Ziel ist es, durch Auswertung der ICGC-Daten Tumoren mit identischen oder maximal ähnlichen Markerprofilen in den TMA-Datensätzen zu identifizieren. Es wird erwartet, durch diese Analysen die Vorteile der Sequenzierungs-Datensätze mit denen der TMA-Datensätze verknüpfen zu können, um die biologische und klinische Relevanz der bisher aufgedeckten molekularen Veränderungen bestimmen zu können.

Abgeschlossen

Standort Leipzig

Förderkennzeichen: 01KU1505C
Gesamte Fördersumme: 138.685 EUR
Förderzeitraum: 2016 - 2018
Projektleitung: Dr. Dr. Steve Hoffmann
Adresse: Universität Leipzig, Interdisziplinäres Zentrum für Bioinformatik (IZBI)
Härtelstr. 16-18
04107 Leipzig

Standort Leipzig

Im Teilprojekt 1 (TP1) werden pathogenetische Mechanismen bei Lympphomerkrankungen identifiziert und charakterisiert. Auch sollen neue Marker für klinisch relevante Subgruppen dieser Lymphome identifiziert werden, und schließlich sollen neue Ansatzpunkte für die Therapie gefunden werden. Im Vorhaben der Uni Leipzig (Arbeitspakete AP5b und AP6b) werden speziell die Transkriptom- und Epigenomdaten weiter bioinformatisch analysiert. Der Standort Leipzig übernimmt die bioinformatischen Auswertungen für Transkriptom und Epigenom in TP1 in Zusammenarbeit mit Ulm. Dazu gehört die Evaluation differentiellen Splicings zwischen Lymphomen und Kontrollen. Es werden Methoden entwickelt, um epigenetische Daten (DNA-Methylierung/Histonmodifikationen) zu integrieren und Auswirkungen auf die Expression adjazenter/distanter Gene und Netzwerke zu untersuchen. Ferner werden die Daten bioinformatisch nach differentiell exprimierten nicht-kodierenden RNAs und deren Auswirkungen auf das Epigenom untersucht.

Abgeschlossen

Standort Göttingen

Förderkennzeichen: 01KU1505D
Gesamte Fördersumme: 52.808 EUR
Förderzeitraum: 2016 - 2018
Projektleitung: Prof. Dr. Lorenz Trümper
Adresse: Georg-August-Universität Göttingen, Universitätsklinikum und Medizinische Fakultät, Zentrum Innere Medizin, Hämatologie und Onkologie
Robert-Koch-Str. 40
37075 Göttingen

Standort Göttingen

Das vorliegende Vorhaben (TP1, Arbeitspaket AP3) beschäftigt sich mit der Bereitstellung der Lymphomproben (inklusive qualitätsgesicherte Analyte) und mit der gezielten, Reevaluation von histopathologischen Fragen. Die wissenschaftliche Fragestellung ist, in wieweit morphologische Varianten mit Sequenzdaten korrelieren. Für eine translationale Auswertung der Sequenzdaten ist es notwendig, die verfügbaren klinischen Daten regelmäßig zu aktualisieren und gezielt zu ergänzen.

Abgeschlossen

Standort Uni Heidelberg

Förderkennzeichen: 01KU1505E
Gesamte Fördersumme: 317.184 EUR
Förderzeitraum: 2015 - 2017
Projektleitung: Prof. Roland Eils
Adresse: Ruprecht-Karls-Universität Heidelberg, Fakultät für Biowissenschaften, Institut für Pharmazie und Molekulare Biotechnologie, Bioinformatik und Funktionelle Genomik
Im Neuenheimer Feld 267
69120 Heidelberg

Standort Uni Heidelberg

In diesem Vorhaben wird die bioinformatische Auswertung bzw. die Integration der Omics Daten über alle Teilprojekte hinweg ausgeführt (TP1-AP7, TP2-AP6 und TP3-AP7, sowie TP1-AP4 und TP3- AP6). Das Datenmanagement verwaltet die grundlegenden Daten aller Teilprojekte. Dieses Vorhaben beschäftigt sich mit der Analyse der Sequencing-Daten und anderen genomweiten Datensätzen aller drei Teilprojekte und der Integration dieser Daten. Ziel der Arbeiten ist die Extraktion von biologisch und klinisch relevanten Informationen aus den derzeit generierten Katalogen von insbesondere genomischen Varianten und differentiellen Expressionen.  Alle Daten der drei deutschen ICGC Konsortien wurden lokal im Datenzentrum in Heidelberg gesammelt und kontinuierlich um weitere anfallende Sequenzier- und Analysedaten erweitert. Dies betrifft die Speicherung von weiteren Gesamtgenom-, Paired-end-, Methylierungs- und RNA-Sequenzdaten der verschiedenen beteiligten Sequenzierzentren. Ziel des Datenmanagement ist es, bereits gespeicherte Daten zu verwalten und den beteiligten Forschern und Institutionen zur Verfügung zu stellen.

Abgeschlossen

Standort Heidelberg EMBL

Förderkennzeichen: 01KU1505F
Gesamte Fördersumme: 111.370 EUR
Förderzeitraum: 2015 - 2017
Projektleitung: Dr. Jan Korbel
Adresse: Europäisches Laboratorium für Molekularbiologie (EMBL), Genome Biology Unit
Meyerhofstr. 1
69117 Heidelberg

Standort Heidelberg EMBL

Das Vorhaben am EMBL bearbeitet das Arbeitspaket 2 (AP2) im TP2. In dem Vorhaben werden bioinformatische Analysen speziell im Hinblick auf die Analyse der Strukturvariations-Daten auf Grundlage der bereits generierten Daten durchgeführt. Diese Analyse struktureller Aberrationen (wie z. B. Deletionen oder Translokationen) ist für die Erforschung nicht-kodierender Regionen des Erbguts von zentraler Bedeutung, da sie einen entscheidenden Einfluss auf die Aktivierung von Onkogenen und Tumorentstehung haben können. Ziel ist es, frühere und wesentlich präzisere Prognosen bei Prostatakarzinomen aufzuzeigen. Im Vordergrund von AP2 des Teilprojektes 2 steht die tiefergreifende bioinformatische Analyse der vorhandenen Ganzgenomdatensätze mit der Weiterentwicklung der Analysetools und bioinformatischen Pipelines. Diese Daten sollen mittels modernster Methoden zur Strukturvariations-Analyse mit den Genomdaten von älteren Prostatakrebspatienten verglichen werden.

Abgeschlossen

Standort Ulm

Förderkennzeichen: 01KU1505G
Gesamte Fördersumme: 392.681 EUR
Förderzeitraum: 2016 - 2018
Projektleitung: Prof. Dr. Reiner Siebert
Adresse: Universität Ulm, Universitätsklinikum, Institut für Humangenetik
Albert-Einstein-Allee 11
89081 Ulm

Standort Ulm

In TP1 wird die Identifizierung und funktionelle Charakterisierung speziell Lymphom-charakteristischer Mechanismen und Alterationen untersucht, um a) den Bezug zwischen den charakteristischen und einzigartigen Funktionen und Mechanismen von normalen B-Zellen und der Lymphomentstehung aufzuklären, b) funktionelle Einblicke in die Biologie und Mechanismen maligner Lymphome zu erlangen, c) die funktionellen und mechanistischen Unterschiede und Gemeinsamkeiten der drei in diesem Konsortium untersuchten Tumoren zu erschließen und d) eine gezielte, auf mechanistischen Informationen basierende Translation der Ergebnisse in die Klinik zu ermöglichen. Darüber hinaus wird die entitätsübergreifende Analyse genetischer und epigenetischer Daten aller drei Teilprojekte vorangetrieben. An diesem Vorhaben sind folgende Arbeitspakete beteiligt: AP1, AP3, AP4a, AP5a und AP6a.