Einzelprojekt

Cohort-SV - Auffinden und Genotypisieren von struktureller Variation in Sequenzierungsdaten ganzer Genome für große Kohorten

Förderkennzeichen: 031L0180
Fördersumme: 324.066 EUR
Förderzeitraum: 2019 - 2022
Projektleitung: Dr. Birte Kehr
Adresse: Charité - Universitätsmedizin Berlin - Berliner Institut für Gesundheitsforschung - JRG Genome Informatics
Charitéplatz 1
10117 Berlin

Das Einzelprojekt Cohort-SV beschäftigt sich mit Verbesserungen bei der Analyse von Genom-Sequenzierungsdaten. Mit diesen Analysen können verschiedene Formen der genetischen Variation aufgedeckt werden, neben Varianten einzelner Nukleotide und kleinen Insertionen bzw. Deletionen insbesondere auch sogenannte genomische Strukturvarianten (SV). Untersuchungen dieser Strukturvarianten tragen wesentlich zu einem besseren Verständnis von menschlichen Merkmalen und von Krankheiten bei. Die Identifizierung und Genotypisierung der Strukturvarianten ist derzeit jedoch – insbesondere bei umfangreichen Kohorten – eine große rechnerische Herausforderung, da die aktuell zur Verfügung stehenden Analyseprogramme trotz hohen Personaleinsatzes und großer Rechenkapazität oft nur ungenaue Ergebnisse liefern.

Im Rahmen von Cohort-SV soll nun ein neues Analysetool entwickelt werden, mit dem sich genomische Strukturvarianten künftig besser, d.h. skalierbarer, effizienter, mit höherer Genauigkeit und benutzerfreundlicher als bislang analysieren lassen. Das neue Analyseprogramm soll insbesondere in der Lage sein, die Daten von vielen Personen zusammen zu analysieren, so dass eine genomische Strukturvariante schneller identifiziert werden kann. Gleichzeitig ist geplant, auch die Arbeitsleistung des Programms in Bezug auf die Laufzeit und den Rechenspeicherverbrauch zu optimieren, indem die zur Analyse benötigte Datenmenge reduziert wird.

Mit dem neuen Analysetool lassen sich künftig eine Vielzahl komplexer biologischer Studien – beispielsweise zu Mutationsraten und ihren Auswirkungen auf Krankheiten – durchführen und wesentlich effizienter als bislang die vorhandenen genomischen Daten nutzen.