Das Verbundprojekt BSmadeEZ beschäftigt sich mit dem Thema DNA-Methylierung. Bei diesem Prozess werden Methylgruppen enzymatisch an die DNA gebunden, die dadurch die biologische Funktion der DNA beeinflussen und steuern. Um DNA-Methylierungswerte genomisch zu beurteilen, wird vielfach die sogenannte Ganzgenom-Bisulfit-Sequenzierung (WGBS) angewendet. Die daraus resultierenden Bisulfit-Sequenzierdaten dienen als Grundlage für viele weitere Untersuchungen. Für alle Anwendungen ist es dabei sehr wichtig, dass sich die Verarbeitung dieser Daten genau reproduzieren lässt.
Hier setzt BSmadeEZ an: Im Rahmen des Projekts sollen zunächst die besten Workflows für die WGBS-Auswertung identifiziert werden. Dazu ist geplant, die derzeit verfügbaren Workflows zu vergleichen, indem standardisierte Kriterien zur Bewertung der Pipelines konzipiert und angewendet werden. Im zweiten Teil des Projekts ist vorgesehen, eine neuartige Pipeline-Management-Plattform (EpiCWL) zu entwickeln und geeignete Pipelines für die Verarbeitung der Bisulfit-Sequenzierungsdaten vom ganzen Genom zur Verfügung zu stellen. Mit der geplanten EpiCWL-Plattform soll zum einen eine einfache Möglichkeit geschaffen werden, mit der die Analyse-Ergebnisse schnell und unkompliziert geteilt werden können. Des Weiteren schafft sie die Voraussetzungen dafür, dass ein hochstandardisierter und reproduzierbarer Leistungsvergleich der Workflows durchgeführt werden kann. Insbesondere soll künftig eine nahtlose Skalierung – von einem einzelnen Computer über einen Hochleistungs-Computercluster bis hin zu einer Cloud-Umgebung – möglich sein. Es ist geplant, die im Rahmen der Software-Entwicklung gewonnenen Erfahrungen der Öffentlichkeit zugänglich zu machen, so dass Programmiererinnen und Programmierer bei zukünftigen Entwicklungsarbeiten davon profitieren können.