Das Verbundprojekt GenomeNet beschäftigt sich mit der Genomik, genauer gesagt mit der Modellierung genomischer Daten. Es ist eine der größten Herausforderungen in den Lebenswissenschaften, die Komplexität der Dynamik und der Organisation des Genoms besser zu verstehen. Trotz großer Fortschritte in jüngster Zeit ist die funktionelle Relevanz eines großen Teils des Genoms nach wie vor unbekannt. Ein vielversprechender Ansatz um auf dem Gebiet der Genomik mehr Einsicht zu gewinnen ist die Anwendung der Deep Learning Methode, die in anderen Bereichen bereits erfolgreich eingesetzt wurde. Es sind jedoch verschiedene Deep-Learning-Netzwerk-Architekturen für verschiedene Arten von Datendarstellungen passend. Bisher ist noch nicht bekannt, welche Architekturen oder Kombinationen davon genau für das Modellieren von Genomen geeignet sein könnten.
Hier setzt GenomeNet an: Im Rahmen des Projekts soll ein sogenanntes tiefgehendes neuronales Netzwerk (Deep Neural Network) zur Modellierung genomischer Daten entwickelt werden. Die neuartige Methode soll die sogenannte modellbasierte Optimierung nutzen, um eine spezielle Deep-Learning-Architektur für die Verarbeitung von Genomen zu finden. Es ist geplant, das Netzwerk mit öffentlich verfügbaren Genomen zu trainieren. Der Einsatzbereich des neuen Netzwerkes ist vielseitig: Es soll sowohl für die De-novo-Identifizierung noch unbekannter Strukturen, für die Imputation (Vervollständigung) fehlender Nukleotide als auch für die Entwicklung dateneffizienter Klassifizierungssysteme, die weniger markierte Daten als bislang benötigen, eingesetzt werden.