Verbund

GeMTeX - Medizininformatik-Plattform "German Medical Text Corpus"

Innovative IT-Lösungen können entscheidend dazu beitragen, die Versorgung von Patientinnen und Patienten zu verbessern. Täglich werden unzählige Daten in Kliniken, Arztpraxen und in der Forschung erhoben. In ihrer Gesamtheit bilden sie einen bedeutsamen Datenschatz für die Forschung, der allerdings nur dann bundesweit nutzbar ist, wenn die Datenformate und IT-Systeme zusammenpassen.

Das BMBF setzt hier mit dem mehrphasigen Förderkonzept der Medizininformatik-Initiative (MII) an. Sie legt zentrale Grundlagen, damit digitalisierte Gesundheitsdaten standortübergreifend erschlossen und für die Forschung genutzt werden können. In der aktuellen Förderphase steht der Ausbau der in allen Universitätskliniken geschaffenen Strukturen und ihre Zusammenarbeit im Fokus. Die Einrichtungen sollen sich noch stärker miteinander und mit anderen Förderprogrammen sowie Initiativen zur Gesundheitsforschung vernetzen. Neben klinischen Anwendungsfällen werden in Methodenplattformen technische Lösungen entwickelt, die grundlegend für die standortübergreifende Datennutzung in der MII sind.

Ziel von GeMTeX ist es, die große Menge an Informationen in Textdokumenten der Patientenroutineversorgung (z. B. in Entlass- oder Befundberichten) mithilfe der computergestützten Sprachverarbeitung (Natural Language Processing) für die Forschung zu erschließen. Da die klinische Sprache weit von der alltäglichen und wissenschaftlichen Sprache entfernt ist, bedarf es hierfür spezieller Sprachmodelle, die an realistischen klinischen Dokumenten trainiert werden. GeMTeX will hierfür anonymisierte Patientendaten nutzen, um entsprechende Textkorpora, Modelle und Werkzeuge zu entwickeln. Damit entsteht ein wertvolles Textrepertoire für Forschung und Entwicklung. Die geschaffenen Ressourcen werden entsprechend der FAIR-Prinzipien über die Zentralbibliothek für Medizin und die nationale Forschungsdateninfrastruktur NFDI4Health langfristig öffentlich zugänglich gemacht.

Langfristiges Ziel der MII ist es, ein leistungsfähigeres, digital vernetztes Gesundheitssystem zu schaffen, das ärztliches Personal, Forschende und Erkrankte dabei unterstützt, Krankheiten besser und früher zu erkennen und die für jede Einzelperson bestmögliche Therapie zu finden.

Teilprojekte

Administration, Annotation und Methodenentwicklung, TU München

Förderkennzeichen: 01ZZ2314A
Gesamte Fördersumme: 396.957 EUR
Förderzeitraum: 2023 - 2024
Projektleitung: Prof. Dr. Martin Boeker
Adresse: Klinikum rechts der Isar der Technischen Universität München, Institut für Medizinische Informatik, Statistik und Epidemiologie
Ismaninger Str. 22
81675 München

Administration, Annotation und Methodenentwicklung, TU München

Das Hauptziel von GeMTeX ist die Generierung eines großen annotierten Textkorpus deutscher medizinischer Texte aus der Routineversorgung von Patientinnen und Patienten. Es ist geplant Dokumente von prospektiv einwilligenden Patienten aus den elektronischen Gesundheitsakten (ePA) von sechs Universitätsklinika zu extrahieren. In einer konzertierten Aktion werden daraus annotierte Textkorpora generiert und tiefe Annotationen in mehreren Dimensionen bereitgestellt. Nach der Anonymisierung ermöglicht GeMTeX die gemeinsame Nutzung dieser Dokumente und wird neue Ressourcen für Forschung und Entwicklung schaffen. Der Fortschritt des klinischen Natural Language Processing (NLP) wird entscheidend von speziell trainierten Sprachmodellen abhängen, die authentische klinische Dokumente erfordern. Das Verbundprojekt wird zwei wesentliche Engpässe adressieren, die deutsche klinische Sprachmodelle bisher verhindert haben, nämlich 1) die Zugänglichkeit von Daten und 2) die Annotation von Daten. Die Medizininformatik-Initiative (MII) bietet eine einzigartige Gelegenheit, klinische Dokumente in großem Umfang zugänglich zu machen und mit Annotationen anzureichern. Ein deutscher medizinischer Textkorpus wird die Entwicklung von NLP-Ressourcen fördern, die die Analyse deutscher klinischer Texte unterstützen. GeMTeX wird eine technische und organisatorische Struktur schaffen, um anonymisierte Texte prospektiv zu sammeln und sie nach Annotationsrichtlinien zu annotieren. GeMTeX wird ein breites Spektrum von Annotationsaufgaben abdecken. Sie werden erprobt, validiert und in großem Maßstab angewandt, um eine einzigartige Ressource zu schaffen. KI-Modelle, die mit dieser Ressource trainiert wurden, werden im Hinblick auf ihren Wert in konkreten disziplinären Anwendungsszenarien analysiert. Die annotierten Textdokumente und die Modelle werden über die Zentralbibliothek für Medizin (ZBMED) und über das DFG-geförderte Projekt NFDI4Health, mit dem GeMTeX eng zusammenarbeitet, öffentlich zugänglich gemacht.

Administration, Annotation und Methodenentwicklung: Universität / Uniklinik Leipzig

Förderkennzeichen: 01ZZ2314B
Gesamte Fördersumme: 743.564 EUR
Förderzeitraum: 2023 - 2024
Projektleitung: Prof. Dr. Markus Löffler
Adresse: Universität Leipzig, Medizinische Fakultät, Institut für Medizinische Informatik, Statistik und Epidemiologie (IMISE)
Härtelstr. 16-18
04107 Leipzig

Administration, Annotation und Methodenentwicklung: Universität / Uniklinik Leipzig

Das Hauptziel von GeMTeX ist die Generierung eines großen annotierten Textkorpus deutscher medizinischer Texte aus der Routineversorgung von Patientinnen und Patienten. Es ist geplant Dokumente von prospektiv einwilligenden Patienten aus den elektronischen Gesundheitsakten (ePA) von sechs Universitätsklinika zu extrahieren. In einer konzertierten Aktion werden daraus annotierte Textkorpora generiert und tiefe Annotationen in mehreren Dimensionen bereitgestellt. Nach der Anonymisierung ermöglicht GeMTeX die gemeinsame Nutzung dieser Dokumente und wird neue Ressourcen für Forschung und Entwicklung schaffen. Der Fortschritt des klinischen Natural Language Processing (NLP) wird entscheidend von speziell trainierten Sprachmodellen abhängen, die authentische klinische Dokumente erfordern. Das Verbundprojekt wird zwei wesentliche Engpässe adressieren, die deutsche klinische Sprachmodelle bisher verhindert haben, nämlich 1) die Zugänglichkeit von Daten und 2) die Annotation von Daten. Die Medizininformatik-Initiative (MII) bietet eine einzigartige Gelegenheit, klinische Dokumente in großem Umfang zugänglich zu machen und mit Annotationen anzureichern. Ein deutscher medizinischer Textkorpus wird die Entwicklung von NLP-Ressourcen fördern, die die Analyse deutscher klinischer Texte unterstützen. GeMTeX wird eine technische und organisatorische Struktur schaffen, um anonymisierte Texte prospektiv zu sammeln und sie nach Annotationsrichtlinien zu annotieren. GeMTeX wird ein breites Spektrum von Annotationsaufgaben abdecken. Sie werden erprobt, validiert und in großem Maßstab angewandt, um eine einzigartige Ressource zu schaffen. KI-Modelle, die mit dieser Ressource trainiert wurden, werden im Hinblick auf ihren Wert in konkreten disziplinären Anwendungsszenarien analysiert. Die annotierten Textdokumente und die Modelle werden über die Zentralbibliothek für Medizin (ZBMED) und über das DFG-geförderte Projekt NFDI4Health, mit dem GeMTeX eng zusammenarbeitet, öffentlich zugänglich gemacht.

Zentrale Annotation von Dokumenten, Universitätsklinikum Essen

Förderkennzeichen: 01ZZ2314D
Gesamte Fördersumme: 201.706 EUR
Förderzeitraum: 2023 - 2024
Projektleitung: Prof. Dr. Felix Nensa
Adresse: Universitätsklinikum Essen, Zentrale Informationstechnik (ZIT)
Hufelandstr. 55
45147 Essen

Zentrale Annotation von Dokumenten, Universitätsklinikum Essen

Das Hauptziel von GeMTeX ist die Generierung eines großen annotierten Textkorpus deutscher medizinischer Texte aus der Routineversorgung von Patientinnen und Patienten. Es ist geplant Dokumente von prospektiv einwilligenden Patienten aus den elektronischen Gesundheitsakten (ePA) von sechs Universitätsklinika zu extrahieren. In einer konzertierten Aktion werden daraus annotierte Textkorpora generiert und tiefe Annotationen in mehreren Dimensionen bereitgestellt. Nach der Anonymisierung ermöglicht GeMTeX die gemeinsame Nutzung dieser Dokumente und wird neue Ressourcen für Forschung und Entwicklung schaffen. Der Fortschritt des klinischen Natural Language Processing (NLP) wird entscheidend von speziell trainierten Sprachmodellen abhängen, die authentische klinische Dokumente erfordern. Das Verbundprojekt wird zwei wesentliche Engpässe adressieren, die deutsche klinische Sprachmodelle bisher verhindert haben, nämlich 1) die Zugänglichkeit von Daten und 2) die Annotation von Daten. Die Medizininformatik-Initiative (MII) bietet eine einzigartige Gelegenheit, klinische Dokumente in großem Umfang zugänglich zu machen und mit Annotationen anzureichern. Ein deutscher medizinischer Textkorpus wird die Entwicklung von NLP-Ressourcen fördern, die die Analyse deutscher klinischer Texte unterstützen. GeMTeX wird eine technische und organisatorische Struktur schaffen, um anonymisierte Texte prospektiv zu sammeln und sie nach Annotationsrichtlinien zu annotieren. GeMTeX wird ein breites Spektrum von Annotationsaufgaben abdecken. Sie werden erprobt, validiert und in großem Maßstab angewandt, um eine einzigartige Ressource zu schaffen. KI-Modelle, die mit dieser Ressource trainiert wurden, werden im Hinblick auf ihren Wert in konkreten disziplinären Anwendungsszenarien analysiert. Die annotierten Textdokumente und die Modelle werden über die Zentralbibliothek für Medizin (ZBMED) und über das DFG-geförderte Projekt NFDI4Health, mit dem GeMTeX eng zusammenarbeitet, öffentlich zugänglich gemacht.

Zentrale Annotation von Dokumenten, Charité - Universitätsmedizin Berlin

Förderkennzeichen: 01ZZ2314E
Gesamte Fördersumme: 200.346 EUR
Förderzeitraum: 2023 - 2024
Projektleitung: Prof. Dr. Fabian Prasser
Adresse: Charité - Universitätsmedizin Berlin, Berliner Institut für Gesundheitsforschung
Sauerbruchweg 3
10117 Berlin

Zentrale Annotation von Dokumenten, Charité - Universitätsmedizin Berlin

Das Hauptziel von GeMTeX ist die Generierung eines großen annotierten Textkorpus deutscher medizinischer Texte aus der Routineversorgung von Patientinnen und Patienten. Es ist geplant Dokumente von prospektiv einwilligenden Patienten aus den elektronischen Gesundheitsakten (ePA) von sechs Universitätsklinika zu extrahieren. In einer konzertierten Aktion werden daraus annotierte Textkorpora generiert und tiefe Annotationen in mehreren Dimensionen bereitgestellt. Nach der Anonymisierung ermöglicht GeMTeX die gemeinsame Nutzung dieser Dokumente und wird neue Ressourcen für Forschung und Entwicklung schaffen. Der Fortschritt des klinischen Natural Language Processing (NLP) wird entscheidend von speziell trainierten Sprachmodellen abhängen, die authentische klinische Dokumente erfordern. Das Verbundprojekt wird zwei wesentliche Engpässe adressieren, die deutsche klinische Sprachmodelle bisher verhindert haben, nämlich 1) die Zugänglichkeit von Daten und 2) die Annotation von Daten. Die Medizininformatik-Initiative (MII) bietet eine einzigartige Gelegenheit, klinische Dokumente in großem Umfang zugänglich zu machen und mit Annotationen anzureichern. Ein deutscher medizinischer Textkorpus wird die Entwicklung von NLP-Ressourcen fördern, die die Analyse deutscher klinischer Texte unterstützen. GeMTeX wird eine technische und organisatorische Struktur schaffen, um anonymisierte Texte prospektiv zu sammeln und sie nach Annotationsrichtlinien zu annotieren. GeMTeX wird ein breites Spektrum von Annotationsaufgaben abdecken. Sie werden erprobt, validiert und in großem Maßstab angewandt, um eine einzigartige Ressource zu schaffen. KI-Modelle, die mit dieser Ressource trainiert wurden, werden im Hinblick auf ihren Wert in konkreten disziplinären Anwendungsszenarien analysiert. Die annotierten Textdokumente und die Modelle werden über die Zentralbibliothek für Medizin (ZBMED) und über das DFG-geförderte Projekt NFDI4Health, mit dem GeMTeX eng zusammenarbeitet, öffentlich zugänglich gemacht.

Zentrale Annotation von Dokumenten, Technische Universität Dresden

Förderkennzeichen: 01ZZ2314F
Gesamte Fördersumme: 183.834 EUR
Förderzeitraum: 2023 - 2024
Projektleitung: Prof. Dr. Martin Sedlmayr
Adresse: Technische Universität Dresden, Medizinische Fakultät Carl Gustav Carus, Institut für Medizinische Informatik und Biometrie
Fetscherstr. 74
01307 Dresden

Zentrale Annotation von Dokumenten, Technische Universität Dresden

Das Hauptziel von GeMTeX ist die Generierung eines großen annotierten Textkorpus deutscher medizinischer Texte aus der Routineversorgung von Patientinnen und Patienten. Es ist geplant Dokumente von prospektiv einwilligenden Patienten aus den elektronischen Gesundheitsakten (ePA) von sechs Universitätsklinika zu extrahieren. In einer konzertierten Aktion werden daraus annotierte Textkorpora generiert und tiefe Annotationen in mehreren Dimensionen bereitgestellt. Nach der Anonymisierung ermöglicht GeMTeX die gemeinsame Nutzung dieser Dokumente und wird neue Ressourcen für Forschung und Entwicklung schaffen. Der Fortschritt des klinischen Natural Language Processing (NLP) wird entscheidend von speziell trainierten Sprachmodellen abhängen, die authentische klinische Dokumente erfordern. Das Verbundprojekt wird zwei wesentliche Engpässe adressieren, die deutsche klinische Sprachmodelle bisher verhindert haben, nämlich 1) die Zugänglichkeit von Daten und 2) die Annotation von Daten. Die Medizininformatik-Initiative (MII) bietet eine einzigartige Gelegenheit, klinische Dokumente in großem Umfang zugänglich zu machen und mit Annotationen anzureichern. Ein deutscher medizinischer Textkorpus wird die Entwicklung von NLP-Ressourcen fördern, die die Analyse deutscher klinischer Texte unterstützen. GeMTeX wird eine technische und organisatorische Struktur schaffen, um anonymisierte Texte prospektiv zu sammeln und sie nach Annotationsrichtlinien zu annotieren. GeMTeX wird ein breites Spektrum von Annotationsaufgaben abdecken. Sie werden erprobt, validiert und in großem Maßstab angewandt, um eine einzigartige Ressource zu schaffen. KI-Modelle, die mit dieser Ressource trainiert wurden, werden im Hinblick auf ihren Wert in konkreten disziplinären Anwendungsszenarien analysiert. Die annotierten Textdokumente und die Modelle werden über die Zentralbibliothek für Medizin (ZBMED) und über das DFG-geförderte Projekt NFDI4Health, mit dem GeMTeX eng zusammenarbeitet, öffentlich zugänglich gemacht.

Zentrale Annotation von Dokumenten, Friedrich-Alexander-Universität Erlangen-Nürnberg

Förderkennzeichen: 01ZZ2314G
Gesamte Fördersumme: 200.600 EUR
Förderzeitraum: 2023 - 2024
Projektleitung: Prof. Dr. Thomas Ganslandt
Adresse: Friedrich-Alexander-Universität Erlangen-Nürnberg, Lehrstuhl für Medizinische Informatik
Wetterkreuz 15
91058 Erlangen

Zentrale Annotation von Dokumenten, Friedrich-Alexander-Universität Erlangen-Nürnberg

Das Hauptziel von GeMTeX ist die Generierung eines großen annotierten Textkorpus deutscher medizinischer Texte aus der Routineversorgung von Patientinnen und Patienten. Es ist geplant Dokumente von prospektiv einwilligenden Patienten aus den elektronischen Gesundheitsakten (ePA) von sechs Universitätsklinika zu extrahieren. In einer konzertierten Aktion werden daraus annotierte Textkorpora generiert und tiefe Annotationen in mehreren Dimensionen bereitgestellt. Nach der Anonymisierung ermöglicht GeMTeX die gemeinsame Nutzung dieser Dokumente und wird neue Ressourcen für Forschung und Entwicklung schaffen. Der Fortschritt des klinischen Natural Language Processing (NLP) wird entscheidend von speziell trainierten Sprachmodellen abhängen, die authentische klinische Dokumente erfordern. Das Verbundprojekt wird zwei wesentliche Engpässe adressieren, die deutsche klinische Sprachmodelle bisher verhindert haben, nämlich 1) die Zugänglichkeit von Daten und 2) die Annotation von Daten. Die Medizininformatik-Initiative (MII) bietet eine einzigartige Gelegenheit, klinische Dokumente in großem Umfang zugänglich zu machen und mit Annotationen anzureichern. Ein deutscher medizinischer Textkorpus wird die Entwicklung von NLP-Ressourcen fördern, die die Analyse deutscher klinischer Texte unterstützen. GeMTeX wird eine technische und organisatorische Struktur schaffen, um anonymisierte Texte prospektiv zu sammeln und sie nach Annotationsrichtlinien zu annotieren. GeMTeX wird ein breites Spektrum von Annotationsaufgaben abdecken. Sie werden erprobt, validiert und in großem Maßstab angewandt, um eine einzigartige Ressource zu schaffen. KI-Modelle, die mit dieser Ressource trainiert wurden, werden im Hinblick auf ihren Wert in konkreten disziplinären Anwendungsszenarien analysiert. Die annotierten Textdokumente und die Modelle werden über die Zentralbibliothek für Medizin (ZBMED) und über das DFG-geförderte Projekt NFDI4Health, mit dem GeMTeX eng zusammenarbeitet, öffentlich zugänglich gemacht.

Zentrale Methoden und Werkzeuge, TU Darmstadt

Förderkennzeichen: 01ZZ2314H
Gesamte Fördersumme: 118.622 EUR
Förderzeitraum: 2023 - 2024
Projektleitung: Prof. Dr. Iryna Gurevych
Adresse: Technische Universität Darmstadt, Fachbereich Informatik, Ubiquitous Knowledge Processing (UKP) Lab
Hochschulstr. 10
64289 Darmstadt

Zentrale Methoden und Werkzeuge, TU Darmstadt

Annotationsleitlinien im medizinischen Bereich Kardiologie und korpusbezogenene Methoden, Universität Heidelberg

Förderkennzeichen: 01ZZ2314I
Gesamte Fördersumme: 743.470 EUR
Förderzeitraum: 2023 - 2024
Projektleitung: Prof. Christoph Dieterich
Adresse: Universitätsklinikum Heidelberg, Klinik für Innere Medizin III
Im Neuenheimer Feld 410
69120 Heidelberg

Annotationsleitlinien im medizinischen Bereich Kardiologie und korpusbezogenene Methoden, Universität Heidelberg

Das Hauptziel von GeMTeX ist die Generierung eines großen annotierten Textkorpus deutscher medizinischer Texte aus der Routineversorgung von Patientinnen und Patienten. Es ist geplant Dokumente von prospektiv einwilligenden Patienten aus den elektronischen Gesundheitsakten (ePA) von sechs Universitätsklinika zu extrahieren. In einer konzertierten Aktion werden daraus annotierte Textkorpora generiert und tiefe Annotationen in mehreren Dimensionen bereitgestellt. Nach der Anonymisierung ermöglicht GeMTeX die gemeinsame Nutzung dieser Dokumente und wird neue Ressourcen für Forschung und Entwicklung schaffen. Der Fortschritt des klinischen Natural Language Processing (NLP) wird entscheidend von speziell trainierten Sprachmodellen abhängen, die authentische klinische Dokumente erfordern. Das Verbundprojekt wird zwei wesentliche Engpässe adressieren, die deutsche klinische Sprachmodelle bisher verhindert haben, nämlich 1) die Zugänglichkeit von Daten und 2) die Annotation von Daten. Die Medizininformatik-Initiative (MII) bietet eine einzigartige Gelegenheit, klinische Dokumente in großem Umfang zugänglich zu machen und mit Annotationen anzureichern. Ein deutscher medizinischer Textkorpus wird die Entwicklung von NLP-Ressourcen fördern, die die Analyse deutscher klinischer Texte unterstützen. GeMTeX wird eine technische und organisatorische Struktur schaffen, um anonymisierte Texte prospektiv zu sammeln und sie nach Annotationsrichtlinien zu annotieren. GeMTeX wird ein breites Spektrum von Annotationsaufgaben abdecken. Sie werden erprobt, validiert und in großem Maßstab angewandt, um eine einzigartige Ressource zu schaffen. KI-Modelle, die mit dieser Ressource trainiert wurden, werden im Hinblick auf ihren Wert in konkreten disziplinären Anwendungsszenarien analysiert. Die annotierten Textdokumente und die Modelle werden über die Zentralbibliothek für Medizin (ZBMED) und über das DFG-geförderte Projekt NFDI4Health, mit dem GeMTeX eng zusammenarbeitet, öffentlich zugänglich gemacht.

Visualisierung und Automatisierung von Mapping-Methoden: Medizinische Hochschule Hannover

Förderkennzeichen: 01ZZ2314J
Gesamte Fördersumme: 59.373 EUR
Förderzeitraum: 2023 - 2024
Projektleitung: Prof. Dr. Dr. Michael Marschollek
Adresse: Medizinische Hochschule Hannover, Peter L. Reichertz Institut für Medizinische Informatik
Carl-Neuberg-Str. 1
30625 Hannover

Visualisierung und Automatisierung von Mapping-Methoden: Medizinische Hochschule Hannover

Das Hauptziel von GeMTeX ist die Generierung eines großen annotierten Textkorpus deutscher medizinischer Texte aus der Routineversorgung von Patientinnen und Patienten. Es ist geplant Dokumente von prospektiv einwilligenden Patienten aus den elektronischen Gesundheitsakten (ePA) von sechs Universitätsklinika zu extrahieren. In einer konzertierten Aktion werden daraus annotierte Textkorpora generiert und tiefe Annotationen in mehreren Dimensionen bereitgestellt. Nach der Anonymisierung ermöglicht GeMTeX die gemeinsame Nutzung dieser Dokumente und wird neue Ressourcen für Forschung und Entwicklung schaffen. Der Fortschritt des klinischen Natural Language Processing (NLP) wird entscheidend von speziell trainierten Sprachmodellen abhängen, die authentische klinische Dokumente erfordern. Das Verbundprojekt wird zwei wesentliche Engpässe adressieren, die deutsche klinische Sprachmodelle bisher verhindert haben, nämlich 1) die Zugänglichkeit von Daten und 2) die Annotation von Daten. Die Medizininformatik-Initiative (MII) bietet eine einzigartige Gelegenheit, klinische Dokumente in großem Umfang zugänglich zu machen und mit Annotationen anzureichern. Ein deutscher medizinischer Textkorpus wird die Entwicklung von NLP-Ressourcen fördern, die die Analyse deutscher klinischer Texte unterstützen. GeMTeX wird eine technische und organisatorische Struktur schaffen, um anonymisierte Texte prospektiv zu sammeln und sie nach Annotationsrichtlinien zu annotieren. GeMTeX wird ein breites Spektrum von Annotationsaufgaben abdecken. Sie werden erprobt, validiert und in großem Maßstab angewandt, um eine einzigartige Ressource zu schaffen. KI-Modelle, die mit dieser Ressource trainiert wurden, werden im Hinblick auf ihren Wert in konkreten disziplinären Anwendungsszenarien analysiert. Die annotierten Textdokumente und die Modelle werden über die Zentralbibliothek für Medizin (ZBMED) und über das DFG-geförderte Projekt NFDI4Health, mit dem GeMTeX eng zusammenarbeitet, öffentlich zugänglich gemacht.

Medizinische domänenspezifische Annotation, Westfälische Wilhelms-Universität Münster

Förderkennzeichen: 01ZZ2314K
Gesamte Fördersumme: 39.971 EUR
Förderzeitraum: 2023 - 2024
Projektleitung: Univ.-Prof. Dr. Julian Varghese
Adresse: Westfälische Wilhelms-Universität Münster, Medizinische Fakultät, Institut für Medizinische Informatik
Albert-Schweitzer-Str. 1, Gebäude A11
48149 Münster

Medizinische domänenspezifische Annotation, Westfälische Wilhelms-Universität Münster

Das Hauptziel von GeMTeX ist die Generierung eines großen annotierten Textkorpus deutscher medizinischer Texte aus der Routineversorgung von Patientinnen und Patienten. Es ist geplant Dokumente von prospektiv einwilligenden Patienten aus den elektronischen Gesundheitsakten (ePA) von sechs Universitätsklinika zu extrahieren. In einer konzertierten Aktion werden daraus annotierte Textkorpora generiert und tiefe Annotationen in mehreren Dimensionen bereitgestellt. Nach der Anonymisierung ermöglicht GeMTeX die gemeinsame Nutzung dieser Dokumente und wird neue Ressourcen für Forschung und Entwicklung schaffen. Der Fortschritt des klinischen Natural Language Processing (NLP) wird entscheidend von speziell trainierten Sprachmodellen abhängen, die authentische klinische Dokumente erfordern. Das Verbundprojekt wird zwei wesentliche Engpässe adressieren, die deutsche klinische Sprachmodelle bisher verhindert haben, nämlich 1) die Zugänglichkeit von Daten und 2) die Annotation von Daten. Die Medizininformatik-Initiative (MII) bietet eine einzigartige Gelegenheit, klinische Dokumente in großem Umfang zugänglich zu machen und mit Annotationen anzureichern. Ein deutscher medizinischer Textkorpus wird die Entwicklung von NLP-Ressourcen fördern, die die Analyse deutscher klinischer Texte unterstützen. GeMTeX wird eine technische und organisatorische Struktur schaffen, um anonymisierte Texte prospektiv zu sammeln und sie nach Annotationsrichtlinien zu annotieren. GeMTeX wird ein breites Spektrum von Annotationsaufgaben abdecken. Sie werden erprobt, validiert und in großem Maßstab angewandt, um eine einzigartige Ressource zu schaffen. KI-Modelle, die mit dieser Ressource trainiert wurden, werden im Hinblick auf ihren Wert in konkreten disziplinären Anwendungsszenarien analysiert. Die annotierten Textdokumente und die Modelle werden über die Zentralbibliothek für Medizin (ZBMED) und über das DFG-geförderte Projekt NFDI4Health, mit dem GeMTeX eng zusammenarbeitet, öffentlich zugänglich gemacht.

Annotation für den Bereich Pharmakologie/Unerwünschte Arzneimittelwirkungen, Ludwig-Maximilians-Universität München

Förderkennzeichen: 01ZZ2314L
Gesamte Fördersumme: 43.466 EUR
Förderzeitraum: 2023 - 2024
Projektleitung: Prof. Dr. Tobias Dreischulte
Adresse: Ludwig-Maximilians-Universität München, Klinikum, Institut für Allgemeinmedizin
Pettenkoferstr. 8a
80336 München

Annotation für den Bereich Pharmakologie/Unerwünschte Arzneimittelwirkungen, Ludwig-Maximilians-Universität München

Das Hauptziel von GeMTeX ist die Generierung eines großen annotierten Textkorpus deutscher medizinischer Texte aus der Routineversorgung von Patientinnen und Patienten. Es ist geplant Dokumente von prospektiv einwilligenden Patienten aus den elektronischen Gesundheitsakten (ePA) von sechs Universitätsklinika zu extrahieren. In einer konzertierten Aktion werden daraus annotierte Textkorpora generiert und tiefe Annotationen in mehreren Dimensionen bereitgestellt. Nach der Anonymisierung ermöglicht GeMTeX die gemeinsame Nutzung dieser Dokumente und wird neue Ressourcen für Forschung und Entwicklung schaffen. Der Fortschritt des klinischen Natural Language Processing (NLP) wird entscheidend von speziell trainierten Sprachmodellen abhängen, die authentische klinische Dokumente erfordern. Das Verbundprojekt wird zwei wesentliche Engpässe adressieren, die deutsche klinische Sprachmodelle bisher verhindert haben, nämlich 1) die Zugänglichkeit von Daten und 2) die Annotation von Daten. Die Medizininformatik-Initiative (MII) bietet eine einzigartige Gelegenheit, klinische Dokumente in großem Umfang zugänglich zu machen und mit Annotationen anzureichern. Ein deutscher medizinischer Textkorpus wird die Entwicklung von NLP-Ressourcen fördern, die die Analyse deutscher klinischer Texte unterstützen. GeMTeX wird eine technische und organisatorische Struktur schaffen, um anonymisierte Texte prospektiv zu sammeln und sie nach Annotationsrichtlinien zu annotieren. GeMTeX wird ein breites Spektrum von Annotationsaufgaben abdecken. Sie werden erprobt, validiert und in großem Maßstab angewandt, um eine einzigartige Ressource zu schaffen. KI-Modelle, die mit dieser Ressource trainiert wurden, werden im Hinblick auf ihren Wert in konkreten disziplinären Anwendungsszenarien analysiert. Die annotierten Textdokumente und die Modelle werden über die Zentralbibliothek für Medizin (ZBMED) und über das DFG-geförderte Projekt NFDI4Health, mit dem GeMTeX eng zusammenarbeitet, öffentlich zugänglich gemacht.

Integration von verteiltem Machine Learning in die Pipeline: Universitätsklinikum Tübingen

Förderkennzeichen: 01ZZ2314M
Gesamte Fördersumme: 38.364 EUR
Förderzeitraum: 2023 - 2024
Projektleitung: Prof. Dr. Carsten Eickhoff
Adresse: Universitätsklinikum Tübingen, Medizinisches Datenintegrationszentrum (meDIC)
Schaffhausenstr. 77
72072 Tübingen

Integration von verteiltem Machine Learning in die Pipeline: Universitätsklinikum Tübingen

Das Hauptziel von GeMTeX ist die Generierung eines großen annotierten Textkorpus deutscher medizinischer Texte aus der Routineversorgung von Patientinnen und Patienten. Es ist geplant Dokumente von prospektiv einwilligenden Patienten aus den elektronischen Gesundheitsakten (ePA) von sechs Universitätsklinika zu extrahieren. In einer konzertierten Aktion werden daraus annotierte Textkorpora generiert und tiefe Annotationen in mehreren Dimensionen bereitgestellt. Nach der Anonymisierung ermöglicht GeMTeX die gemeinsame Nutzung dieser Dokumente und wird neue Ressourcen für Forschung und Entwicklung schaffen. Der Fortschritt des klinischen Natural Language Processing (NLP) wird entscheidend von speziell trainierten Sprachmodellen abhängen, die authentische klinische Dokumente erfordern. Das Verbundprojekt wird zwei wesentliche Engpässe adressieren, die deutsche klinische Sprachmodelle bisher verhindert haben, nämlich 1) die Zugänglichkeit von Daten und 2) die Annotation von Daten. Die Medizininformatik-Initiative (MII) bietet eine einzigartige Gelegenheit, klinische Dokumente in großem Umfang zugänglich zu machen und mit Annotationen anzureichern. Ein deutscher medizinischer Textkorpus wird die Entwicklung von NLP-Ressourcen fördern, die die Analyse deutscher klinischer Texte unterstützen. GeMTeX wird eine technische und organisatorische Struktur schaffen, um anonymisierte Texte prospektiv zu sammeln und sie nach Annotationsrichtlinien zu annotieren. GeMTeX wird ein breites Spektrum von Annotationsaufgaben abdecken. Sie werden erprobt, validiert und in großem Maßstab angewandt, um eine einzigartige Ressource zu schaffen. KI-Modelle, die mit dieser Ressource trainiert wurden, werden im Hinblick auf ihren Wert in konkreten disziplinären Anwendungsszenarien analysiert. Die annotierten Textdokumente und die Modelle werden über die Zentralbibliothek für Medizin (ZBMED) und über das DFG-geförderte Projekt NFDI4Health, mit dem GeMTeX eng zusammenarbeitet, öffentlich zugänglich gemacht.

Erprobung klinischer NER-Modelle: HPI

Förderkennzeichen: 01ZZ2314N
Gesamte Fördersumme: 104.954 EUR
Förderzeitraum: 2023 - 2024
Projektleitung: Dr. Matthieu-P. Schapranow
Adresse: Hasso-Plattner-Institut für Digital Engineering gGmbH
Prof.-Dr.-Helmert-Str. 2-3
14482 Potsdam

Erprobung klinischer NER-Modelle: HPI

Das Hauptziel von GeMTeX ist die Generierung eines großen annotierten Textkorpus deutscher medizinischer Texte aus der Routineversorgung von Patientinnen und Patienten. Es ist geplant Dokumente von prospektiv einwilligenden Patienten aus den elektronischen Gesundheitsakten (ePA) von sechs Universitätsklinika zu extrahieren. In einer konzertierten Aktion werden daraus annotierte Textkorpora generiert und tiefe Annotationen in mehreren Dimensionen bereitgestellt. Nach der Anonymisierung ermöglicht GeMTeX die gemeinsame Nutzung dieser Dokumente und wird neue Ressourcen für Forschung und Entwicklung schaffen. Der Fortschritt des klinischen Natural Language Processing (NLP) wird entscheidend von speziell trainierten Sprachmodellen abhängen, die authentische klinische Dokumente erfordern. Das Verbundprojekt wird zwei wesentliche Engpässe adressieren, die deutsche klinische Sprachmodelle bisher verhindert haben, nämlich 1) die Zugänglichkeit von Daten und 2) die Annotation von Daten. Die Medizininformatik-Initiative (MII) bietet eine einzigartige Gelegenheit, klinische Dokumente in großem Umfang zugänglich zu machen und mit Annotationen anzureichern. Ein deutscher medizinischer Textkorpus wird die Entwicklung von NLP-Ressourcen fördern, die die Analyse deutscher klinischer Texte unterstützen. GeMTeX wird eine technische und organisatorische Struktur schaffen, um anonymisierte Texte prospektiv zu sammeln und sie nach Annotationsrichtlinien zu annotieren. GeMTeX wird ein breites Spektrum von Annotationsaufgaben abdecken. Sie werden erprobt, validiert und in großem Maßstab angewandt, um eine einzigartige Ressource zu schaffen. KI-Modelle, die mit dieser Ressource trainiert wurden, werden im Hinblick auf ihren Wert in konkreten disziplinären Anwendungsszenarien analysiert. Die annotierten Textdokumente und die Modelle werden über die Zentralbibliothek für Medizin (ZBMED) und über das DFG-geförderte Projekt NFDI4Health, mit dem GeMTeX eng zusammenarbeitet, öffentlich zugänglich gemacht.

Medizinische domänenspezifische Annotation und korpusbezogenene Methoden, Deutsche Zentralbibliothek für Medizin

Förderkennzeichen: 01ZZ2314O
Gesamte Fördersumme: 59.110 EUR
Förderzeitraum: 2023 - 2024
Projektleitung: Prof. Dr. Juliane Fluck
Adresse: Deutsche Zentralbibliothek für Medizin (ZB MED), Informationszentrum Lebenswissenschaften
Gleueler Str. 60
50931 Köln

Medizinische domänenspezifische Annotation und korpusbezogenene Methoden, Deutsche Zentralbibliothek für Medizin

Das Hauptziel von GeMTeX ist die Generierung eines großen annotierten Textkorpus deutscher medizinischer Texte aus der Routineversorgung von Patientinnen und Patienten. Es ist geplant Dokumente von prospektiv einwilligenden Patienten aus den elektronischen Gesundheitsakten (ePA) von sechs Universitätsklinika zu extrahieren. In einer konzertierten Aktion werden daraus annotierte Textkorpora generiert und tiefe Annotationen in mehreren Dimensionen bereitgestellt. Nach der Anonymisierung ermöglicht GeMTeX die gemeinsame Nutzung dieser Dokumente und wird neue Ressourcen für Forschung und Entwicklung schaffen. Der Fortschritt des klinischen Natural Language Processing (NLP) wird entscheidend von speziell trainierten Sprachmodellen abhängen, die authentische klinische Dokumente erfordern. Das Verbundprojekt wird zwei wesentliche Engpässe adressieren, die deutsche klinische Sprachmodelle bisher verhindert haben, nämlich 1) die Zugänglichkeit von Daten und 2) die Annotation von Daten. Die Medizininformatik-Initiative (MII) bietet eine einzigartige Gelegenheit, klinische Dokumente in großem Umfang zugänglich zu machen und mit Annotationen anzureichern. Ein deutscher medizinischer Textkorpus wird die Entwicklung von NLP-Ressourcen fördern, die die Analyse deutscher klinischer Texte unterstützen. GeMTeX wird eine technische und organisatorische Struktur schaffen, um anonymisierte Texte prospektiv zu sammeln und sie nach Annotationsrichtlinien zu annotieren. GeMTeX wird ein breites Spektrum von Annotationsaufgaben abdecken. Sie werden erprobt, validiert und in großem Maßstab angewandt, um eine einzigartige Ressource zu schaffen. KI-Modelle, die mit dieser Ressource trainiert wurden, werden im Hinblick auf ihren Wert in konkreten disziplinären Anwendungsszenarien analysiert. Die annotierten Textdokumente und die Modelle werden über die Zentralbibliothek für Medizin (ZBMED) und über das DFG-geförderte Projekt NFDI4Health, mit dem GeMTeX eng zusammenarbeitet, öffentlich zugänglich gemacht.

Methoden und Werkzeuge:Averbis GmbH

Förderkennzeichen: 01ZZ2314P
Gesamte Fördersumme: 135.863 EUR
Förderzeitraum: 2023 - 2024
Projektleitung: Dr. Philipp Daumke
Adresse: Averbis GmbH
Salzstr. 15
79098 Freiburg im Breisgau

Methoden und Werkzeuge:Averbis GmbH

Das Hauptziel von GeMTeX ist die Generierung eines großen annotierten Textkorpus deutscher medizinischer Texte aus der Routineversorgung von Patientinnen und Patienten. Es ist geplant Dokumente von prospektiv einwilligenden Patienten aus den elektronischen Gesundheitsakten (ePA) von sechs Universitätsklinika zu extrahieren. In einer konzertierten Aktion werden daraus annotierte Textkorpora generiert und tiefe Annotationen in mehreren Dimensionen bereitgestellt. Nach der Anonymisierung ermöglicht GeMTeX die gemeinsame Nutzung dieser Dokumente und wird neue Ressourcen für Forschung und Entwicklung schaffen. Der Fortschritt des klinischen Natural Language Processing (NLP) wird entscheidend von speziell trainierten Sprachmodellen abhängen, die authentische klinische Dokumente erfordern. Das Verbundprojekt wird zwei wesentliche Engpässe adressieren, die deutsche klinische Sprachmodelle bisher verhindert haben, nämlich 1) die Zugänglichkeit von Daten und 2) die Annotation von Daten. Die Medizininformatik-Initiative (MII) bietet eine einzigartige Gelegenheit, klinische Dokumente in großem Umfang zugänglich zu machen und mit Annotationen anzureichern. Ein deutscher medizinischer Textkorpus wird die Entwicklung von NLP-Ressourcen fördern, die die Analyse deutscher klinischer Texte unterstützen. GeMTeX wird eine technische und organisatorische Struktur schaffen, um anonymisierte Texte prospektiv zu sammeln und sie nach Annotationsrichtlinien zu annotieren. GeMTeX wird ein breites Spektrum von Annotationsaufgaben abdecken. Sie werden erprobt, validiert und in großem Maßstab angewandt, um eine einzigartige Ressource zu schaffen. KI-Modelle, die mit dieser Ressource trainiert wurden, werden im Hinblick auf ihren Wert in konkreten disziplinären Anwendungsszenarien analysiert. Die annotierten Textdokumente und die Modelle werden über die Zentralbibliothek für Medizin (ZBMED) und über das DFG-geförderte Projekt NFDI4Health, mit dem GeMTeX eng zusammenarbeitet, öffentlich zugänglich gemacht.

Zentrale Methoden, ID Information und Dokumentation im Gesundheitswesen GmbH

Förderkennzeichen: 01ZZ2314Q
Gesamte Fördersumme: 60.018 EUR
Förderzeitraum: 2023 - 2024
Projektleitung: Dr. André Sander
Adresse: ID Information und Dokumentation im Gesundheitswesen GmbH & Co. KG aA
Platz vor dem Neuen Tor 2
10115 Berlin

Zentrale Methoden, ID Information und Dokumentation im Gesundheitswesen GmbH

Das Hauptziel von GeMTeX ist die Generierung eines großen annotierten Textkorpus deutscher medizinischer Texte aus der Routineversorgung von Patientinnen und Patienten. Es ist geplant Dokumente von prospektiv einwilligenden Patienten aus den elektronischen Gesundheitsakten (ePA) von sechs Universitätsklinika zu extrahieren. In einer konzertierten Aktion werden daraus annotierte Textkorpora generiert und tiefe Annotationen in mehreren Dimensionen bereitgestellt. Nach der Anonymisierung ermöglicht GeMTeX die gemeinsame Nutzung dieser Dokumente und wird neue Ressourcen für Forschung und Entwicklung schaffen. Der Fortschritt des klinischen Natural Language Processing (NLP) wird entscheidend von speziell trainierten Sprachmodellen abhängen, die authentische klinische Dokumente erfordern. Das Verbundprojekt wird zwei wesentliche Engpässe adressieren, die deutsche klinische Sprachmodelle bisher verhindert haben, nämlich 1) die Zugänglichkeit von Daten und 2) die Annotation von Daten. Die Medizininformatik-Initiative (MII) bietet eine einzigartige Gelegenheit, klinische Dokumente in großem Umfang zugänglich zu machen und mit Annotationen anzureichern. Ein deutscher medizinischer Textkorpus wird die Entwicklung von NLP-Ressourcen fördern, die die Analyse deutscher klinischer Texte unterstützen. GeMTeX wird eine technische und organisatorische Struktur schaffen, um anonymisierte Texte prospektiv zu sammeln und sie nach Annotationsrichtlinien zu annotieren. GeMTeX wird ein breites Spektrum von Annotationsaufgaben abdecken. Sie werden erprobt, validiert und in großem Maßstab angewandt, um eine einzigartige Ressource zu schaffen. KI-Modelle, die mit dieser Ressource trainiert wurden, werden im Hinblick auf ihren Wert in konkreten disziplinären Anwendungsszenarien analysiert. Die annotierten Textdokumente und die Modelle werden über die Zentralbibliothek für Medizin (ZBMED) und über das DFG-geförderte Projekt NFDI4Health, mit dem GeMTeX eng zusammenarbeitet, öffentlich zugänglich gemacht.