Regulatory Life Cycle

Dokumentenmanagement mit KI

Man muss nicht mit Papier arbeiten und alles per Hand machen – digital gelingt Compliance besser.

Die Dokumentation und das Management von Dokumenten sind wesentliche Bestandteile der regulatorischen Compliance. Entlang des gesamten Lebenszyklus sind umfangreiche und detaillierte Dokumentationen gefordert: Die Nachvollziehbarkeit und Nachprüfbarkeit von Handlungen und Ergebnissen ist zentral, die Sicherheit von Produkten und Anwendern das übergeordnete Ziel. KI-basierte Lösungsansätze liegen in der Kombination von Methoden und Technologien aus den Bereichen Natural Language Processing (NLP), Machine Learning/Deep Neural Networks und Optical Character Recognition (OCR)/Optical Document Recognition (ODR): KI identifiziert, indiziert und klassifiziert Dokumente und Dokumenttypen; OCR überwindet Medienbrüche durch Digitalisierung papierbasierter Artefakte; NLP-Verfahren analysieren Dokumente, lokalisieren inhaltliche Zusammenhänge und erkennen Diskrepanzen, Dokumentationslücken sowie vermutete Fehler.  

Wie Künstliche Intelligenz (KI) die Studiendokumentation im Trial Master File (TMF) verbessern kann

Klinische Studien müssen umfassend und strukturiert im sog. Trial Master File (TMF) dokumentiert werden; ähnliches gilt für die Produktzulassung, für die ebenfalls eine umfassende Dokumentation zur Prüfung vorgelegt werden muss. Beim TMF liegen die Herausforderungen in

  • der organisatorischen Komplexität von Klinischen Studien;
  • der Vielzahl und Heterogenität der Daten und Dokumente, ihrer Vollständigkeit, Wiederauffindbarkeit, Versionierung, Verfügbarkeit und regulatorisch konformen, auditierbaren Ablage bzw. Dokumentation;
  • Medienbrüchen zwischen analogen, z.T. handschriftlichen, und digitalen Daten, die sich u.a. aufgrund des geringen Digitalisierungsgrads nicht konsolidiert im TMF darstellen lassen;
  • der fehlenden Integration verwandter IT-Systeme und damit in einer heterogenen und redundanten Systeminfrastruktur, die den durchgängigen Datenaustausch behindern.

Dadurch werden Durchführung und Dokumentation einer Studie tendenziell schwierig, ihre Überprüfung (Audit) durch Regulierungs- und Zulassungsbehörden erschwert und die regulatorisch konforme Archivierung gefährdet. In Auditberichten von Regulierungsbehörden finden sich daher regelmäßig Beanstandungen des regulatorisch konformen TMF-Managements und der nachvollziehbaren Dokumentation von Studien.

Das Projekt „NextGenTMF– Regulatorisch konformes Dokumentenmanagement im Trial Master File durch künstliche Intelligenz“ (BMBF, FKZ 01IS22013A-D) automatisiert Kernprozesse des Dokumentenmanagements im eTMF. Daten – und das sind v.a. unterschiedliche Dokumententypen, also Studiendaten, Patientendaten, Verträge, Zertifikate etc. – werden auf eine Plattform geladen, wo sie analysiert werden. In einem weiteren Schritt erfolgt die automatische Text- oder Schrifterkennung mittels Optical Character/Optical Document Recognition (OCR/ODR). Dies ist insbes. bei gescannten Dokumenten notwendig. So können Textelemente erkannt und Dokumente in ihrer Struktur erfasst und identifiziert werden. Dies geschieht über eine Kombination aus regelbasierter Programmierung und Machine Learning auf Basis von Beispieldokumenten. Dann erfolgt eine automatische Klassifikation in unterschiedliche Dokumenttypen des Referenzmodells der Drug Information Association (DIA). Es kommen hier Verfahren des Maschinellen Lernens zum Einsatz (Deep Neural Networks / SVMs mit geeigneten Merkmalsstrukturen), bei denen Klassifikationsmodelle anhand von manuell bereitgestellten Beispieldaten antrainiert werden. Abhängig von den Datentypen im DIA-Referenzmodell kommen NLP-basierte Annotatoren zum Einsatz; sie extrahieren gezielt die für die jeweiligen Dokumenttypen relevanten Entitäten und normalisieren sie anhand internationaler Standards. Dazu gehören neben Personen- und Datumsangaben, Adressen etc. auch medizinische Konzepte (Diagnosen, Medikationen, Prozeduren, Laborwerte, …), die durch den Abgleich mit internationalen Terminologiestandards in strukturierter und auswertbarer Form abgelegt und für die weitere Analyse verfügbar gemacht werden. Es werden sowohl regelbasierte als auch ML-basierte Verfahren verwendet. So analysierte Dokumente werden mit einer ID versehen; sie erhalten eine formale und eine inhaltliche Bedeutung. Diese wird auf das DIA-Referenzmodell projiziert; Position und Bedeutung eines Dokumentes im Modell wird identifiziert. Es erfolgt auch eine Projektion der Dokumente auf die Studienverlaufsstruktur und die Meilensteine im DIA-Referenzmodell. Zwischen Dokumenten werden Vernetzungen entsprechend dem DIA-Referenzmodell hergestellt; ein Soll-Ist-Abgleich identifiziert Lücken in der Dokumentation.

Wissenswertes | News | Aktuelles