Logo of the Physikalisch-Technische Bundesanstalt
Gateway for public

KI auf der Intensivstation

Auch synthetische Trainingsdaten brauchen Qualitätsstandards

Nachricht im PTB-Newsletter Genau!
28.02.2024

Da echte Patientendaten strengem Datenschutz unterliegen, erzeugen Forschende synthetische Daten zum Trainieren ihrer KI-Systeme. Die PTB will ihnen einen Werkzeugkasten für die Qualitätsbewertung ihrer Daten zur Verfügung stellen. Er hilft auch dabei, das Recht der Einzelnen auf Privatsphäre zu schützen.

Auf Intensivstationen fallen besonders viele Daten an. Sie alle gleichzeitig im Blick zu behalten und kritische Situationen rechtzeititg zu erfassen ist eine anspruchsvolle Aufgabe, bei der KI helfen kann. (Foto: PlanoDigitalARt / Adobe Stock, KI-generiertes Bild)

Auf der Intensivstation retten Messdaten Leben: Herzfrequenz, Blutdruck, Sauerstoffsättigung sind nur einige von vielen Parametern, die kontinuierlich erfasst und bewertet werden müssen. Ab wann wird es kritisch? Was steht in der Patientenakte? Welche Vorerkrankungen liegen vor? Um das medizinische Personal bei der Aus- und Bewertung dieser umfangreichen Daten zu unterstützen, entwickeln Wissenschaftlerinnen und Wissenschaftler KI-Anwendungen. Solche Systeme brauchen zum Lernen große Mengen an Gesundheitsdaten, die in Deutschland jedoch unter strengem Datenschutz stehen und nur in begrenzter Zahl verfügbar sind. Forschende nutzen daher synthetische Daten – also künstlich erzeugte Daten, die Originaldaten nachahmen – um ihre KI-Modelle zu trainieren.

„Auch synthetische Daten müssen von hoher Qualität sein“, sagt Rustam Zhumagambetov. Ziel seines Forschungsvorhabens ist es, Qualitätsbewertungsstandards zu entwickeln, um anderen Forschern die Möglichkeit zu geben, selbst hochwertige synthetische Daten zu erzeugen. „Wir haben bereits ein gebrauchsfertiges Softwarepaket mit unserem Qualitätsbewertungs-Toolkit vorbereitet“, erklärt der Doktorand. Dies soll anderen Forschenden ermöglichen, Daten zum Training ihrer KI-Modelle zu erzeugen – bei Einhaltung aller Datenschutzbestimmungen. Qualitätsstandards wie diese könnten auch die Zulassungsprüfung KI-basierter Medizinprodukte erleichtern. Denn nach wie vor besteht zwischen Forschung an KI-Modellen und ihrem praktischen Einsatz eine große Kluft – auch weil bisherige Zulassungsverfahren nicht auf die Prüfung eines Medizinprodukts mit hohem KI-Anteil zugeschnitten sind.

Um ihr Ziel zu erreichen, trainieren die PTB-Forschenden selbst ein KI-System, das synthetische Gesundheitsdaten erzeugt, die wiederum realistische Zeitreihensignale von virtuellen Patienten simulieren. Zeitreihensignale sind Messungen, die über einen bestimmten Zeitraum hinweg die Entwicklung von beispielsweise Herzfrequenz, Atemfrequenz oder Temperatur aufzeichnen. Die Entwicklung der Messwerte über einen bestimmten Zeitraum macht Veränderungen des Gesundheitszustandes deutlich und ermöglicht seine weitere Vorhersage.

Ein großer Satz echter US-amerikanischer Patientendaten dient den Forschenden als Grundlage. Enthalten sind unter anderem Labormessungen, Arztnotizen, Daten der Intensivstation sowie Diagnosen, jedoch wird nur ein Teil davon für das Training des KI-Systems verwendet.

Die Forschung findet im Rahmen des Projekts Towards standardized quality control for AI systems in critical care unter dem Dach des Kompetenzclusters Metrologie für künstliche Intelligenz in der Medizin (M4AIM) statt. Beteiligt sind neben der PTB die Technische Universität Berlin sowie das Institut für Medizinische Informatik der Charité  Universitätsmedizin Berlin.
if/ptb

 

PTB-Ansprechpartner
Dr. Stefan Haufe, Leiter der PTB-Arbeitsgruppe 8.44 Maschinelles Lernen und Unsicherheit, Tel.: (030) 3481-7284, E-Mail: stefan.haufe(at)ptb.de

 

Die PTB-Innovationscluster „Gesundheit“ und „Digitalisierung“
Maschinelles Lernen ist ein großes Zukunftsthema, auch in der Medizin. Gut trainierte KI-Algorithmen erkennen Muster in großen Datenmengen. Damit Patientinnen und Patienten solchen Verfahren ihr Vertrauen schenken, arbeitet die PTB an objektiven Bewertungsmethoden für diese Algorithmen und deren Trainingsdaten. Ihre Innovationscluster „Gesundheit“ und „Digitalisierung“ sind zwei von sechs übergreifenden Clustern zu den großen Fragen der Gegenwart und Zukunft.