Federated_Learning_zuehlke
Insights

Federated Learning: KI für den Healthcare-Bereich, die den Schutz von Patientendaten ernst nimmt

Bardia M. Zanganeh

Traditionelle Machine-Learning-Methoden können eine Gefahr für die Sicherheit von Patientendaten darstellen. Das ist ein Hindernis für den allgemeinen Fortschritt der KI im Bereich Gesundheitswesen und Life Sciences. Die Lösung? Federated Learning: Eine Methode, die Kosteneinsparungen und Sicherheitsvorteile bietet, und immer stärker Verbreitung findet.

Insight in brief

  • Traditionelle Machine-Learning-Methoden können eine Gefahr für die Sicherheit von Patientendaten darstellen. Das ist ein Hindernis für den allgemeinen Fortschritt der KI im Bereich Gesundheitswesen und Life Sciences.
  • Federated Learning ist eine Methode, die dieses Problem zu umgehen versucht, indem sie Patientendaten an ihrem Ursprung belässt und ausschließlich Ergebnisse weitergibt, die keine personenbezogenen Daten enthalten.
  • Dies ist eine große Chance für Unternehmen im Bereich Pharma und Life Sciences, die über große Datenmengen verfügen. Denn bei der richtigen Verwendung dieser Daten können die daraus gewonnenen Erkenntnisse die Basis für wesentlich effektivere Lösungen sein.
KI ist immer nur so gut wie die Menschen, die sie programmieren, und das System, in dem sie ausgeführt wird. Wenn wir nicht aufpassen, wird die KI das Gesundheitswesen nicht etwa verbessern, sondern stattdessen ungewollt viele der negativsten Aspekte unseres gegenwärtigen Gesundheitssystems verstärken.
Prof. Bob Kocher
Stanford University

Das Problem von traditioneller Machine-Learning-Ansätze im Healthcare-Bereich

Um zu erklären, was Federated Learning ist und warum es sich so gut für den Healthcare-Bereich eignet, bedarf es zunächst einer näheren Erläuterung, warum traditionelle Machine-Learning-Ansätze hierfür nicht ideal sind …

Im Jahr 2017 verschrieb IBM Watson – eine der bekanntesten KI-Anwendungen im Healthcare-Bereich – Berichten zufolge während einer Simulation ein Medikament, das tödliche Folgen für den Patienten hätte haben können. Wie aus internen IBM-Dokumenten hervorging, hatte der Supercomputer „häufig unsichere und falsche“ Krebsbehandlungen empfohlen. Kundenbefragungen ergaben, das Ereignis habe „ernste Fragen bezüglich des Verfahrens zur Erstellung von Inhalten sowie der zugrunde liegenden Technologie“ aufgeworfen. (IBM weist diese Behauptungen zurück.)

Wie konnte es dazu kommen?

Die Dokumente machen ein unzureichendes Training der Watson-Software für die Vorkommnisse verantwortlich. Für dieses sei lediglich eine begrenzte Anzahl „hypothetischer“ Krebsfälle statt echter Patientendaten zum Einsatz gekommen. Außerdem habe man Empfehlungen von lediglich einer Handvoll Experten befolgt, statt sich auf gesicherte „Richtlinien oder belegte Fakten“ zu verlassen.

Warum also hat Watson sich nicht die unzähligen bereits vorhandenen, echten Patientendaten zunutze gemacht? Und warum würde nicht jedes moderne Unternehmen aus dem Bereich Pharma und Life Sciences sicherstellen, stets eine ausreichende Menge echter Patientendaten in KI-Anwendungen zu verwenden?

Tatsächlich haben wir es hier mit einem der größten Paradoxa des modernen Gesundheitswesens zu tun: Zwar hat KI das Potenzial, den Bereich Healthcare grundlegend zu transformieren und die Lebensqualität von Patienten zu verbessern. Doch für traditionelle Machine-Learning-Ansätze stellt es eine kaum zu bewältigende Herausforderung dar, in großem Umfang auf Patientendaten zuzugreifen und diese in der richtigen Weise zu nutzen.

Denn medizinische Daten verfügen über besondere Eigenschaften, die ihre Integration erheblich erschweren. So reicht ihre Bandbreite beispielsweise von Arztberichten in Freitextform bis hin zu heterogenen medizinischen Bildern.

Hinzu kommt die Tatsache, dass die Quellen für Gesundheits- oder Patientendaten selbst über eine Vielzahl separater, nicht miteinander kompatibler Systeme verteilt sind.

Und damit nicht genug: Es gibt nur wenige Bereiche, in denen Datenschutz und Anonymisierung von Daten eine so herausragende Bedeutung zukommt wie bei der Nutzung von Patientendaten. Vor diesem Hintergrund ist es daher nicht weiter verwunderlich, dass es schwer ist, ausreichend große, echte Datensätze für KI-Systeme wie Watson zusammenzutragen, ohne die Persönlichkeitsrechte der Dateneigentümer – nämlich der Patienten – zu verletzen.

Das größte Hindernis von allen? Traditionelle Machine-Learning-Ansätze beinhalten eine Daten-Pipeline, die sämtliche Daten auf einem zentralen Server bündelt. Während eine derartige Architektur in anderen Branchen nicht unbedingt ein Problem darstellt, ist es im Healthcare-Bereich von großem Nachteil, wenn alle von lokalen Geräten und Sensoren erfassten Daten zwecks Verarbeitung an den zentralen Server weitergeleitet werden müssen. Mit anderen Worten: All die sensiblen, hervorragend geschützten Daten müssen plötzlich freigegeben werden.

Dieser Weg erweist sich also als Sackgasse.

2 diagonalestriche lightgray

Teile und herrsche: Wie Federated Learning alles verändert

Federated Learning ist eine vergleichsweise neue Methode des maschinellen Lernens, die einzelne Geräte dazu in die Lage versetzt, zusammen anhand eines gemeinsamen Modells zu lernen. Es ermöglicht das individuelle Training von Modellen an verschiedenen, isolierten Datensätzen. Ausschließlich diese trainierten Modelle, die keine personenbezogenen Daten mehr enthalten, werden dann miteinander geteilt. Die Geräte senden ihre jeweiligen Modelle an einen zentralen Server, der aus ihnen ein einziges, kombiniertes Modell erstellt. Dieser Vorgang wird mehrmals wiederholt, bis ein qualitativ hochwertiges Modell entstanden ist.

Federated Learning und Schutz von Patientendaten
Federated Learning Anwendungen im Gesundheitswesen

Dieses neue Paradigma des maschinellen Lernens bringt entscheidende Vorteile mit sich.

  • Erstens sind die Modelle selbst aufgrund des gemeinsamen Trainingsprozesses intelligenter, was letztlich zu besseren Entscheidungen führt.
  • Zweitens werden Latenzzeiten reduziert, da das neue Modell dazu in der Lage ist, Prognosen vor Ort zu treffen.
  • Drittens müssen Unternehmen aus dem Healthcare-Bereich sich nicht physisch in der Nähe der Daten – oder gar der Patienten selbst – befinden, um die für die Entwicklung besserer Lösungen erforderlichen Erkenntnisse zu gewinnen. Die Erkenntnisse sind von überall aus zugänglich.
  • Und der größte Vorteil von allen: Der Schutz der Patientendaten ist durchgängig gewährleistet, da die ursprünglichen, persönlich identifizierbaren Daten stets auf die isolierten Geräte beschränkt sind.

Welche Federated-Learning-Anwendungen kommen heute zum Einsatz?

Obwohl Federated Learning relativ neu ist und sich in einem produktiven, regulierten Umfeld erst noch bewähren muss, setzen bereits mehrere große Unternehmen aus dem Gesundheitswesen diese Technologie ein.

Beispielsweise erprobt das ACR Data Science Institute die Lösung NVIDIA Clara FL – ein Federated-Learning-Framework für medizinische Geräte – im „AI-LAB“. Dabei handelt es sich um ein Data Science Toolkit mit dem Ziel, die KI zu demokratisieren, damit Radiologen Modelle in ihren eigenen Instituten und unter Verwendung ihrer eigenen Patientendaten entwickeln können.

Owkin, ein Start-up im Bereich Machine Learning (und gleichzeitig Urheber von wegweisenden Initiativen wie Melloddy), hat eine neue Federated-Learning-Plattform namens Owkin Connect eingeführt. Auf dieser können Dateneigentümer eigenständig Datenberechtigungen festlegen und ihre Datennutzung verfolgen. Ein fälschungssicheres Ledger verfolgt, welche Daten von welchem Modell im Rahmen des Trainings verwendet werden und inwiefern diese Daten zu den Parametern des Modells beitragen.

2 diagonalestriche lightgray

Was bringt die Zukunft in Sachen Federated Learning?

Da die Methode derzeit noch in den Kinderschuhen steckt, müssen noch einige wichtige Fragen dazu beantwortet werden, wie Pharma- und Life-Science-Unternehmen die sichere Anwendung von Federated Learning sicherstellen können. So zum Beispiel die Frage, was aus Prozesssicht die beste Vorgehensweise ist, wenn ein zentraler Server eine Gruppe trainierter Algorithmen verbindet.

Die richtige Antwort auf solche Fragen kann für jedes Unternehmen und sogar jede Abteilung anders aussehen. Deshalb würde uns interessieren: Vor welchen Herausforderungen stehen Sie gerade? Was sind Ihre Ziele? Und wie wollen Sie diese erreichen?

Bardia Zanganeh

Bardia M. Zanganeh

Senior Business Development Manager
Ansprechpartner für die Schweiz Bardia.Zanganeh@zuehlke.com +41 43 216 6788

Bardia M. Zanganeh ist verantwortlich für die Life Sciences und Healthcare Practice in der Schweiz. Er arbeitet mit führenden Gesundheitseinrichtungen an deren wichtigsten technologischen Herausforderungen. Sein Fokus liegt auf digitale Innovation, Geschäftsmodelltransformation und Produktinnovation. Dabei befähigt er seine Kunden in der Medizintechnik, Pharma und im Spitalwesen während Definition, Planung und Umsetzung strategischer Vorhaben. Er bringt seine Erfahrungen als Ingenieur, Unternehmensberater und Unternehmer ein und ist Dozent an der Hochschule für Wirtschaft in Zürich.