#ML 4 Health
Insights

Federated Learning macht geschützte Patientendaten für medizinische Forschung nutzbar

By Philipp Morf & Tobias Joppe &

In diesem Artikel beleuchten wir mögliche Use Case Scenarios für die Anwendung von Federated Learning in der medizinischen Forschung. Die Methode hilft bei der Überwindung von Data Biases und ermöglicht es Organisationen, Modellparameter gemeinsam zu nutzen, ohne Daten direkt preiszugeben.

Insight in brief

  • Die Covid-19-Pandemie zeigt eindrücklich, wie jahrzehntelange Lagerkämpfe überwunden werden können und eine erfolgreiche Zusammenarbeit zwischen unterschiedlichsten Marktteilnehmern möglich wird.
  • Aus technologischer Sicht liefern neue Ansätze in Data Science und Machine Learning zentrale Bausteine zu wirkungsvollen Lösungen im Gesundheitsbereich.
  • In diesem Artikel beleuchten wir mögliche Use Case Scenarios für die Anwendung von Federated Learning in der medizinischen Forschung.

Die Medizin hat in den vergangenen Jahrzehnten große Fortschritte gemacht. Die Chancen etwa, eine Krebserkrankung zu überleben, sind heute besser denn je. Auch viele Infektionskrankheiten, die früher ein Menschenleben vorzeitig beendet oder zumindest stark beeinträchtig hätten, sind heute nahezu ausgerottet. Und doch ist die Menschheit noch weit davon entfernt, jeder Krankheit ein probates Mittel entgegensetzen zu können. Ob neue Virusvarianten oder die tausenden, bisher unheilbaren seltenen Erkrankungen – um weiterhin Therapiedurchbrüche zu erreichen, müssen Forschung und Entwicklung intensiviert werden und über Unternehmensgrenzen hinweg gemeinsam stattfinden.

Die Covid-19-Pandemie zeigt eindrücklich, wie jahrzehntelange Lagerkämpfe überwunden werden können und eine erfolgreiche Zusammenarbeit möglich wird. Aus technologischer Sicht liefern neue Ansätze in Data Science und Machine Learning zentrale Bausteine zu wirkungsvollen Lösungen im Gesundheitsbereich.

Dass Vernetzung und Datenaustausch in der Medizin grundsätzlich funktionieren können und gewollt sind, zeigt das von der EU geförderte Projekt Melloddy – Machine learning ledger orchestration for drug discovery. Dabei wird Machine Learning zur Effektivitäts- und Effizienzsteigerung in der Wirkstoffforschung verwendet. Mehr als eine Milliarde privater und wettbewerbsbezogener Daten zur Wirkstoffforschung werden dabei strukturiert, verknüpft und der unternehmensübergreifenden Analyse zugänglich gemacht. Über eine sichere Plattform können die bisher zehn teilnehmenden pharmazeutischen Unternehmen Informationen aus wettbewerbskritischen Daten verwenden, ohne dass die Daten des einen Unternehmens für die anderen einsehbar sein müssen.

Datenschutz als Dilemma der medizinischen Forschung

Eine solche Kooperation in der Datennutzung über Unternehmens- und Ländergrenzen hinweg kann ein mächtiger Hebel sein. Doch Melloddy ist erst der Anfang und noch eher Ausnahme als Regel. Zwar wird das enorme Potential der Verknüpfung von F&E-Datensilos für die Medikamentenforschung bei allen Playern erkannt, doch oft dürfen und wollen weder pharmazeutische Unternehmen noch Kliniken oder andere Forschungseinrichtungen ihren Datenbesitz teilen – etwa, weil es die Gesetze ihres Landes verbieten oder weil sie die eigenen Data Assets vor den Augen des Wettbewerbs schützen müssen. Im Zweifel bleiben also für die medizinische Forschung wichtige Daten ungenutzt. Einen technologischen Ausweg aus diesem Dilemma bietet das sogenannte Federated Learning.

Federated Learning bedeutet, dass Machine-Learning-Modelle dezentral trainiert und eingesetzt werden, ohne dass Daten „eingesammelt“ und zentral gespeichert werden müssen.

Ein solches Vorgehen unter dem Motto „bringing code to data“ wurde ursprünglich zur Entlastung zentraler Ressourcen zur Datenverarbeitung entwickelt. In Zeiten unbegrenzter Rechenkapazitäten durch Cloud-Computing spielt die Rechenleistung allerdings eine untergeordnete Rolle. Für die medizinische Forschung ist ein anderer grundlegender Aspekt des Federated Learning von größerer Bedeutung: die Überwindung von „Data-Biases“. Stehen insgesamt mehr Daten für die Forschung zur Verfügung, können inhärente Verzerrungen kleiner Datensätze eliminiert werden.

Federated Learning DE
Graphic Element - Green Z outline

Verknüpfung von Patientendaten in Kliniken

Ein Beispiel für den Einfluss von Data Privacy auf die medizinische Forschung sind die in Krankenhäusern erhobenen und gespeicherten Patientendaten: Diese Daten sind wertvoll für die Forschung – vor allem, wenn sie mit den Daten aus anderen Krankenhäusern zusammen betrachtet werden. Denn der Datenumfang eines einzelnen Krankenhauses ist für sich genommen statistisch oft nicht aussagekräftig genug. „Störfaktoren“ wie ein regionaler demografischer Bias (z. B. genetischer Hintergrund) können das Ergebnis verfälschen. Die Daten mit vielen anderen Kliniken zu teilen bzw. einen Daten-Pool zu erstellen, kommt aus den bereits erwähnten rechtlichen Einschränkungen bzw. in Hinblick auf Data Privacy jedoch oft nicht infrage.

Federated Learning kann dieses Problem lösen, weil es das Machine-Learning-Modell auf das Kliniksystem bringt, es dort vor Ort mit den lokalen Daten trainiert und dann das Kliniksystem wieder verlässt. Damit wird nur das Ergebnis, ein aktualisiertes und besser trainiertes Modell, nicht aber die Datenbasis, für die Betreiber und „Trainierer“ des Modells sicht- bzw. nutzbar. Federated Learning ermöglicht es also, Daten für die Forschung zu nutzen, ohne sie explizit preiszugeben. Die Rohdaten sind damit nach wie vor nur von den Kliniken selbst einsehbar, d. h. die Daten-Assets bleiben geschützt. Damit steigt letztlich auch der Wert einzelner, lokal erhobener kleiner Datensätze, weil sie im Kontext der Daten anderer Teilnehmer einen Mehrwert erzielen.

Verknüpfung von Studienzentrendaten für Orphan Diseases

Ein weiteres Nutzungsszenario von Federated Learning könnte in der Erforschung und Entwicklung von Therapien für seltene Erkrankungen (Orphan Diseases) liegen, von denen es in der EU rund 5.000 bis 8.000 gibt. Der Großteil von Ihnen kann nicht ursächlich therapiert werden – es gibt noch keine Heilung.

Eine wesentliche Herausforderung für die Forschung zu seltenen Erkrankungen: Patienten mit seltenen Erkrankungen leben oft weit verstreut. Klinische Studien sind unter diesen Bedingungen für alle Beteiligten eine besondere Herausforderung. Im Rahmen von virtuellen klinischen Studien könnte auch hier Federated Learning als Enabler fungieren. So werden Daten, die weltweit am jeweiligen Heimatort der Patienten und rund um die Uhr erhoben werden, für die Erforschung neuer Wirkstoffe und Therapien nutzbar gemacht. Diese kleinen Datenkohorten können so parallel in verschiedenen Studien verwendet werden. Für Data Privacy und eine performante Nutzung der Ergebnisse über Unternehmen hinweg sorgt wiederum Federated Learning. 

2 diagonalestriche lightgray

Verknüpfung von Medical-Grade-Wearables-Daten

Das Internet of Things ist zu einer wichtigen Datenquelle im Bereich Healthcare geworden. Die medizinische Anwendung sogenannter Medical Grade Wearables, meist als Kombination aus App und Hardware, erstreckt sich von Disease-Management-Lösungen über Telehealth-Applikationen bis hin zur Behandlung chronischer Krankheiten oder Altenpflege. Allerdings bilden Wearables isolierte Dateninseln: Die gesammelten Daten verbleiben aus Datenschutz- und Datensicherheitsgründen auf Ebene des Gerätes.

Zudem ist die Rechenleistung der einzelnen Geräte begrenzt. Federated Learning kann helfen, diese Limitierungen zu neutralisieren, und die auf den Wearables gespeicherten Patientendaten für die Wirkstoffforschung oder die Verbesserung von Behandlungskonzepten nutzbar zu machen.

Voraussetzung für den Einsatz von Federated Learning im Bereich Wearables ist jedoch die Überbrückung der begrenzten Rechnerleistung der Geräte. Dies könnte durch eine Aufteilung der Berechnung der Netzwerk-Layers zwischen dem Wearable und dem zentralen Server geschehen. Dies würde ermöglichen, dass der zentrale Server die Hauptrechenleistung übernehmen kann, aber dennoch die Data Privacy sichergestellt bleibt [1].

Damit würde eine neue Datenquelle für verschiedene Parteien des Healthcare-Systems erschlossen und nicht nur für Big-Tech- Player zur Forschung und Entwicklung neuer Medikamente. Hieraus könnten für Patienten zudem neue Einnahmequellen für das Teilen ihrer Healthcare-Daten entstehen.

2 diagonalestriche lightgray

Zühlke unterstützt Sie beim Aufbau Ihrer Federated Learning Lösung

Federated Learning hat das Potenzial zum Game-Changer im Bereich Healthcare, da es die Gewinnung von Erkenntnissen aus bereits erhobenen Daten ermöglicht und damit die Entwicklung neuer, besserer Medikamente. Deutlich wird, dass Federated Learning ein Plattformthema ist, das interdisziplinär und weitsichtig angegangen werden muss. Das betrifft sowohl technologische und prozessuale als auch organisatorische und rechtliche Aspekte.

Um eine tragfähige Federated-Learning-Lösung zu realisieren, die echten Mehrwert für die Medizin bringt, braucht es viel Erfahrung in der Entwicklung und Umsetzung von regulierter KI und Medical Grade Machine Learning. Es erfordert insbesondere die Fähigkeit, Spitzen-Know-how aus den Bereichen Medical, Regulatory, Data Science sowie Soft- und Hardware Engineering zu kombinieren. Genau hier setzt Zühlke an. Federated Learning ermöglicht es, über Silos hinweg einen Datenschatz zu heben, der am Ende den Patienten zugutekommt – ohne Kompromisse bei Sicherheit und Data Privacy eingehen zu müssen.

[1] Yuan, B., Ge, S., Xing, W. (2020). A Federated Learning Framework for Healthcare IoT Devices. arXiv preprint arXiv:2005.05083, 2020 - arxiv.org

Philipp Morf

Philipp Morf

Director Solution Center
Ansprechpartner für die Schweiz

Dr. Philipp Morf ist promovierter Ingenieur ETH und leitet seit 2015 Bereich Artificial Intelligence (AI) und Machine Learning (ML) Lösungen bei Zühlke. Als Director des AI Solutions Centers konzipiert er effektive AI/ML Anwendungen und ist ein gefragter Redner zu AI-Themen im Bereich Anwendungen und Anwendungstrends. Mit seiner langjährigen Erfahrung als Berater im Bereich Innovationsmanagement schlägt er die Brücke zwischen Business, Technologie und den Menschen als Anwender von AI.

philipp.morf@zuehlke.com +41 43 216 6588
Tobias Joppe

Tobias Joppe

Senior Business Solution Manager
Ansprechpartner für Deutschland

Tobias Joppe hat Automatisierungs- und Regelungstechnik an der TU Braunschweig studiert und war zuletzt Leiter eines Innovationsteams bei der Siemens AG. Seit 2008 ist er bei Zühlke, ist Partner und verantwortet als Senior Business Solution Manager den Trend Lead Data Science in Deutschland. In seiner Rolle baut er die Brücke zwischen Spitzentechnologie und aktuellen Kundenbedürfnissen. Gemeinsam mit Kunden übersetzt er Visionen und Ziele in eine strategische Roadmap und konkretes Projektvorgehen. Viele realisierte, interdisziplinäre Projekte bilden dabei die Basis seine Erfahrung.

tobias.joppe@zuehlke.com +49 511 220 021 43