Entwurf

Daten & Infrastruktur

Die Bavarian Health Cloud (BHC) ist eine neu gegründete Forschungsdatenplattform des Freistaats Bayern, die pseudonymisierte Gesundheitsdaten aus bayerischen Universitätsklinika für Wissenschaft und Industrie zugänglich macht. Die zu 100 % staatlich kontrollierte Gesellschaft, geleitet vom Geschäftsführer Stefan Biesdorf, soll Milliarden von Datensätzen wie Diagnosen, Prozeduren, Medikationen und Laborwerte datenschutzkonform und strukturiert bereitstellen. Mit einem Budget von 25 Millionen Euro ist eine erste funktionsfähige Version bis Ende 2026 geplant; zunächst werden Daten der sechs Universitätsklinika genutzt, die jährlich etwa 2,3 Millionen Patienten behandeln. Die Plattform wird später auf weitere Krankenhäuser sowie Ärzte und Pflegeeinrichtungen erweitert und gilt als Vorreiterprojekt in Deutschland mit Potenzial als Blaupause für den europäischen Gesundheitsdatenraum. (Quelle: kma – Wissen für Entscheider, Georg Thieme Verlag, Artikel vom 10. Februar 2026)

„SynTEG: a framework for temporal structured electronic health data simulation“ ist ein wissenschaftlicher Artikel, der 2021 in der Journal of the American Medical Informatics Association (Band 28, Ausgabe 3, Seiten 596–604) von Ziqi Zhang, Chao Yan, Thomas A. Lasko, Jimeng Sun und Bradley A. Malin veröffentlicht wurde. Das Framework SynTEG ermöglicht die Generierung synthetischer, zeitgestempelter Sequenzen von Diagnosecodes aus elektronischen Patientenakten (EHR) mithilfe eines zweistufigen generativen Ansatzes basierend auf rekurrenten Modellen und Wasserstein-GANs. Es löst damit das Problem früherer GAN-basierter Methoden, die zeitliche Aspekte vernachlässigten. Die Evaluation an über 500.000 realen Patientendatensätzen der Vanderbilt University Medical Center zeigte, dass die synthetischen Daten hohe Übereinstimmung in temporalen Merkmalen (z. B. mittleres Auftretenalter und Intervallzeiten mit relativen Differenzen von ca. 4–5 %) sowie in der Vorhersageleistung von Diagnosemodellen (durchschnittliche AUROC-Differenz von 1,6 %) aufweisen. Gleichzeitig erwiesen sich Datenschutzrisiken durch Membership-Inference- und Attribute-Disclosure-Angriffe als vernachlässigbar. Die Autoren schließen, dass SynTEG zeitliche Diagnosesequenzen nutzbringend und unter Wahrung der Privatsphäre simulieren kann.

Datenschlussverkauf. Solidarität in der digitalen Welt ist ein Sachbuch der Politikwissenschaftlerin Barbara Prainsack, das am 12. März 2026 im Verlag Klaus Wagenbach erscheint. Auf 128 Seiten analysiert die Autorin die aktuelle Datenökonomie, in der große Technologiekonzerne durch die Sammlung und Verwertung personenbezogener Daten enorme Profite erzielen, während gesellschaftliche Ungleichheiten zunehmen und selbst offline lebende Menschen betroffen sind. Prainsack plädiert dafür, Datenschutz nicht länger nur als individuelles Abwehrrecht zu begreifen, sondern durch ein Konzept der Solidarität zu ergänzen: Daten sollen fair geteilt, verantwortungsvoll genutzt und durch transparente Regulierungen, Teilhabe und Mechanismen zur Verhinderung von Missbrauch zum gesellschaftlichen Nutzen eingesetzt werden. Barbara Prainsack ist Professorin für Vergleichende Politikfeldanalyse an der Universität Wien und hat bereits mehrere Werke zu Bioethik, Grundeinkommen und Zukunft der Arbeit veröffentlicht.

Der Review-Artikel „How the world of biobanking is changing with artificial intelligence“ von Michaela Th. Mayrhofer erschien am 3. September 2025 in der Zeitschrift Frontiers in Digital Health im Section Ethical Digital Health. Der Beitrag analysiert, wie Künstliche Intelligenz (KI) die Praxis des Biobanking verändert, insbesondere im Umgang mit Daten. Biobanken werden als dynamische Boundary Objects beschrieben, die Biovalue erzeugen, indem sie biologisches Material und Daten in immaterielle Assets der datengetriebenen Bioökonomie umwandeln. Anhand der vier Parameter Größe (size), Ort (site), Geschwindigkeit (speed) und Zugang (access) wird der Einfluss von KI-Technologien untersucht. Der Text beleuchtet historische Entwicklungen des Biobanking, den Wandel zu datenintensiven Infrastrukturen, ethische und regulatorische Herausforderungen sowie den Übergang zu einer data-driven health economy, in der Qualität vor Quantität stehen kann und Kollaborationen essenziell sind.

Die Pressemitteilung „Charité und Schwarz Digits gründen Joint Venture“ vom 20. März 2026 informiert über die Gründung der Schwarz Charité Health Data GmbH als gemeinsames Unternehmen der Charité – Universitätsmedizin Berlin und Schwarz Digits. Ziel ist die sichere Vernetzung und Harmonisierung medizinischer Daten durch die Plattform HIVEPRO, um Fragmentierungen in IT-Systemen zu überwinden und eine bessere Nutzung für Prävention, Forschung und Behandlung zu ermöglichen. Die Gesellschaft wird auf der souveränen STACKIT-Cloud-Infrastruktur betrieben, entspricht europäischen Datenschutzstandards und baut auf Erfahrungen aus Projekten wie HiGHmed auf. Schwarz Digits hält 75 Prozent der Anteile, die Charité 25 Prozent.

Der Artikel „Big data analytics enhanced healthcare systems: a review“ von Sarah Shafqat et al., erschienen 2020 im Journal of Supercomputing, gibt einen umfassenden Überblick über den Einsatz von Big-Data-Analytics in der Gesundheitsversorgung. Er beschreibt, wie moderne Gesundheitssysteme mit großen, heterogenen Datensätzen wie elektronischen Patientenakten und Sensordaten umgehen müssen und warum traditionelle Software- und Hardwarelösungen dafür unzureichend sind. Im Mittelpunkt stehen Algorithmen, Techniken und Tools für Big-Data-Analytics in drahtlosen, Cloud- und Internet-of-Things-Umgebungen sowie deren Potenzial zur Kostensenkung, Verbesserung des Zugangs zur Gesundheitsversorgung und Lebensrettung. Abschließend wird das Konzept eines einheitlichen „SmartHealth“-Systems vorgestellt, das als Konvergenzpunkt verschiedener Plattformen zu einem standardisierten lernenden Gesundheitssystem der Zukunft beitragen soll.

Der Artikel „Privacy and Security Throughout the Health Data Life Cycle: From Primary Care to Research Networks” von Bradley A. Malin, Chao Yan und Luca Bonomi wurde am 24. März 2026 als frühe Veröffentlichung in der Annual Review of Biomedical Data Science publiziert. Die Autoren untersuchen die Risiken und Schutzmaßnahmen im gesamten Lebenszyklus von Gesundheitsdaten, beginnend bei der Datengenerierung in der Primärversorgung bis hin zur sekundären Nutzung in Forschungsnetzwerken und KI-Modellentwicklung. Der Beitrag beleuchtet regulatorische, organisatorische und technologische Rahmenbedingungen sowie technische Ansätze wie Zugriffskontrolle, Differential Privacy und synthetische Datengenerierung zur Risikominderung. Zudem werden Herausforderungen bei der Skalierung dieser Methoden und die Abwägung zwischen Datenschutz und Datenutilität thematisiert.

„Synthetic data, synthetic trust: navigating data challenges in the digital revolution“ ist ein Viewpoint-Artikel, der im November 2025 in der Zeitschrift The Lancet Digital Health erschienen ist. Die Autoren Arman Koul, Deborah Duran und Tina Hernandez-Boussard warnen vor den Risiken einer unkritischen Verwendung synthetischer Daten beim Training medizinischer KI-Modelle. Obwohl synthetische Daten Datenschutzprobleme lösen und begrenzte reale Datensätze ergänzen können, besteht die Gefahr, dass sie bestehende Verzerrungen verstärken, die Generalisierbarkeit von Modellen verringern und zu einer sogenannten „synthetic trust“ – einer unbegründeten Zuversicht in die klinische Validität solcher Modelle – führen. Der Artikel plädiert für strikte Safeguards, darunter klare Standards für Trainingsdaten, Fragilitätstests während der Entwicklung sowie transparente Angaben zur synthetischen Herkunft bei der Anwendung, um die Integrität und Fairness klinischer KI-Anwendungen zu gewährleisten.

Das in der Zeitschrift npj Digital Medicine veröffentlichte Scoping Review mit dem Titel „A scoping review on using real-world data to evaluate the effectiveness of mHealth applications“ untersucht, inwieweit natürlich entstehende Real-World-Daten (RWD) aus dem Routinebetrieb patientenorientierter mHealth-Apps in peer-reviewed Studien zur Bewertung der Wirksamkeit genutzt werden. Die Analyse von 72 Studien zu 61 verschiedenen Anwendungen zeigt, dass der Großteil der Untersuchungen auf mentaler Gesundheit und metabolischen Erkrankungen fokussiert und überwiegend auf aktiv durch Nutzer eingegebene Daten (insbesondere In-App-Surveys) zurückgreift. Gerätegenerierte Daten werden seltener verwendet, Systemdaten wie EHR- oder Claims-Daten nur in Ausnahmefällen. Die meisten Studien weisen niedrige Evidenzlevel auf und basieren auf Single-Group-Pre-Post-Designs ohne Vergleichsgruppen; nur wenige Arbeiten setzen vergleichende oder quasi-experimentelle Ansätze ein. Die Review verdeutlicht damit bestehende Lücken bei der Nutzung von RWD für robuste, longitudinale und vergleichende Wirksamkeitsbewertungen von mHealth-Anwendungen.

Der Artikel „Patient Perceptions of Blockchain-Based Health Information Exchange: User-Centered Design Study“ untersucht die Wahrnehmung von Patientinnen und Patienten gegenüber einer blockchainbasierten Lösung zum Austausch von Gesundheitsdaten. Die Studie zeigt, dass Nutzer eine hohe Akzeptanz für Funktionen wie datensouveräne Zugriffssteuerung, Dokumentenaustausch und Transparenz über Datenzugriffe haben, wobei insbesondere Benutzerfreundlichkeit, intuitive Gestaltung und individuelle Faktoren die Nutzung maßgeblich beeinflussen.

Der Artikel „Protecting health data at UK Biobank“ beschreibt die wachsenden Risiken für Datenschutz und Vertrauen im Kontext der UK Biobank. Wiederholte Datenlecks und Re-Identifizierungsrisiken zeigen, dass vermeintlich anonymisierte Gesundheitsdaten verwundbar bleiben. Dies gefährdet nicht nur die Teilnahmebereitschaft der Bevölkerung, sondern auch die Entwicklung verlässlicher KI-Systeme im Gesundheitswesen. Gefordert werden stärkere technische Schutzmaßnahmen, transparente Governance sowie ein kultureller Wandel hin zu mehr Verantwortlichkeit und Offenheit im Umgang mit Datenschutzvorfällen

TippHinweis

Der Text erhebt keinen Anspruch auf Vollständigkeit oder Korrektheit und stellt keine Rechtsberatung dar. Anmerkungen können in der rechten Seitenleiste mit Hypothes.is sozialem Annotierungswerkzeug oder am unteren Ende einer Seite mit GitHub Giscus Diskussionen hinterlassen werden.