Utility Meets Privacy: Beitrag im IEEE Access Journal veröffentlicht

12 März 2025

Der Schutz sensibler Daten war schon immer ein Anliegen und hat mit der zunehmenden Erfassung und Analyse digitaler Daten noch an Bedeutung gewonnen. Sensible Daten sind definiert als Informationen, die zur direkten oder indirekten Identifizierung einer Person verwendet werden können. Gleichzeitig wird die gemeinsame Nutzung von Daten für Analysen, insbesondere für maschinelles Lernen, zu einem entscheidenden Aspekt innovativer geschäftlicher und sozialer Anwendungen.

Sensible Daten werden von Regierungen, dem Militär, Geheimdiensten, dem Gesundheitswesen und Industrieunternehmen gesammelt und geschützt. Vor allem im Gesundheitswesen verspricht das maschinelle Lernen bahnbrechende Vorteile, aber Bedenken hinsichtlich des Datenschutzes stehen der gemeinsamen Nutzung von Daten im Wege und behindern den Fortschritt von Forschern und Branchenexperten.

Synthetische Daten werden daher zunehmend als praktikable Lösung für die Erstellung künstlicher Analoga sensibler Datensätze anerkannt, um die gemeinsame Nutzung von Daten zu Analysezwecken zu erleichtern, ohne die Privatsphäre zu gefährden oder gegen Datenschutzbestimmungen zu verstoßen. Die Grundvoraussetzung ist, dass synthetische Daten nicht realen Personen oder Subjekten entsprechen, wodurch das Risiko der Offenlegung sensibler Informationen verringert wird. Um die Nützlichkeit synthetischer Daten zu gewährleisten, muss ihre Leistung durch den Vergleich ihrer Genauigkeit bei bestimmten analytischen Aufgaben mit der des realen Datensatzes bewertet werden. Je genauer die Ergebnisse der synthetischen Daten mit denen des realen Datensatzes übereinstimmen, desto größer ist ihr Nutzen. In seiner Studie analysiert  Julian Höllig viele Gesundheitsdatensätze und -synthesizer, um groß angelegte, vergleichbare Bewertungsergebnisse zu erhalten. Außerdem führt er einen neuartigen Nutzerdatenschutz-Score ein, der ein Datenschutzmaß in die Bewertung integriert und den Kompromiss zwischen beiden quantifiziert.

Mehr über diesen Beitrag: https://ieeexplore.ieee.org/document/10918632


Bildquelle: AdobeStock/Anatthaphon (Generiert mit KI)

 

< Zur Newsübersicht