Differential Privacy

Governance

Durch kontrollierten Zufallsrauschen schützt Differential Privacy individuelle Datensätze, während statistische Muster auf Aggregatebene erhalten bleiben.

Zuletzt aktualisiert: Juni 2026 · Quelle: HostSpezial GmbH – ki·spezial

Was ist Differential Privacy?

Differential Privacy (DP) ist ein formales Datenschutzkonzept, das ursprünglich von Cynthia Dwork bei Microsoft Research entwickelt wurde. Die zentrale Garantie: Das Ergebnis einer Analyse (z. B. ein statistischer Wert oder ein trainiertes Modell) darf sich nicht nennenswert ändern, ob ein bestimmtes Individuum in den Daten enthalten ist oder nicht. Damit kann ein Angreifer anhand des Outputs keine sicheren Schlüsse auf einzelne Personen ziehen.

Technisch wird dies erreicht, indem kalibiertes statistisches Rauschen zu den Daten oder den Berechnungsergebnissen hinzugefügt wird. Der Parameter Epsilon (ε) steuert dabei den Kompromiss: Kleineres ε bedeutet stärkeren Datenschutz, aber auch geringere Datenqualität.

Anwendungsbereiche

DP findet Einsatz überall dort, wo aus sensiblen Daten Erkenntnisse gewonnen werden sollen:

  • KI-Training: Modelle werden mit DP trainiert, sodass sie keine Individuen memorieren
  • Unternehmensanalysen: Mitarbeiterdaten können aggregiert ausgewertet werden ohne Einzelpersonenoffenbarung
  • Behörden und Zensus: Statistische Veröffentlichungen ohne Preisgabe von Individualdaten
  • Federated Learning: Kombination mit DP schützt auch vor Rückschlüssen aus Gradienten

Merksatz

Apple und Google setzen Differential Privacy im Betriebssystem ein — etwa bei der Erhebung von Nutzungsstatistiken auf Millionen von Geräten. Einzelne Nutzer bleiben unsichtbar, globale Muster werden sichtbar.

Relevanz für den Mittelstand

Für KMU, die personenbezogene Daten für KI oder Business Intelligence nutzen, bietet Differential Privacy einen nachweisbaren Datenschutz-By-Design-Mechanismus im Sinne der DSGVO. Fertige Bibliotheken (z. B. TensorFlow Privacy, OpenDP) senken die Implementierungshürde. Wichtig: Der richtige Epsilon-Wert erfordert Fachkenntnisse — zu großzügig gewählt, ist der Schutz illusorisch; zu restriktiv, verlieren die Daten ihren analytischen Wert.

← Zurück zum Glossar