Wie wird Informationsfluss definiert?
Fluss von Bits vom Absender zum Empfänger
Absender und Empfänger können Individualpersonen, anonyme Teilnehmer einer Gruppe oder eine anonyme Individualperson sein
Wie definiert sich Privacy als Kontextuelle Integrität?
Privacy als angemessener Informationsfluss
Angemessenheit hängt von Kontext und seinen Normen ab
Informationssammlung und -verteilung sollte für diesen Kontext angemessen sein und den darin enthaltenen Verbreitungsnormen entsprechen
Was verstehen wir unter dem Privacy-Transparency Dilemma?
Wie wird das durch privacy-preserving Techniken geändert?
Höhere Transparenz kommt mit Kosten im Sinne von geringerer Privacy
Anders herum ebenso
Mittels privacy-preserving Techniken, diese lineare Abhängigkeit wird vorteilhaft abgeändert
Höhere Transparenz bei vergleichsweise hoher privacy
Welche Probleme ergeben sich beim Weitergeben von Informationen?
Copy Problem: Kontrollverlust über die Daten nach Weitergabe
Bundling Problem: Information kann selten weitergegeben werden, ohne Kontext bereitzustellen, der weitergegebene Information verifiziert
z.B. fairness eines Algorithmus kann schlecht bewiesen werden, ohne Algorithmus preiszugeben
Recursive Enforcement Problem: Kontrollierende Institutionen müssen wiederum kontrolliert werden (auch im Hinblick auf Privacy Regulierung)
Welche Techniken für PPML haben wir kennengelernt?
Differential Privacy
Homomorphic Encryption
Secure Multiparty Computation
Federated Learning
Was ist die Grundidee von Differential Privacy?
Hinzufügen von Rauschen auf Trainingsdaten, damit Modell von allgemeiner Verteilung der Daten lernt, statt explizite Charakteristiken der einzelnen Datenpunkte verwendet
-> Verbindung zwischen konkreten Daten und Output wird abgeschwächt/entfernt
Was ist die Grundidee von Homomorphic Encryption?
Training auf verschlüsselten Daten, mit ähnlichem Ergebnis wie unverschlüsselt
Daten werden nur an einer Stelle ver- und entschlüsselt
-> Kein Zugriff auf Daten durch Drittinstanz
Problem: Rechenaufwändig und verlangsamt Training
Was ist die Grundidee von Secure Multiparty Computation?
Aufspaltung der Daten auf verschiedene Entitäten, um gemeinsam eine Funktion berechnen zu können
-> Niemand hat Kenntnis über die konkreten Daten, immer nur über Teile jedes Datenpunktes
Was ist die Grundidee von federated Learning?
Pre-processing von Rohdaten auf Ebene der Datenquelle
Nur Ergebnis und Statistik wird an Verarbeiter weitergeben damit diese mit den Ergebnissen anderer Quellen kombiniert werden können
-> sensible Daten gehen nie in Reinform an Verarbeiter
Warum ist Federated Learning Unternehmensübergreifend sozio-technisch?
nicht nur technische Aspekte müssen berücksichtigt werden, sondern auch soziale
Datenwert, Profitallokation, Koalition
neben Technology muss es auch Vertrauen geben
verschiedene Arbeitsweisen müssen zusammengebracht werden
Wo stehen wir momentan mit PPML?
Rechenresourcen werden immer höher - werden auch gebraucht
Schwierig PPML auf große Anwendungen zu skalieren
Es bedarf sehr spezifischem Wissen
Rechtlich tut sich einiges in richtung Privacy enhancing technology
gesellschaftlich wird das Bewusstsein von Datenwert höher
Unternehmen machen mehr privacy by design in ihren Produkten
-> aber gefahr, dass die Macht über die Infrastruktur zu groß wird und Nutzer zu sehr auf Technologie vertrauen
Last changeda year ago