Was ist Big Data?
Artikel “PK aus Facebooklikes”
Idee
Datengrundlage für Einschätzung der PK
Kalkulation und das Problem des Overfitting erklären
Big Data = digitaler Fußabdruck
-> Daten liegen in großer Masse unstrukturiert vor.
-> Datenmenge wächst schnell.
Idee = Algorithmus auf Facebook soll PK vorhersagen
Testleitung = Cambridge Analytica (& Co.)
Datengrundlage für die Einschätzung der PK:
Persönlichkeitsprofil (Ergebnis eines PK-Tests in einer App)
Selbstbericht 100 Items & Fremdbericht NUR 10 Items
Facebooklikes - Anzahl der gesammelten Likes pro Testperson variiert
Algorithmus, Selbstbericht und Fremdbericht werden mit dem Ergebnis aus dem Big 5 Test verglichen.
Diese Informationen wurden (werden?) gezielt eingesetzt, um Werbung effizienter zu gestalten. Auch für den Wahlkampf nutzen die Republikaner die Daten.
Kalkulation: Muliplikatives Modell
Problem: exterm viele unterschiedliche Likes, d.h. hunderttausende Prädikatoren xi
=> Overfitting
= Überanpassung der Daten führt zu schlechteren Vorhersagen
& Vergleichbarkeit is nicht mehr gegeben, Auswertung der Testdaten lässt sich nicht auf andere Stichproben übertragen
trainings data = the subset of original data that trains the machine to learn the model
test data = used to check the accurancy of a model
Bias = Abweichung des Modells zum Trainings-Datensatz
Varianz = Abweichung des Modells zum Test-Datensatz
Entscheidende Frage: Wie viele Prädikatoren brauche ich?
Welche Anzahl ist ökonomisch sinnvoll? Wie viel Unterschied macht ein einzelner Prädikator?
Welche Dimension der Big 5 kann der Algorithmus / kann der Fremdbericht am besten vorhersagen?
Computer besser als Fremdbericht / Freunde / Familie?
Realistic accuracy model erläutern
Vorteile Fremdbericht vs. Computer
Der Algorithmus kann Offenheit am besten vorhersagen. Wohingegen der Fremdbericht besonders große Schwierigkeiten hat, diese Dimension richtig zu messen. Denn Interessen sind schwer zu beobachten und werden unmissverständlich durch Likes ausgedrückt.
Der Algortihmus schneidet bei Neurotizismus am schlechtesten ab, denn diese Dimension bezieht sich auf innere Prozesse.
Der Fremdbericht misst Extraversion am besten.
Allgemein gilt: Algorithmus / Computer > Fremdbericht
Algorithmus wird besser mit steigenden Likes und braucht im Schnitt nur 100 Likes, um durchschnittliche menschliche Antwort zu übertreffen.
ABER:
Algorithmus = Form des Selbstberichts, man selbst macht die Likes -> daher stimmt der Algorithmus irgendwann besser mit dem Selbstbericht überein als der Fremdbericht
D.h. der Computer schätzt die PK / die Big 5 der Testperson nicht zwingend besser ein, sondern gibt eine Schätzung ab, die besser mit d. Selbsteinschätzung der Testperson übereinstimmt.
Zudem bildet der Fremdbericht ggf. einen wahren Teil der PK ab, der im Selbstbericht fehlt.
Erinnerung - GOLDSTANDARD der PK:Wahre PK = Mischung aus Selbst- und Fremdbericht
Realistic accuracy model
= Realistisches Genauigkeitsmodell
Grundidee:
Eine vollständige Genauigkeit kann nicht erreicht werden. Die Beurteilung der PK eines Menschen ohne Fehler ist nicht möglich.
Personality der zu beurteilenden Person ->
Revelance = die zu beurteilende Person muss ihr Empfinden / Erleben ausdrücken, damit es erkennbar wird.
Availability = dieser Ausdruck / dieses Verhalten muss dann gezeigt weren, wenn Personen dabei sind und es theoretisch beobachten können.
Detection = das Umfeld / die Personen müssen das Verhalten wahrnehmen.
Utilization = die Information / das Verhalten muss richtig interpretiert werden.
-> Judgement des Umfelds
=> Auf diesem Weg entstehen Fehler, die eine perfekte Genauigkeit unmöglich machen.
Vorteile Fremdbeurteilung:
Menschen können unterschwellige Clues wahrnehmen / zwischen den Zeilen lesen.
-> soziale Kompetenzen (emotionale Intelligenz, Empathie, etc.)
Vorteile Algorithmus:
mehr Speicherkapazität, weniger gebiased, wird nie müde, etc.
WDH. externale Validität erklären
Wie gut kann die selbst- / fremd- / computerberichtete PK andere Kriterien vorhersagen?
“Umweg über die PK” erläutern
External Validity =applying the conclusions of a scientific study
External Validity =
applying the conclusions of a scientific study
outside the context of that study.
Externale Validität = Generalisierbarkeit und Repräsentativität
Externale Validität =
Generalisierbarkeit und Repräsentativität
von Untersuchungsergebnissen.
Es liegt eine hohe externale Validität vor.
-> getestet über die Korrelation der
selbst- / fremd- / computerberichtete PK mit externen Kriterien.
Selbstbericht am treffsichersten, denn externale Kriterien sind i.d.R. auch self-reported
Es gibt 3 Ausnahmen:
Field of study
Social network activities
Substance use
Vorhersagen über andere Kriterien werden auf Basis der
Informationen über die PK / die Big 5 gemacht.
Warum dieser “Umweg über die Persönlichkeit”?
-> Micro-Targeting = gezielte Kommunikation mit Nachrichten, die auf bestimmte Charakteristika einer Person zugeschnittenen sind, um damit beispielsweise das Wahl- oder Kaufverhalten zu beeinflussen. (zB Werbung)
Fazit zum Artikel
Kritik:
unklar welche Rolle die PK in politischen Social-Media Werbekampagnen spielt
unklar welche Rolle gezielte Werbung bei Cambridge Analytica spielt
=> Der tatsächliche Einfluss von Social Media Manipulation ist nicht gut erforscht, Kausalschlüsse oft fragwürdig. (betrifft zB auch fake news - welchen Einfluss haben sie tatsächlich?)
Ethische Perspektive:
Vorteil: selbst ungenaue Vorhersagen über die PK und weitere Kriterien können hilfreich sein, wenn eine große Menge an Personen schnell & günstig erreicht werden kann
=> neue Technologien eröffnen neue Möglichkeiten
Zuletzt geändertvor 4 Monaten