Persönlichkeit aus Facebooklikes

Buffl

Differenzielle Psychologie

von Sina M.

Was ist Big Data?

Artikel “PK aus Facebooklikes”

Idee
Datengrundlage für Einschätzung der PK
Kalkulation und das Problem des Overfitting erklären

Big Data = digitaler Fußabdruck

-> Daten liegen in großer Masse unstrukturiert vor.

-> Datenmenge wächst schnell.

Artikel “PK aus Facebooklikes”

Idee = Algorithmus auf Facebook soll PK vorhersagen

Testleitung = Cambridge Analytica (& Co.)

Datengrundlage für die Einschätzung der PK:

Persönlichkeitsprofil (Ergebnis eines PK-Tests in einer App)
Selbstbericht 100 Items & Fremdbericht NUR 10 Items
Facebooklikes - Anzahl der gesammelten Likes pro Testperson variiert

Algorithmus, Selbstbericht und Fremdbericht werden mit dem Ergebnis aus dem Big 5 Test verglichen.

Diese Informationen wurden (werden?) gezielt eingesetzt, um Werbung effizienter zu gestalten. Auch für den Wahlkampf nutzen die Republikaner die Daten.

Kalkulation: Muliplikatives Modell

Problem: exterm viele unterschiedliche Likes, d.h. hunderttausende Prädikatoren xi

=> Overfitting

= Überanpassung der Daten führt zu schlechteren Vorhersagen

& Vergleichbarkeit is nicht mehr gegeben, Auswertung der Testdaten lässt sich nicht auf andere Stichproben übertragen

trainings data = the subset of original data that trains the machine to learn the model

test data = used to check the accurancy of a model

Bias = Abweichung des Modells zum Trainings-Datensatz

Varianz = Abweichung des Modells zum Test-Datensatz

Entscheidende Frage: Wie viele Prädikatoren brauche ich?

Welche Anzahl ist ökonomisch sinnvoll? Wie viel Unterschied macht ein einzelner Prädikator?

Welche Dimension der Big 5 kann der Algorithmus / kann der Fremdbericht am besten vorhersagen?
Computer besser als Fremdbericht / Freunde / Familie?
Realistic accuracy model erläutern
Vorteile Fremdbericht vs. Computer

Der Algorithmus kann Offenheit am besten vorhersagen. Wohingegen der Fremdbericht besonders große Schwierigkeiten hat, diese Dimension richtig zu messen. Denn Interessen sind schwer zu beobachten und werden unmissverständlich durch Likes ausgedrückt.

Der Algortihmus schneidet bei Neurotizismus am schlechtesten ab, denn diese Dimension bezieht sich auf innere Prozesse.

Der Fremdbericht misst Extraversion am besten.

Allgemein gilt: Algorithmus / Computer > Fremdbericht

Computer besser als Fremdbericht / Freunde / Familie?

Algorithmus wird besser mit steigenden Likes und braucht im Schnitt nur 100 Likes, um durchschnittliche menschliche Antwort zu übertreffen.

ABER:

Algorithmus = Form des Selbstberichts, man selbst macht die Likes -> daher stimmt der Algorithmus irgendwann besser mit dem Selbstbericht überein als der Fremdbericht

D.h. der Computer schätzt die PK / die Big 5 der Testperson nicht zwingend besser ein, sondern gibt eine Schätzung ab, die besser mit d. Selbsteinschätzung der Testperson übereinstimmt.

Zudem bildet der Fremdbericht ggf. einen wahren Teil der PK ab, der im Selbstbericht fehlt.

Erinnerung - GOLDSTANDARD der PK:Wahre PK = Mischung aus Selbst- und Fremdbericht

Realistic accuracy model

= Realistisches Genauigkeitsmodell

Grundidee:

Eine vollständige Genauigkeit kann nicht erreicht werden. Die Beurteilung der PK eines Menschen ohne Fehler ist nicht möglich.

Personality der zu beurteilenden Person ->

Revelance = die zu beurteilende Person muss ihr Empfinden / Erleben ausdrücken, damit es erkennbar wird.

Availability = dieser Ausdruck / dieses Verhalten muss dann gezeigt weren, wenn Personen dabei sind und es theoretisch beobachten können.

Detection = das Umfeld / die Personen müssen das Verhalten wahrnehmen.

Utilization = die Information / das Verhalten muss richtig interpretiert werden.

-> Judgement des Umfelds

=> Auf diesem Weg entstehen Fehler, die eine perfekte Genauigkeit unmöglich machen.

Vorteile Fremdbeurteilung:

Menschen können unterschwellige Clues wahrnehmen / zwischen den Zeilen lesen.

-> soziale Kompetenzen (emotionale Intelligenz, Empathie, etc.)

Vorteile Algorithmus:

mehr Speicherkapazität, weniger gebiased, wird nie müde, etc.

WDH. externale Validität erklären
Wie gut kann die selbst- / fremd- / computerberichtete PK andere Kriterien vorhersagen?
“Umweg über die PK” erläutern

External Validity =applying the conclusions of a scientific study

outside the context of that study.

Externale Validität = Generalisierbarkeit und Repräsentativität

von Untersuchungsergebnissen.

Es liegt eine hohe externale Validität vor.

-> getestet über die Korrelation der

selbst- / fremd- / computerberichtete PK mit externen Kriterien.

Wie gut kann die selbst- / fremd- / computerberichtete PK andere Kriterien vorhersagen?

Selbstbericht am treffsichersten, denn externale Kriterien sind i.d.R. auch self-reported

Es gibt 3 Ausnahmen:

Field of study
Social network activities
Substance use

Vorhersagen über andere Kriterien werden auf Basis der

Informationen über die PK / die Big 5 gemacht.

Warum dieser “Umweg über die Persönlichkeit”?

-> Micro-Targeting = gezielte Kommunikation mit Nachrichten, die auf bestimmte Charakteristika einer Person zugeschnittenen sind, um damit beispielsweise das Wahl- oder Kaufverhalten zu beeinflussen. (zB Werbung)

Fazit zum Artikel

Kritik:

unklar welche Rolle die PK in politischen Social-Media Werbekampagnen spielt
unklar welche Rolle gezielte Werbung bei Cambridge Analytica spielt

=> Der tatsächliche Einfluss von Social Media Manipulation ist nicht gut erforscht, Kausalschlüsse oft fragwürdig. (betrifft zB auch fake news - welchen Einfluss haben sie tatsächlich?)

Ethische Perspektive:

Vorteil: selbst ungenaue Vorhersagen über die PK und weitere Kriterien können hilfreich sein, wenn eine große Menge an Personen schnell & günstig erreicht werden kann

=> neue Technologien eröffnen neue Möglichkeiten

Beitreten

Vorschau

Author

Sina M.

Informationen

Zuletzt geändert
vor einem Jahr

Kurs melden