Buffl

Persönlichkeit aus Facebooklikes

SM
von Sina M.

Was ist Big Data?

Artikel “PK aus Facebooklikes”

  • Idee

  • Datengrundlage für Einschätzung der PK

  • Kalkulation und das Problem des Overfitting erklären

Big Data = digitaler Fußabdruck

-> Daten liegen in großer Masse unstrukturiert vor.

-> Datenmenge wächst schnell.

Artikel “PK aus Facebooklikes”

Idee = Algorithmus auf Facebook soll PK vorhersagen

Testleitung = Cambridge Analytica (& Co.)

Datengrundlage für die Einschätzung der PK:

  • Persönlichkeitsprofil (Ergebnis eines PK-Tests in einer App)

  • Selbstbericht 100 Items & Fremdbericht NUR 10 Items

  • Facebooklikes - Anzahl der gesammelten Likes pro Testperson variiert

Algorithmus, Selbstbericht und Fremdbericht werden mit dem Ergebnis aus dem Big 5 Test verglichen.

Diese Informationen wurden (werden?) gezielt eingesetzt, um Werbung effizienter zu gestalten. Auch für den Wahlkampf nutzen die Republikaner die Daten.

Kalkulation: Muliplikatives Modell

Problem: exterm viele unterschiedliche Likes, d.h. hunderttausende Prädikatoren xi

=> Overfitting

= Überanpassung der Daten führt zu schlechteren Vorhersagen

& Vergleichbarkeit is nicht mehr gegeben, Auswertung der Testdaten lässt sich nicht auf andere Stichproben übertragen

trainings data = the subset of original data that trains the machine to learn the model

test data = used to check the accurancy of a model

Bias = Abweichung des Modells zum Trainings-Datensatz

Varianz = Abweichung des Modells zum Test-Datensatz

Entscheidende Frage: Wie viele Prädikatoren brauche ich?

Welche Anzahl ist ökonomisch sinnvoll? Wie viel Unterschied macht ein einzelner Prädikator?

  • Welche Dimension der Big 5 kann der Algorithmus / kann der Fremdbericht am besten vorhersagen?

  • Computer besser als Fremdbericht / Freunde / Familie?

  • Realistic accuracy model erläutern

  • Vorteile Fremdbericht vs. Computer


Der Algorithmus kann Offenheit am besten vorhersagen. Wohingegen der Fremdbericht besonders große Schwierigkeiten hat, diese Dimension richtig zu messen. Denn Interessen sind schwer zu beobachten und werden unmissverständlich durch Likes ausgedrückt.

Der Algortihmus schneidet bei Neurotizismus am schlechtesten ab, denn diese Dimension bezieht sich auf innere Prozesse.

Der Fremdbericht misst Extraversion am besten.

Allgemein gilt: Algorithmus / Computer > Fremdbericht


Computer besser als Fremdbericht / Freunde / Familie?

Algorithmus wird besser mit steigenden Likes und braucht im Schnitt nur 100 Likes, um durchschnittliche menschliche Antwort zu übertreffen.

ABER:

Algorithmus = Form des Selbstberichts, man selbst macht die Likes -> daher stimmt der Algorithmus irgendwann besser mit dem Selbstbericht überein als der Fremdbericht

D.h. der Computer schätzt die PK / die Big 5 der Testperson nicht zwingend besser ein, sondern gibt eine Schätzung ab, die besser mit d. Selbsteinschätzung der Testperson übereinstimmt.

Zudem bildet der Fremdbericht ggf. einen wahren Teil der PK ab, der im Selbstbericht fehlt.

Erinnerung - GOLDSTANDARD der PK:Wahre PK = Mischung aus Selbst- und Fremdbericht



Realistic accuracy model

= Realistisches Genauigkeitsmodell

Grundidee:

Eine vollständige Genauigkeit kann nicht erreicht werden. Die Beurteilung der PK eines Menschen ohne Fehler ist nicht möglich.


Personality der zu beurteilenden Person ->

Revelance = die zu beurteilende Person muss ihr Empfinden / Erleben ausdrücken, damit es erkennbar wird.

Availability = dieser Ausdruck / dieses Verhalten muss dann gezeigt weren, wenn Personen dabei sind und es theoretisch beobachten können.

Detection = das Umfeld / die Personen müssen das Verhalten wahrnehmen.

Utilization = die Information / das Verhalten muss richtig interpretiert werden.

-> Judgement des Umfelds

=> Auf diesem Weg entstehen Fehler, die eine perfekte Genauigkeit unmöglich machen.


Vorteile Fremdbeurteilung:

Menschen können unterschwellige Clues wahrnehmen / zwischen den Zeilen lesen.

-> soziale Kompetenzen (emotionale Intelligenz, Empathie, etc.)


Vorteile Algorithmus:

mehr Speicherkapazität, weniger gebiased, wird nie müde, etc.


Author

Sina M.

Informationen

Zuletzt geändert