Welche Farbskalen sind möglich?
-> Sequenzielle
Sequenzielle:
geeignet für metrisch oder ordinal skalierte Variablen
Farbverlauf mit einer oder zwei Farben
Hellere Werte normal kleinere Zahlen
-> zeigen eine graduale Zu- oder Abnahme
-> Divergente
Divergente:
ist wie eine sequenzielle Farbskala, mit dem Unterschied, dass die Skala einen Mittelpunkt besitzt
nur sinnvoll, wenn Mittelpunkt inhaltlich interpretierbar ist
-> Betonen Abweichungenvon einem Mittelpunkt
-> Qualititative
Qualitative:
um verschiedene Kategorien zu visualisieren
Farben sollen sich möglichst deutlich unterscheiden und haben keine eigene Zuordnung
-> Unterscheiden Kategorien klar und ohne Reihenfolge
In welcher Struktur müssen die Daten vorliegen, um sie in R sinnvoll weiterzuverarbeiten?
Tidydata wichtig! (im Tidyverse)
Bedeutet:
jede Variable bekommt eine Spalte
jede Beobachtung eine Reihe
in jeder zeile steht nur ein einzelner Messwert
Für welche Arten von Daten eignen sich Liniengrafiken?
Liniengraphen eignen sich für Daten, die miteinander zusammenhängen. Bedeutet, zeitliche Daten, die in einer direkten Beziehung zueinander stehen und etwa einen Verlauf angeben
Wie erstellt man mittels ggplot eine Grafik?
braucht man ein ggplot Objekt und muss definieren welcher Datengrundsatz verwendet wird.
Aesthetics müssen angegegebn werden, also welche Werte auf der X/Y Achse erscheinen sollen
weitere Einstellungen: mit + die Funktionen hinzufügen
Wieso sind Quantifierungen im Journalismus so beliebt?
Durch Zahlen können vergleichbare Ereignisse und Entwicklungen zueinander in einen Kontext gesetzt werden
Zahlen ermöglichen Anschlusskommunikation
durch Quantifizierung werden komplexe Sachverhalte auf wenige Zahlen und Einzelangaben reduziert
Zahlen wirken unpersöhnlich und scheinbar objektiv
Wie sind die Fidelity und der Effort bei dieser Prototyping-Methode
Fidelity (Detailtreue) und der Effort (Arbeit um den Prototypen zu entwickeln) sind bei Skizzen relativ niedrig (wir hatten keine händischen Skizzen, sondern haben über das Tool)
Insgesamt gibt es das Phänomen des Fidelity-Effort-Trade-Of
Bedeutet, je höhere Detailtreue man erreichen möchte, desto mehr Arbeit muss man in die Erstellung des Prototypen steken.
Wireframes, Mockups sind zwar Detailtreurer aber der Aufwand steigt auch stark an
Wie sieht in der Realität das organisatorische Umfeld aus, in dem Datejournalismus stattfindet?
Unterschiede der Organisation zwischen der Deutschen und Internationalen
Deutschen:
In Dt. viele Tageszeitungen und Rundfunkanstalten die datenjournalistische Projekte durchführen
Bei den Ressorts häufig die investigativen Datenressources, gefolgt von Politik und lokalem.
Meistens ist in Dt. nur eine Person zuständig und sehr selten sind es mehr als 4
Je größer das Medium, gibt es auch mehr Teams
häufigster Autraggeber von datenj. Projekten sind Online-Abler von Medienmarken
Internationalen:
Datenjournalismus eingebettet in eigene Datendesks/Investigativressorts
oder auch verbunden mit der IT Graphikabteilung
teilweise sieht man auch einzelne Datenjournalist*innen
häufig Arbeit in Projektteams
gibt auch viel Kooperation über einzelne Organisationsgrenzen hinaus
Grundsätzlich sieht man eine Zweiteilung des Datenjournalismus in den meisten Ländern
Zwischen Leuchtturmprojekten/Leuchtturmredationen (z.B. Guardian, NYTimes,..) und normalen Redaktionen/Journalist*innen
Folgender Datensatz liegt vor. Welche Operationen musst du anwenden?
a) Kernanliegen ist eine neue Spalte zu erstellen. Beim Erstelllen neuer Spalten benutzt man die Funktion “mutate”. Wichtig bei mutate: es wird eine neue Spalte erstellt, die benannt werden muss mit “average speed”. Inhalt der Spalte ist das Ergebnis einer Berechnung. Durchschnitt wird errechnet durch das Teilen der Entfernung durch die Zeit die man braucht (time)
b) Funktion rename. Spalte löschen -> mit Funktion select() und definieren welche Spalten erhalten bleiben sollen oder definieren, dass alles behalten werden soll außer bestimmte Spalten
Was ist Grammar of graphics?
= Konzept um Grafiken formal zu beschreiben
Umsetzung in R durch ggplot
Grafik wird aus ihren Elementen zusammengebaut: Grafiktyp, Daten, Achsen, Legenden, …
Was braucht man, um eine Graphik zu bauen?
ggplot() Basisfunktion für Plots. Hier werden die Daten ausgewählt oder per Pipe-Operator übergeben
ggplot()
+ Weitere Funktionen für den Plot werden nicht mit dem Pipe-Operator angehängt, sondern mit dem Plus
+
geom_XYZ Hier wird der Grafiktyp angegeben. Mehrere können in einer Grafik kombiniert werden, nicht alle Kombinationen sind sinnvoll (line, bar,…)
geom_XYZ
aes() Die Aesthetics mssen in ggplot() global oder in geom_XYZ spezifisch angegeben werden. In der Funktion wird festgelegt welche Variablen des Datensatz für welchen Teil der Grafik eingesetzt werden, z.B. X-Achse, Y-Achse oder farbliche Gruppierungen
aes()
Wie kann ich die Achsen beschriften?
labs() Achsenbeschriftungen und Überschriften
labs()
Welche geom-Diagramme gibt es?
geom_point() → Streudiagramm (Scatterplot)
geom_point()
geom_line() → Liniendiagramm
geom_line()
geom_histogram() → Histogramm (benötigt binwidth)
geom_histogram()
binwidth
geom_bar() → Balkendiagramm für kategoriale Daten
geom_bar()
geom_boxplot() → Boxplot zur Visualisierung von Verteilungen
geom_boxplot()
geom_tile() → Heatmaps (Rechteckige Kacheln)
geom_tile()
geom_polygon() → Polygonformen (z. B. für Karten)
geom_polygon()
Hilfreiche Funktionen für ggplot
facet_wrap(~ Variablenname, nrow = n) Statt einer Gruppierung in einer Grafik werden kleine Grafiken pro Gruppierung erzeugt
facet_wrap(~ Variablenname, nrow = n)
coord_flip() vertauscht X- und Y-Achse
coord_flip()
coord_fixed() Der Abstand auf den Achsen wird vereinheitlicht
coord_fixed()
scale_y_continuous() scale_x_discrete() scale_x_date() Einstellungen für verschiedene Achsentypen
scale_y_continuous()
scale_x_discrete()
scale_x_date()
theme() Auswahl verschiedener Themen, Legendenposition, …
theme()
scale_colour_brewer(palette = ) Auswahl der ColorBrewer Farbskalen
scale_colour_brewer(palette = )
ggsave() Grafiken speichern
ggsave()
Last changed2 days ago