Erkläre
Measure
Eine Aggregation (z.B. Gesamtumsatz), die weiter analysiert werden kann
Bericht
Ein Bericht ist ein integrierter Datensatz von Visualisierungen, der darauf abzielt, während der Datenanalyse Erkenntnisse zu gewinnen
Welche 3 Stufen im Prozess zur Visualisierung gibt es?
Visualisierung auswählen und erstellen
Daten hinzufügen
Daten formatieren
Datenschnitte
Datenschnitte werden verwendet, um dynamisch gezieltere Datensätze auszuwählen, z. B. alle Verkaufstransaktionen für einen bestimmten Kunden oder alle Verkaufstransaktionen für eine bestimmte Region
Kartendiagramm
Ein Kartendiagramm ist eine Visualisierung, die durch die Formatierungsoptionen - Größe und Farbintensität - relative Proportionen zwischen Standorten anzeigen kann und als interaktives Werkzeug für geografische Analysen verwendet werden kann
Unterschied zwischen Landkarte und Flächenkarte
Landkarte
stellt bestimmte geografische Punkte dar, z. B. Adressen
Fächenkarte
stellt Regionen dar, z. B. Staaten, Provinzen und Länder.
das ist:
Das ist:
bedingte Formatierung
(Achtung: Auf der Vorlesung war da ein riesen Stern: obsolet oder extrem wichtig)
Die bedingte Formatierung macht die Formatierung von den Datenwerten abhängig. Sie ist ein hervorragendes Werkzeug, um Muster hervorzuheben und Erkenntnisse zu gewinnen. Die bedingte Formatierung kann auf viele Visualisierungen angewendet werden, darunter: Kartendiagramme, Tabellen, Säulendiagramme
Erkläre den Kreislauf der Datenbeziehungen
Welche Arten von Datenbeziehungen gibt es
nomineller Vergleich
Beschreibt eine Reihe von diskreten quantitativen Werten, die zu Vergleichszwecken verwendet werden können.
Eine nominelle Vergleichsbeziehung vergleicht die Werte einer nominellen Variable anhand der Werte einer zweiten, numerischen Variable. Es soll verglichen werden, welche Variable die größte und welche die kleinste ist, ob eine Kategorie doppelt so groß ist wie eine andere usw.
Balkendiagramme und Säulendiagramme eignen sich hervorragend für diese Zwecke
Wie viele Kunden gibt es pro Staat?
Verteilung
Beschreibt, wie quantitative Werte über einen gesamten Bereich verteilt sind.
Eine Verteilung zeigt, wie die Werte einer numerischen Variable verteilt sind, indem sie den niedrigsten Wert, den höchsten Wert, den Median, den Interquartilsbereich usw. angibt
Das Box-and-Whisker-Diagramm ist hervorragend für diese Zwecke geeignet
Wie verteilen sich die Gehälter auf unsere Mitarbeiter?
Abweichung
Beschreibt, wie sich eine oder mehrere Gruppen von quantitativen Werten von einer Referenzgruppe von Werten unterscheiden.
Eine Abweichung zeigt, wie eine Reihe von Ist-Werten von ihren Referenzwerten, d. h. den budgetierten oder prognostizierten Werten, abweicht.
Wie stark weichen die tatsächlichen Ausgaben der einzelnen Abteilungen von den veranschlagten Ausgaben ab?
Ranking
Beschreibt, wie eine Reihe von quantitativen Werten aufeinander bezogen sind.
Ein Ranking ordnet die Werte einer Variablen sequentiell auf der Grundlage nach den Werten einer zweiten Variablen.
Welches sind die meistverkauften Produkte?
Part to whole
Beschreibt die Zusammensetzung. Wie kann eine Zahl (das Ganze) in kleinere Teile unterteilt werden, wie verhalten sich die Teile zueinander und wie verhalten sich die Teile zum Ganzen?
Eine Part-to-whole Datenbeziehung vergleicht Teile mit dem Ganzen und untersucht, wie die verschiedenen Teile zueinander stehen.
Wie viel trägt jede Region (Teil) zu den Gesamteinnahmen des Unternehmens (insgesamt) bei?
Korrelation
Beschreibt, ob und inwieweit zwei gepaarte Mengen von quantitativen Werten zueinander in Beziehung stehen.
Eine Korrelation gibt an, inwieweit sich zwei Variablen in dieselbe oder in die entgegengesetzte Richtung bewegen.
Besteht ein negativer Zusammenhang zwischen der Erfahrung eines Mitarbeiters und der Anzahl der Fehler, die er macht?
Zeitreihen
Beschreibt, wie sich etwas im Laufe der Zeit verändert, und hilft dabei, Muster der Veränderung, des Anstiegs, der Fluktuation und der Abnahme zu erkennen.
Eine Zeitreihen definiert die Werte einer Variablen zu sequenziellen Zeitpunkten.
Wie hat sich unser Umsatz seit Anfang des Jahres entwickelt - stetiges Wachstum/saisonale Schwankungen?
Geodaten
Weist Orten numerische Werte zu.
Die beiden wichtigsten Techniken für solche Zuordnungen sind Größe und Farbintensität.
Wie hoch sind die Gesamteinnahmen der US-Bundesstaaten (Standort)?
Was ist ein Kerzenchart
Ein Kerzenchart sieht ähnlich aus wie ein Box-and-Whisker-Diagramm. Der Hauptunterschied zwischen ihnen besteht darin, dass die "Box" in einem Box-and-Whisker-Diagramm den Interquartilsbereich einer Verteilung anzeigt, während die "Box" in einem Kerzenchart die Differenz zwischen dem Eröffnungs- und dem Schlusskurs darstellt
Welche 7 Filterarten gibt es? Wo wird Aggregationsfunktion verwendet?
Aggregation
Eine Aggregation ist eine mathematische Operation, die mehrere Werte in einem Datensatz zu einem einzigen zusammenfassenden Wert kombiniert. Beispiele für Aggregationen sind Summe, Durchschnitt, Minimum, Maximum und Anzahl.
Abfrage
Eine Abfrage ist eine Anfrage nach Informationen aus einem Datensatz
Filter
Ein Filter wählt eine Teilmenge von Zeilen in einer Tabelle auf der Grundlage einer oder mehrerer Kriterien aus.
Boolesche Logik
Eine Boolean ist eine logische Aussage, die wahr oder falsch ist. Ein komplexer boolescher Ausdruck wird aus einfacheren Ausdrücken mit den booleschen Operatoren AND, OR und NOT gebildet
Informationsmodelle
Die Erstellung der für Analysezwecke benötigten Informationen ausgehend von den gesammelten Rohdaten.
DAX
Data Analysis Expressions (DAX) ist eine Formelausdruckssprache, die für Analysis Services, Power BI und Power Pivot in Excel verwendet wird.
Excel Formel im Vergleich zu DAX
Die Funktionen von Excel und DAX überschneiden sich in hohem Maße - etwa 70 % der Excel-Funktionen sind auch in DAX verfügbar, obwohl DAX einige leistungsstarke neue Funktionen wie Calculate() hinzufügt, die erweiterte Berechnungen ermöglichen.
Spalte
Eine Spalte ist ein integraler Bestandteil einer Tabelle, und für jede Zelle (Zeile) in dieser Spalte wird ein Wert berechnet (horizontale Berechnung)
Ist measures ein integraler Bestandteil einer Tabelle?
Measures hingegen sind kein integraler Bestandteil einer Tabelle: Sie definieren Aggregationen (vertikale Berechnungen), die als Teil von Dashboards/Visualisierungen und somit für analytische Zwecke verwendet werden können.
Welche 3 Arten von DAX Funktionen benötigt man zur Erstellung eines Informationsmodells?
Aggregationsfunktionen
Iteratorfunktionen
CALCULATE-Funktion
Wofür steht ETL?
ETL Tool (Aufbereitungstool):
E = Extrahieren
T = Transformieren
L = Laden
was sind Datenkonnektoren
ein einfach zu bedienendes Softwareprogramm, das für Extraktionszwecke entwickelt wurde.
Wie ist die Vorgehensweise von Datenkonnektoren
Datenkonnektor auswählen
Spezifischen Anweisungen für den Datenkonnektor folgen
Datei laden oder transformieren
Was ist Power Query?
ETL Tool von Power BI (Datenaufbereitungstool)
Welche Funktionsteile bei Power Query Editor gibt es?
Hauptmenü
Multifunktionsleiste
Liste der Abfragen oder Tabellen
Angewendete Schritte
Code
Datensatz
Welche Schritte beim Extrahieren von Daten werden bei Power Query automatisch erzeugt?
Quelle
Navigation
Geänderter Typ
Welche Schritte beim Extrahieren von Daten werden bei Power Query erweitert angewendet
Spaltenüberschriften transformieren
Entpivotieren
Datentyp Transformation
Filtern
Tabellen anfügen
Was ist beim Zusammenführen von Tabellen mit Power Query der Unterschied zwischen
Anfügen
Zusammenführen
Mehr Zeilen
Mehr Spalten
Welche verschiedene Arten der Verknüpfung von Tabellen gibt es? (Join Typ)
Testen von Datenfehler als Teil der Datenprofilierung
Verstehen, Bewerten und Optimieren von Datenqualität und Transformation
Qualität der Daten kann durch Tests auf Datenfehler beurteilt werden
Entwerfen und Durchführen solcher Tests ist ein wichtiger Teil der Datenprofilierung und beinhaltet
Verstehen, Bewerten, Hinweisen
Eine Regel die für Daten in der Tabelle ITEM gelten sollte lautet: Artikel die verkauft werden, müssen ein SALEPRICE haben”
Implementierung von Tests mit DAX
Spaltendefinition mit der IF Funktion
Welche DAX Funktionen und Operationen gibt es?
Erstellen von Datenbeziehungen
1. Wählen Sie die beiden Tabellen aus, zwischen denen eine Beziehung hergestellt werden soll.
2. Wählen Sie ein Feld, das die Tabellen gemeinsam haben. Das Feld sollte die gleichen Daten enthalten und den gleichen Datentyp haben.
3. Ziehen Sie ein Feld auf das andere.
Wie sieht der Datenanalyseprozess aus?
Zuletzt geändertvor 3 Monaten