von Mathäus

Die Grundlagen von Data-Science-Projekten

Was ist das Ziel von DAta Science?

Ziel von Data Science

Bei Data-Science-Projekten geht es meistens darum:

👉 Modelle zu trainieren, die Vorhersagen treffen können.

Beispiel:

Spam-Mail erkennen
Besucherzahlen vorhersagen
Produktempfehlungen geben

Die Grundlagen von Data-Science-Projekten

Benne mir die Arten des Maschinellen lernens.

Arten des Maschinellen Lernens

Es gibt drei wichtige Lernarten:

Lernart	Bedeutung
Überwachtes Lernen	Lernen mit bekannten Lösungen
Unüberwachtes Lernen	Muster selbst entdecken
Reinforcement Learning	Lernen durch Belohnung/Bestrafung

Arten des Maschinellen Lernens

Was ist überwachtes Lernen?

Gib ein Beispiel dazu.

Überwachtes Lernen (Supervised Learning)

Hier bekommt das Modell:

Eingabedaten
und die richtige Lösung dazu.

Arten des Maschinellen Lernens

Gib ein Beispiel zum überwachten lernen.

Beispiel: Spam-Erkennung

Das Modell bekommt viele E-Mails.

Zu jeder E-Mail weiß man bereits:

Spam
oder kein Spam.

Das Modell lernt daraus Regeln.

Arten des Maschinellen Lernens

Viele Algorithmen des überwachten Lernens verwenden tabellarische Datensätze, um Modelle des maschinellen Lernens zu trainieren. Betrachten wir ein Modell zur Klassifizierung von E-Mails als Spam oder Nicht-Spam.

Wie werden die Spalten des Trainingsdatensatzes bezeichnet?

Wie werden die Zeilen bezeichnet?

Wie wird die Spalte bezeichnet die die Zielvariable beinhaltet?

Wie werden die Spalten des Trainingsdatensatzes bezeichnet?

Features

Wie werden die Zeilen bezeichnet?

Samples

Wie wird die Spalte bezeichnet die die Zielvariable beinhaltet?

Label

Arten des Maschinellen Lernens

Was sind Features?

Features

Features sind Eigenschaften der Daten.

Beispiel:

Anzahl der Empfänger
bestimmte Wörter
Länge der E-Mail

Arten des Maschinellen Lernens

Was sind Samples?

Samples

Samples sind einzelne Datenzeilen.

Beispiel:

eine einzelne E-Mail.

Arten des Maschinellen Lernens

Was sind Label?

Label

Das Label ist die richtige Lösung.

Beispiel:

„Spam“
„Kein Spam“

Arten des Maschinellen Lernens

Sobald das Modell trainiert wurde, kann es zur Vorhersage von zuvor unbekannten Beobachtungen verwendet werden,

z. B. der Wahrscheinlichkeit, dass es sich bei einer unbekannten E-Mail um Spam handelt.

Wie nennt man die Phase der Modellvorhersage?

Inferenz

Nach dem Training macht das Modell Vorhersagen für neue Daten.

Beispiel: 👉 „Diese neue E-Mail ist wahrscheinlich Spam.“

Arten des Maschinellen Lernens

Was versteht man unter Overfitting?

Overfitting

Bedeutung

Das Modell lernt die Trainingsdaten zu genau auswendig.

Dann funktioniert es schlecht bei neuen Daten.

Arten des Maschinellen Lernens

Was muss man tun um Overfitting zu vermeiden?

Lösung gegen Overfitting

Die Daten werden aufgeteilt:

Datensatz	Zweck
Trainingsdaten	Modell lernen
Testdaten	Modell testen

Das nennt man:

Partitionierung

Arten des Maschinellen Lernens

Parameter und Hyperparameter

Was sind Parameter und Hyperparameter?

Parameter

Das Modell lernt diese automatisch während des Trainings.

Hyperparameter

Diese werden vorher festgelegt.

Beispiele:

Lernrate
Algorithmus
Anzahl der Trainingsdurchläufe

Hyperparameter steuern also: 👉 wie das Training abläuft.

Arten des Maschinellen Lernens

Was versteht man unter Unüberwachtem Lernen? (Unsupervised Learning)

Unüberwachtes Lernen (Unsupervised Learning)

Hier gibt es: ❌ keine Labels.

Das Modell sucht selbst Muster in den Daten.

Beispiel

E-Mails automatisch nach Themen gruppieren:

Arbeit
Werbung
Schule
Privat

Das nennt man:

Clustering

Arten des Maschinellen Lernens

Was ist Reinforcement Learning?

Reinforcement Learning

Hier lernt ein Modell durch:

✅ Belohnungen ❌ Bestrafungen

Beispiel: Schach

gute Züge → Belohnung
schlechte Züge → Bestrafung

Dadurch lernt das Modell bessere Strategien.

Arten des Maschinellen Lernens

Viele Data-Science-Projekte basieren auf dem CRISP-DM.

Beschreibe seine 6 Phasen.

1. Business Understanding

Frage:

Welches Problem soll gelöst werden?

Beispiel:

Spam erkennen
Umsatz vorhersagen

2. Data Understanding

Frage:

Welche Daten gibt es?

Man untersucht:

Datenqualität
Datenstruktur
Vollständigkeit

3. Data Preparation

Wichtigste und aufwendigste Phase

Daten werden vorbereitet:

bereinigt
sortiert
umgewandelt

4. Modelltraining

Verschiedene:

Algorithmen
Einstellungen
Hyperparameter

werden getestet.

5. Evaluierung

Die Modelle werden verglichen:

👉 Welches Modell macht die besten Vorhersagen?

6. Deployment

Das beste Modell wird produktiv eingesetzt.

Dann kann es:

Vorhersagen liefern,
von Anwendungen genutzt werden.

Anbieterunabhängige Dienste und Tools

Warum sind diese wichtig?

Warum anbieterunabhängige Tools wichtig sind

Es gibt Tools, die:

mit AWS,
Azure,
Google Cloud

funktionieren.

Das ist wichtig, um: ✅ flexibel zu bleiben ✅ Vendor Lock-In zu vermeiden

Anbieterunabhängige Dienste und Tools

Benne die beiden bekannten Anbieterunabhängigen Dienste.

Wichtige Tools

In diesem Text geht es besonders um:

MLflow
Databricks

Anbieterunabhängige Dienste und Tools

Was ist MLflow?

MLflow ist eine:

✅ Open-Source-Plattform für Machine Learning

Sie hilft bei:

Training,
Organisation,
Vergleich,
Speicherung,
Bereitstellung

von ML-Modellen.

Anbieterunabhängige Dienste und Tools

MLflow

Welche Probleme können entstehen beim maschinellen Lernen ohne MLflow?

Problem ohne MLflow

Beim Trainieren von Modellen testet man oft:

verschiedene Algorithmen,
unterschiedliche Hyperparameter,
viele Experimente.

Ohne Organisation wird das schnell unübersichtlich.

Lösung: MLflow

MLflow organisiert:

Experimente,
Modelle,
Parameter,
Ergebnisse.

Anbieterunabhängige Dienste und Tools

MLflow

Welches sind die 4 Hauptkomponenten von MLflow?

1. MLflow Tracking

2. MLflow Projects

3. MLflow Models

4. MLflow Model Registry

Anbieterunabhängige Dienste und Tools

MLflow

Welches sind die 4 Hauptkomponenten von MLflow?

1. MLflow Tracking

2. MLflow Projects

3. MLflow Models

4. MLflow Model Registry

Beschreibe MLflow Tracking.

1. MLflow Tracking

Aufgabe

Speichert:

Parameter,
Metriken,
Ergebnisse,
Experimente.

Anbieterunabhängige Dienste und Tools

MLflow

Welches sind die 4 Hauptkomponenten von MLflow?

1. MLflow Tracking

2. MLflow Projects

3. MLflow Models

4. MLflow Model Registry

Beschreibe MLflow Projects

2. MLflow Projects

Aufgabe

Modelle werden als portable Projekte gespeichert.

Dadurch können Projekte:

leicht geteilt,
auf anderen Systemen ausgeführt,
in der Cloud genutzt

werden.

Technologien

MLflow nutzt:

Docker
Conda

für die Portabilität.

Anbieterunabhängige Dienste und Tools

MLflow

Welches sind die 4 Hauptkomponenten von MLflow?

1. MLflow Tracking

2. MLflow Projects

3. MLflow Models

4. MLflow Model Registry

Beschreibe MLflow Models

3. MLflow Models

Aufgabe

Modelle werden so gespeichert, dass sie einfach bereitgestellt werden können.

Beispiel:

lokal
Cloud
API

Anbieterunabhängige Dienste und Tools

MLflow

Welches sind die 4 Hauptkomponenten von MLflow?

1. MLflow Tracking

2. MLflow Projects

3. MLflow Models

4. MLflow Model Registry

Beschreibe MLflow Model Registry

4. MLflow Model Registry

Aufgabe

Zentrale Verwaltung trainierter Modelle.

Dort kann man:

Modelle speichern,
vergleichen,
versionieren,
produktiv einsetzen.

Databricks

Was sind Apache Spark?

Dies ist ein beliebtes Framework für die Verarbeitung großer Datenmengen.

Databricks

Was ist Databricks?

Databricks ist eine Plattform für Data Science, Big Data und Machine Learning in der Cloud.
Sie wurde 2013 von Entwicklern gegründet, die auch an Apache Spark und MLflow gearbeitet haben.

Databricks

Was ist das Ziel von Databricks?

Das Ziel von Databricks ist:

große Datenmengen einfach verarbeiten,
Machine-Learning-Modelle trainieren,
und alles zentral in der Cloud verwalten.

Databricks

Databricks stellt fertige Spark-Cluster bereit.

Was bedeuted das?

Das bedeutet:

Unternehmen müssen keine Server selbst verwalten.
Databricks übernimmt Infrastruktur, Skalierung und Wartung.
Die Plattform läuft auf:
- AWS
- Microsoft Azure
- Google Cloud

Databricks

Was ist das Lakehouse-Konzept?

Was sind die Vorteile davon?

Lakehouse-Konzept

Databricks nutzt das sogenannte Lakehouse.

Ein Lakehouse verbindet:

Data Lake → speichert große, auch unstrukturierte Daten
Data Warehouse → speichert strukturierte Daten für Analysen

Dadurch können alle Daten zentral gespeichert und genutzt werden.

Vorteile:

weniger Datensilos
bessere Zusammenarbeit
einheitliche Datenplattform

Databricks

Benenne die drei Stufen in denen Databricks seine Daten organisiert.

Die 3 Tabellen-Stufen

Databricks organisiert Daten oft in 3 Ebenen:

Bronze

rohe Originaldaten
noch nicht bearbeitet

Silber

teilweise bereinigte/verarbeitete Daten
z. B. zusammengeführte Tabellen

Gold

vollständig aufbereitete Daten
direkt für Berichte und Analysen nutzbar

Machine Learning in Databricks

Databricks bietet eine spezielle Umgebung für Machine Learning.

Dort können:

Modelle trainiert,
getestet,
gespeichert,
und bereitgestellt werden.

Google-Dienste für Data Science und Maschinelles Lernen

Welche Dienste bietet Google Cloud Platform?

Google Cloud Platform (GCP) bietet viele Dienste für:

Data Science
Big Data
Machine Learning (ML)
Künstliche Intelligenz (KI)

Man kann dabei entweder:

alles selbst verwalten,
oder fertige Cloud-Dienste von Google nutzen.

Google-Dienste für Data Science und Maschinelles Lernen

Benenne 4 wichtige Dienste auf GCP

Dataflow

verarbeitet große Datenmengen
für Datenpipelines

Cloud Composer

verwaltet Workflows und Datenpipelines
basiert auf Apache Airflow

Dataproc

verwaltete Spark- und Hadoop-Cluster
für Big-Data-Verarbeitung

BigQuery ML

Machine Learning direkt in SQL

Google-Dienste für Data Science und Maschinelles Lernen

Was sind die Vorteile einer AI Platform?

Vorteile der AI Platform

Die Plattform:

verwaltet die Infrastruktur automatisch
skaliert Ressourcen selbstständig
unterstützt GPU und TPU
verbindet sich mit anderen GCP-Diensten

Beispiele:

BigQuery
Cloud Storage
Dataproc

Google-Dienste für Data Science und Maschinelles Lernen

Nenne Beispiele für KI-Dienste

Teachable Machine

Natural Language AI

Dialogflow

Translation AI

Speech-to-Text / Text-to-Speech

Vision AI

Video Intelligence API

Timeseries Insights API

Amazon Web Services für Data Science und Maschinelles Lernen

AWS bietet viele Dienste für Data Science und Machine Learning (ML) an.

Grundsätzlich gibt es 2 Ansätze wie man diese Dienste nutzen kann. Welche sind dies?

Dabei gibt es zwei Möglichkeiten:

Viel Kontrolle: Man verwaltet die Technik selbst.
Wenig Kontrolle: AWS übernimmt die Technik und macht vieles automatisch.

Je weniger man selbst verwaltet, desto einfacher wird die Nutzung.

Amazon Web Services für Data Science und Maschinelles Lernen

Was ist SageMaker?

SageMaker – der wichtigste ML-Dienst von AWS

Was ist SageMaker?

SageMaker ist die zentrale Plattform von AWS für Machine Learning.

Damit kann man:

Daten vorbereiten
Modelle trainieren
Modelle testen
Hyperparameter optimieren
Modelle bereitstellen
Vorhersagen per API nutzen

AWS übernimmt dabei viel Infrastrukturarbeit.

Vorgefertigte KI-Dienste von AWS

AWS bietet bereits trainierte KI-Modelle an. Man muss keine eigenen Modelle trainieren.

Die Dienste werden meist per API genutzt.

Vorgefertigte KI-Dienste von AWS

Welche Allegmeinen Dienste bietet AWS an?

Welcher der Dienste ist der wichtigste?

AWS bietet:

Infrastruktur für ML
Tools zur Datenverarbeitung
komplette ML-Plattformen
fertige KI-APIs

Der wichtigste Dienst ist:

Amazon SageMaker

→ komplette Umgebung für moderne Machine-Learning-Projekte in der Cloud.

Gebrauchsfertige Dienste auf AWS

Wie lassen sich die Vortrainierten Modelle von AWS ansprechen?

Wer hat dabei die Kontrolle und Verantwortung über die verwaltung der Infrastruktur?

AWS bietet bereits trainierte KI-Modelle an.
Man muss keine eigenen Modelle trainieren.
Die Dienste werden meist per API genutzt.

Die Kontrolle und Verwaltung der Infrastruktur

obliegen bei AWS
wodurch diese Dienste sofort eingesetzt werden können

Vorgefertigte KI-Dienste von AWS

Wie heißt der Dienst für die Sprachverarbeitung?

Comprehend

Analysiert Texte.

Kann:

Stimmung erkennen
Themen finden
Personen und Orte erkennen

Vorgefertigte KI-Dienste von AWS

Wie heißt der Dienst für die Bild und Videoanalyse?

Rekognition

Analysiert Bilder und Videos.

Kann:

Gesichter erkennen
Objekte erkennen
OCR (Texterkennung)
Inhalte moderieren

Vorgefertigte KI-Dienste von AWS

Wie heißt der Dienst für auf Bilder von Produktionsstätten konzentriert?

Lookout for Vision

Für Industrie und Qualitätskontrolle.

Erkennt:

Fehler
Anomalien
Produktionsprobleme

Vorgefertigte KI-Dienste von AWS

Was ist die Aufgabe von Textract?

Liest Text aus Dokumenten und Bildern

Vorgefertigte KI-Dienste von AWS

Was für eine Art service bietet der KI-Dienst Transcribe?

Transcribe ist der Speech-to-Text-Service von AWS
- Sprache → Text

Vorgefertigte KI-Dienste von AWS

Was für einen Dienst bietet der KI-Dienst Polly?

Polly

Text → Sprache

Polly für Text-to-Speech-Anwendungen

Vorgefertigte KI-Dienste von AWS

Was für einen Dienst bietet der KI-Dienst Lex?

Lex

Erstellt Chatbots.

Chatbots können mit Lex schnell konfiguriert werden

Vorgefertigte KI-Dienste von AWS

Was für einen Dienst bietet der KI-Dienst Personalize?

Personalize

Empfehlungssystem wie bei Amazon-Shop.

Beispiele:

Produktempfehlungen
individuelle Vorschläge

Vorgefertigte KI-Dienste von AWS

Was für einen Dienst bietet der KI-Dienst Forecast?

Forecast

Vorhersagen mit Zeitreihen.

Beispiele:

Verkaufsprognosen
Nachfrageprognosen

Vorgefertigte KI-Dienste von AWS

Was für einen Dienst bietet der KI-Dienst Fraud Detector?

Fraud Detector

Erkennt Betrug automatisch.

Vorgefertigte KI-Dienste von AWS

Was für einen Dienst bietet der KI-Dienst Lookout for Metrics?

Lookout for Metrics

Erkennt Anomalien in Daten und KPIs.

Vorgefertigte KI-Dienste von AWS

Was für einen Dienst bietet der KI-Dienst Kendra?

Kendra

Intelligente Suchmaschine für eigene Anwendungen.

Vorgefertigte KI-Dienste von AWS

Was für einen Dienst bietet der KI-Dienst Augmented AI?

Augmented AI (A2I)

Kombiniert:

KI
menschliche Kontrolle

Menschen prüfen dabei kritische Entscheidungen.

Vorgefertigte KI-Dienste von AWS

Was für einen Dienst bietet der KI-Dienst Code- und DevOps-Dienstleistungen?

DevOps- und Code-KI

AWS bietet auch KI-Dienste für Entwickler:

Beispiele

CodeGuru
DevOps Guru

Funktionen:

Code-Analyse
Fehlererkennung
Performance-Optimierung

Microsoft-Azure-Dienste für Data Science und Maschinelles Lernen

Für welche Bereiche bietet Microsoft Azure Cloud-Dienste an?

Welche zwei Möglichkeiten gibt es in Bezug auf die Nutzung der Dienste?

Microsoft Azure bietet viele Cloud-Dienste für Data Science und Künstliche Intelligenz (KI) an. Dabei gibt es zwei Möglichkeiten:

Viel Kontrolle: Man richtet alles selbst ein und verwaltet die Infrastruktur.
Wenig Aufwand: Azure übernimmt viele technische Aufgaben automatisch.

Microsoft-Azure-Dienste für Data Science und Maschinelles Lernen

Was kann man mit Azure-VMs erstellen?

Und was kann dort gemacht werden?

Virtuelle Maschinen (VMs)

Mit Azure-VMs kann man eigene Computer in der Cloud erstellen.

Dort kann man:

Python installieren,
Bibliotheken wie TensorFlow oder Scikit-learn nutzen,
eigene Sicherheitsregeln festlegen.

Microsoft-Azure-Dienste für Data Science und Maschinelles Lernen

Können Cloud-Dienste abgesehen von VMs auch in anderer Form bereitgestellt werden in MZ?

Container-Dienste

Modelle können auch als Container bereitgestellt werden.

Azure Container Instances (ACI)

einfache Container
gut zum Testen

Azure Kubernetes Service (AKS)

leistungsfähige Container-Plattform
für große Produktivsysteme
kann Modelle trainieren und bereitstellen

Microsoft-Azure-Dienste für Data Science und Maschinelles Lernen

Welche ist die wichtigste Plattform für Machine learning in Azure?

Azure Machine Learning (Azure ML)

Azure ML ist die wichtigste Plattform für Machine Learning in Azure.

Damit kann man:

Modelle trainieren,
testen,
verwalten,
deployen (bereitstellen).

Ziel:

Data-Science-Projekte einfacher und schneller machen.

Microsoft-Azure-Dienste für Data Science und Maschinelles Lernen

Was muss zunächst getan werden damit die Azure ML-Dienste genutzt werden können?

Azure ML Workspace

Für Azure ML erstellt man zuerst einen Workspace.

Dabei werden automatisch wichtige Dienste angelegt:

Dienst	Aufgabe
Storage Account	Datenspeicherung
Container Registry	Speicherung von Modell-Containern
Key Vault	sichere Zugangsdaten
Application Insights	Überwachung und Analyse

Microsoft-Azure-Dienste für Data Science und Maschinelles Lernen

Was sind Compute Targets? Welche Form können diese annehmen?

Compute Targets

Compute Targets sind die Rechenressourcen für ML.

Compute Instance

einzelne VM
bereits mit ML-Frameworks vorbereitet

Compute Cluster

mehrere VMs zusammen
für große Trainingsaufgaben
automatische Skalierung möglich

Azure ML unterstützt MLOps (Machine Learning Operations).

Dazu gehören:

Experiment-Tracking
Logging
Modell-Versionierung
automatische Deployments
Monitoring
automatisches Retraining

Außerdem:

Explainable AI (erklärbare KI)
Fairness-Prüfungen
Data Governance
Labeling-Services

Microsoft-Azure-Dienste für Data Science und Maschinelles Lernen

Wozu werden Data Assets in Azure ML verwendet?

Data Assets vereinfachen den Zugriff auf Daten.

Beispiel:

Daten liegen im Azure Blob Storage
Azure ML greift automatisch darauf zu

Vorteile:

keine manuellen Zugangsdaten nötig
sichere Verwaltung über:
- Key Vault
- Azure Entra ID

Microsoft-Azure-Dienste für Data Science und Maschinelles Lernen

Wozu wird Azure ML Designer verwendet?

Der Designer ermöglicht Machine Learning ohne Programmieren.

Man zieht:

Daten,
Algorithmen,
Verarbeitungsschritte

einfach per Drag-and-Drop zusammen.

Gut geeignet für:

Anfänger
schnelles Testen

Microsoft-Azure-Dienste für Data Science und Maschinelles Lernen

Wie funktioniert ein Modell-Deployment wenn man mit der Leistung des Modells zufrieden ist?

Modell-Deployment

Wenn ein Modell fertig ist:

Modell trainieren
Modell containerisieren
In Registry speichern
In Azure deployen

Deployment-Möglichkeiten:

ACI → Test
AKS → Produktion
Edge-Geräte
Multi-Cloud
lokale Systeme

Microsoft-Azure-Dienste für Data Science und Maschinelles Lernen

Was bietet Azure ML and sicherheitsmaßnahmen?

Azure ML bietet:

rollenbasierte Zugriffe
Netzwerk-Schutz
Verschlüsselung
Schwachstellen-Scans
private Netzwerke (VNets)

Microsoft-Azure-Dienste für Data Science und Maschinelles Lernen

Benenne die Gebrauchsfertigen KI-Dienste von Azure.

Computer Vision
Face
Azure Cognitive Service for Language
Language Understanding
QnA Maker
Translator
Speech Service
Anomaly Detector

Microsoft-Azure-Dienste für Data Science und Maschinelles Lernen

Was kann der KI-Dienst Computer Vision?

Computer Vision

Erkennt:

Personen
Objekte
Marken
Farben
Gesichter
Texte (OCR)

Microsoft-Azure-Dienste für Data Science und Maschinelles Lernen

Was kann der KI-Dienst Face?

Face

Spezialdienst für Gesichtserkennung.

Kann:

Personen identifizieren
Emotionen erkennen
Alter und Geschlecht schätzen

Microsoft-Azure-Dienste für Data Science und Maschinelles Lernen

Was kann der KI-Dienst Azure Cognitive Service for Language?

Verarbeitet Sprache und Texte.

Kann:

Texte verstehen
Zusammenfassungen erzeugen
Stimmung analysieren
Themen erkennen
personenbezogene Daten erkennen

Microsoft-Azure-Dienste für Data Science und Maschinelles Lernen

Was kann der KI-Dienst Azure Language Understanding?

Erkennt:

Absichten (Intent)
wichtige Begriffe (Entities)

Gut für:

Chatbots
Sprachassistenten

Microsoft-Azure-Dienste für Data Science und Maschinelles Lernen

Was kann der KI-Dienst Azure QnA Maker?

Erstellt Frage-Antwort-Systeme und Chatbots.

Microsoft-Azure-Dienste für Data Science und Maschinelles Lernen

Was kann der KI-Dienst Azure Translator?

Übersetzt Texte automatisch zwischen Sprachen.

Microsoft-Azure-Dienste für Data Science und Maschinelles Lernen

Was kann der KI-Dienst Azure Speech Service?

Für:

Speech-to-Text
Text-to-Speech
Spracherkennung
Übersetzungen

Microsoft-Azure-Dienste für Data Science und Maschinelles Lernen

Was kann der KI-Dienst Azure Anomaly Detector?

Erkennt ungewöhnliche Muster in Zeitreihen.

Beispiele:

Betrug
Maschinenfehler
Ausfälle

Weitere Azure-KI-Dienste

Dienst	Aufgabe
Content Moderator	erkennt problematische Inhalte
Personalizer	erstellt Empfehlungen
Cognitive Service Containers	KI lokal als Container
Azure AI Services	KI direkt in Synapse Analytics

Beitreten

Vorschau

Author

Mathäus

Informationen

Zuletzt geändert
vor 21 Tagen

Kurs melden

5. Data Science in der Cloud

Die Grundlagen von Data-Science-Projekten

Ziel von Data Science

Die Grundlagen von Data-Science-Projekten

Arten des Maschinellen Lernens

Arten des Maschinellen Lernens

Überwachtes Lernen (Supervised Learning)

Arten des Maschinellen Lernens

Beispiel: Spam-Erkennung

Arten des Maschinellen Lernens

Arten des Maschinellen Lernens

Features

Arten des Maschinellen Lernens

Samples

Arten des Maschinellen Lernens

Label

Arten des Maschinellen Lernens

Inferenz

Arten des Maschinellen Lernens

Overfitting

Bedeutung

Arten des Maschinellen Lernens

Lösung gegen Overfitting

Partitionierung

Arten des Maschinellen Lernens

Parameter und Hyperparameter

Parameter

Hyperparameter

Arten des Maschinellen Lernens

Unüberwachtes Lernen (Unsupervised Learning)

Beispiel

Clustering

Arten des Maschinellen Lernens

Reinforcement Learning

Beispiel: Schach

Arten des Maschinellen Lernens

1. Business Understanding

Frage:

2. Data Understanding

Frage:

3. Data Preparation

Wichtigste und aufwendigste Phase

4. Modelltraining

5. Evaluierung

6. Deployment

Anbieterunabhängige Dienste und Tools

Warum anbieterunabhängige Tools wichtig sind

Anbieterunabhängige Dienste und Tools

Wichtige Tools

Anbieterunabhängige Dienste und Tools

Was ist MLflow?

Anbieterunabhängige Dienste und Tools

MLflow

Problem ohne MLflow

Lösung: MLflow

Anbieterunabhängige Dienste und Tools

MLflow

Anbieterunabhängige Dienste und Tools

MLflow

1. MLflow Tracking

Aufgabe

Anbieterunabhängige Dienste und Tools

MLflow

2. MLflow Projects

Aufgabe

Technologien

Anbieterunabhängige Dienste und Tools

MLflow

3. MLflow Models

Aufgabe

Anbieterunabhängige Dienste und Tools

MLflow

4. MLflow Model Registry

Aufgabe

Databricks

Databricks

Databricks

Databricks

Databricks

Lakehouse-Konzept