Was beudeutet künstliche Intelligenz?
Es gibt keine einheitliche Definition.
Ziel der KI ist es, das sich Maschinen so verhalten als verfügen sie über Intelligenz.
Es soll also möglich sein, dass Maschinen Dinge tun können die Menschen Momentan noch besser können.
Nennen Sie beispiele für künstliche Intelligenz im Alltag.
Spracherkennung —> Alexa
Gesichtserkennung —> Iphone
Fingererkennung —> Smartphone
Übersetzer —> DeepL
Autonomes Fahren —> Tesla
Welche zwei unterschiedlichen Ansätze gibt es bei der künstlichen Intelligenz?
Ansatz der klassischen Symbolverarbeitung
KI mit maschinellem Lernen
Erklären Sie den Touring Test in eigenen Worten.
Es werden einem Computer und einem Menschen 15 Minuten lang die selben Fragen gestellt ohne zu wissen wer ein Mensch und wer der Computer ist.
Sollte die Person, die die Fragen stellt auch nach 15 Minuten nicht sagen können welche der beiden der Computer ist, hat der Computer gewonnen.
Was muss bei der künstlichen intelligenz berücksichtig bzw. beachtet werden?
Datenschutz und Ethik.
Beispiel Ethik:
Selbsfahrendes Auto es kommt zu einem Unfall mit todesfolge.
Welche Person hat den Tod verdient? Junge menschen oder alte menschen? Die die etwas falsch gemacht haben oder diejenigen die nichts falsch gemacht haben?
Beispiel Datenschutz:
In China wird alles in einem Social Scoring Modell zusammengefasst. Straftaten hoch = Jobchancen niedrig , ansehen niedrig
Welche Elemente der Prädikatenlogik kennen Sie?
Quantoren:
Allquantor —> Gilt für alle
Existenzquantor —> Es gibt
Funktionen / Eingetschaften:
Beispiel: ist schlau, Vater von, Studiert in, Wohnt in
Konstante:
Beispiel: a,b,1,2, Hannover, “Name”
Variablen:
Beispiel: x,y,z
Erklären Sie mir die Breitensuche
Die Breitensuche gehört zu der Uninformierten Suche Bzw. der blinden Suche.
Es wird jeder Knoten in seiner Ebene durchsucht. Sollte ein Knoten komplett durchsucht sein, ist der nächste dran (im Uhrzeigersinn).
Die suche terminiert, sobald ein Zielknoten gefunden wurde.
Erklären SIe mir die Tiefensuche
Die Tiefensuche gehört wie die breitensuche zur Uninformierten bzw. blinden suche
Ein knoten wird so weit in die Tiefe expandiert, bis keine weitere Expansion mehr möglich ist. Dann wird zum vorherigen Knoten gesprungen, bei dem noch weitere Expansionen möglich sind, und weiter expandiert.
Die Suche terminiert, sobald ein Zielknoten gefunden wurde.
Erklären sie mir die heuristische Suche
Die heuristische Suche bezieht Zusatzinformationen hinzu um Suchaufwände zu veringern.
Knoten bekommen so eine Gewichtung.
Methoden die mit einer heuristischen Suche Arbeiten sind:
A*
Hillclimbing
Bestensuche
Erklären Sie mir die Hill Climbing
Bei dieser Suche werden die schlechtesten bewerteten Knoten eliminiert und die Knoten die am besten bewertet sind, werden expandiert.
Welche Vorgehensmodelle gibt es bei dem Maschinellen lernen?
CRISP-DM = Corss Inudstry Standard Process for Data Mining
Vorgehen basiert auf den Best Practices
Agiles Vorgehen
Weit verbreitet
Phasen:
Business unterstanding
Data understandin
Data preparation
Modeling
Evaluation
Deployment
KDD = Knowledge Discovery in Database
- Beschäftigt sich mit dem Erkennen von Mustern in Datenmengen
Datengetriebenes Modell
Eher in Phasen als agil
Weniger verbreitet
Bereitstellung
Definition
Datenauswahl
Datenbereinigung
Datenreduktion
Auswahl des Modells
Data Mining
Interpretation
Erkären sie Unsupervised learning
Das unüberwachte lernen bschäftigt sich damit, aus Daten muster zu erkennen, die voher noch unbekannt waren.
Es sollen also autonom Muster generiert werden, die dann manuell bewertet werden
Nur Inputdaten sind gegeben
Erklären sie supervised learning
Beim überwachten lernen geht es darum aus vorhandenen Daten ein Zielmerkmal zu erlernen, um zukünftige Muster in unbekannten Daten genau hervorsagen zu können
Beispiel Bild mit Tieren—> Trainiert wurde mit Hund & Katzen Bilder —> Einteilung erfolgt
Bild von Maus —> Unbekannte Daten
Nennen Sie mir Beispiele aus der Historie der KI
Autonomes Fahren ca. 2009
Schachmeister besiegt 1997
Touring Test 1950
ChatGPT 2022 aktuell
Was macht die Aussagen und Prädikatenlogik?
Die Aussagen- und Prädikatenlogik ist ein Zweig der formalen Logik und untersucht die Beziehungen zwischen Aussagen und deren Aussagenverbindungen.
Aussagenlogit nutzt nur Junktoren und Wahreitswerte
Prädikatenlogik nutzt zusätzlich quantoren, funktionen, eigentschaften, variablen
Was wissen Sie über wissnespräsentation?
Sind regelbasierte wissenssysteme
Dadurch Ableitungen von Handlungsempfehlungen möglich ( Wenn-Dann-Beziehung)
Wenn -Dann = Vorwärtsverkettung
Hypothese aufstellen, unbekanntes untersuchen = Rückwärtsverkettung
Erklären Sie machine learning in eigenen Worten
Das maschinelle lernen beschreibt die künstliche generierung von wissen aus Erfahrungen.
Wird unterteilt in überwachteslernen, unüberwachteslernen
Welche Algorithmen sind unsupervised?
k-means
assoziationsanalyse
Welche Algorithmen sind supervised?
KNN
Decision Trees
Random Forrest
Gradient Boosted Trees
Naive Bayes
SVM
Logistische Regression
Erzähl mir etwas über k-Means
Ist eine Clustering Methode. Verwendet die dazu die Mittelpunkte der Cluster.
Ziel ist es die Abstände im Cluster klein zu haben und der Abstand zwischen den Clustern groß.
Iteratives Vorgehen.
Festlegung von k (den Anzahl der Clustern)
Wahl von k zufälligen Cluster Zentren
Zuordnung der Punkte zu einem Cluster
Punkte werden zu dem nähesten Cluster zugeordnet
Interative Neuausrichtung der Zentren. Beispielweise wahl durch Mittelwert
Wird solange gemacht bis keine Verbesserung mehr eintritt
Vorteile: Einfache Implementierung
Nachteil: Anzahl von K muss vorher festgelegt werden
Laufzeit ist abhänging von der Zerlegung
Was wissen SIe über das Hierarchische Clustering?
Ist eine Mehtode zur Gruppierung von Objekten in Clustern.
Gibt zwei Hauptverfahren = Agglomeratives und Divisive Clusterung
Agglomeratives Clustering beginnt mit jedem Objekt als eingenes Cluster und führ dann iterativ benachbarte Cluster zusammen.
Divisive Clustering beginnt mit allen Objekten in einem einzigen Cluster und teilt diese dann iterativ in kleinere Cluster auf bis jeder Cluster nur noch ein einziges Objekt enthält
Wie berechnet man die Distanz zwischen zwei Clustern
Single Link —> Geringste Distanz zwischen zwei Objekten wird verwendet
Complete Link —> Die größte Distanz wischen zwei Objekten wird verwendet
Avarage Link —> Das arithmetische Mittel aller Distanzen zwischen den Objekten wird verwendet
Erklären Sie mir die Assoziationsanalyse
Assoziationsanalyse erkennt Zusammenhängen und Ab- hängigkeiten von Attributen. Dabei steht dieIdentifikation von Regelmäßigkeiten im Mittelpunkt.
Nutzung: Warenkorbanalyse
Wer Bier kauft, kauft auch einen Apfel in 9 von 10 fällen
Methoden sind Apriori und Frequent Pattern Growth
Erklären Sie mir KNN
• Welche K eignen sich gut?
• Welche Strategie eignet sich, um Fehlklassifizierungen zu entgehen?
• Welches Maß wird für die
Bewertung der Distanz verwendet?
• Was muss evtl. mit den Daten passieren, um KNN zu benutzen?
Was sind Vorteile und Nachteile
K-Nearest Neighbor
Ist ein Algorithmus zur Vorhersage auf Grundlage benachbarter Datensätze.
Das K steht hierbei für die Anzahl der nächsten Nachbarn.
Es wird also ein neuer Unbekannter Punkt betrachtet und zugeordet.
Anwendung: Text mining, Wettervorhersagen
Ablauf:
Wert für K wählen
Distanzen zwischen den Daten berechnen
Benachbarte Punkte k berücksichtigen und anhand der Mehrheit zuweisen
Vorhergesagte Klasse ausgeben
Welche K eignet sich?
Werte sind abhängig von den Anzahl der Clustern. Beispiel ich habe 2 Cluster, dann sollte k eher Ungrade sein.
Wleche Strategie eignet sich um Fehlklassifizierung zu entgehen?
Datenseätze in zwei Datensätze aufteilen (Test/Train)
somit verringern wir die Fehlkassifizierung
Welche Distanz?
· Euklidische Distanz
· Hamming Distanz
· Manhattan Distanz (City Block)
· Minkowski
· Chebychev Distanz
Daten müssen ggf. bereinigt werden, ausreiser angepasst werden
Vorteile: Leichte Implementierung, Gut anwendbar, bei wenig wissen über die Daten
Nachteile: rechenaufwändig
Was gibt die Entropie an?
Die ungewissheit. Beispiel einem gezinkten Würfel ist die entropie geringer. Normal ist 1
Was wissen sie über Decision Trees
Darstellung von Entscheidungsregeln verwendet. Der Algorithmus leitet auf Grundlage der Trainingsdaten autonom Entscheidungsregeln ab, die zur Klassifikation neuer Objekte dienen.
• Das Attribut mit dem höchsten Informationsgewinn wird als Wurzel ausgewählt.
• Es werden hierarchische Regeln in Form von Entscheidungen aus den Trainingsdaten generiert.
• Vorhersagen können anhand der Regeln mit Hilfe der Testdaten validiert werden.
Was wissen sie über Random Forrest
Random Forest ist ein Machine-Learning- Verfahren, welches auf dem Prinzip von Entscheidungsbäumen aufbaut und zusätzliche Zufallskomponenten beinhaltet. Random Forest gehört zu den Ensemble Methoden.
• Kann zur Regression und zur Klassifikation genutzt werden
• Basiert auf Entscheidungsbäumen
• Basieren auf den “Daten” von mehreren Entscheidungsbäumen
Was wissen sie über naive bayes
Naïve Bayes ist ein wahrscheinlichkeitsbasiertes Klassifikationsverfahren. Dieses basiert auf der Bayesschen Formel, die mit Berechnungen bedingter Wahrscheinlichkeiten arbeitet.
Ziel: Vorhersage der wahrscheinlichsten Klasse
Keine Training des Modells, Vorhersage findet direkt aus den Trainingsdaten statt
Annahme: Alle Attribute sind voneinander unabhängig
Was wissen Sie über die SVM?
Eine Support Vector Machine, kurz SVM, ist ein Klassifizierungsalgorithmus, welcher einen Datensatz durch den Aufbau einer Hyperebene trennt und damit klassifiziert. Er ist in die Kategorie der überwachten Lernalgorithmen einzuordnen, da er die Hyperebene auf Basis von Trainingsdaten modelliert.
Ziel ist es, eine optimale Hyperebene zu kreieren. Der zwei Klassen separiert.
Die Hyperebene ist eine Linie in einem 2-dimensionalen Bereich. 3D = Ebene.
Wollen also die größte Margin wie möglich erzielen.
Optimierung durch Anpassung des Margins
Bei 2D kann der Kernal Trick angewendet werden. So wird es 3D und kann dann getrennt werden.
Last changed2 years ago