Was ist der Vorteil von computerassistierter Bildanalyse?
Ergebnisse sind schneller da als händisch
Ergebnisse sind konsistent reproduzierbar
In welcher Form werden Bilder im Computer reprästentiert?
Bilder Bestehen aus Pixeln (= picture element). Dabei ist jeder pixel ein Tupel aus drei Werten zwischen 0 und 255 (bei 8-bit Bildern). Jeder Wert repräsentiert dabei die Intensität des entsprechenden Farbkanals (R, G, B).
Shortly explain what a gaussian blur is.
= a convolutional image manipulation method that uses a gaussian function
convolution = a small matrix (kernel) is run over each pixel in the image
new pixel value is calculted based on the other values in the kernel
In einfachen Worten: Den anhand des Abstands gewichteten Mittelwert der umliegenden Pixel berechnen. (Je näher der Pixel an dem einen zu berechnenden Pixel desto höher die Gewichtung.)
Erzielter Effekt: Weichzeichnen.
Was ist Tresholding? What would a typical workflow look like?
Thresholding is the simplest form of image segmentation
convert image to greyscale and look at histogram
a threshold value is set and pixels above that value are set to 255 and pixels below that value are set to 0 (or any other specified values)
result: new image with only 2 pixel values that can be used as a mask for example
Was ist ein Binäres Bild/Maske?
Es ist ein Bild, was nur aus 2 Werten betsteht: Schwarz/weiss
Angenommen, Sie wenden die Funktion shape() auf ein Bild an und das gedruckte Ergebnis lautet "(1920, 1080,3)": Was bedeutet das?
Das bedeutet, dass das Bild eine Größe von 1920 x 1080 Pixel (Spalten x Zeilen) hat und aus 3 Kanälen (Farben; RGB) besteht
Nennen Sie einige Bereiche in der Biologie/Medizin, in denen eine Bildanalyse erforderlich sein könnte.
(fluorescence) microscopy
medical images (MRI, PET, CT)
regular images taken by cameras (ecological data)
& more
What is a loss function? Give an example.
Methode zur Bestimmung der Leistungsfähigkeit des Modells
die Verlustfunktion ist hoch, wenn die vorhergesagten Bezeichnungen stark von den wahren Bezeichnungen abweichen
Ziel ist es, diese Verlustfunktion über mehrere Iterationen zu minimieren.
Kreuzentropie
Nennen Sie einige Algorithmen des überwachten Lernens. Erläutern Sie kurz das Konzept.
K-Nearest-neighbor
decision trees
random forests
linear/logistic regression
Erklären Sie, wie (in welche Teile) ein Datensatz für maschinelles Lernen aufgeteilt wird.
Trainingsdaten (Mehrheit der Daten; werden zum Trainieren des Modells verwendet)
Validierungsdaten (werden zur Validierung des Trainings verwendet)
Testdaten (werden verwendet, um die Leistung des Modells zu testen; Daten, die das Modell nicht gesehen hat)
Erklären Sie den Unterschied zwischen Regression und Klassifikation.
Regression wird für die Vorhersage einer kontinuierlichen Variablen verwendet (z. B.: Vorhersage der Überlebenschance eines Patienten auf der Grundlage bestimmter Eingabedaten)
Klassifizierung wird zur Vorhersage diskreter Variablen (Etiketten) verwendet (z. B.: ob ein Patient überlebt oder nicht, auf der Grundlage einiger Eingabedaten)
Spezialfall der Klassifizierung: Segmentierung (Klassifizierung der einzelnen Pixel eines Bildes)
Erklären Sie die Funktionsweise eines Random Forest.
besteht aus mehreren Decision Trees
Vorhersage: jeder der internen Decision Trees wird gefragt
das, was die Mehrheit der Decision Trees als Anwort generiert, ist die Gesamtantwort des Forest
Warum braucht man für die Testung eines Modells sogenannte Hold-out Data?
hold out data = test data
Netzwerk könnte die Trainingsdaten auswendig lernen (=overfitting), aber neue Daten müssen dadurch nicht unbedingt auch gut funktionieren -->Hold-out Data von Modell fernhalten bis Training beendet ist und nach dem Training als Test-Set (für Netzwerk fremde, neue Daten) verwenden
wie funktioniert ein neuronales Netzwerk?
Ein neuronales Netz ist eine Ansammlung von einzelnen Informationsverarbeitungseinheiten (Neuronen)
Neuronen sind in layern angeordnet und meistens mit allen Neuronen des nachfolgenden layers verbunden
Input layer → hidden layer → output layer
Bei einer vorhandenen Netzstruktur bekommt jedes Neuron ein zufälliges Anfangsgewicht zugeteilt → die input Daten werden in das Netz gegeben und von jedem Neuron mit seinem individuellen Gewicht gewichtet → Ergebnis dieser Berechnung wird an die Neuronen des nächsten layers weitergegeben, (Aktivierung der Neuronen) → eine Berechnung des Gesamtergebnisses geschieht im output layer
Cross Entropy Formel berechnen
Dice formel
Last changed2 years ago