AK21/22
Unterschied forward und viterbi algorithm?
Wozu nutzen?
Forward: Berechnet Wahrscheinlichkeit einer beobachteten Sequenz unter Berücksichtigung aller möglichen Abfolgen von hidden states. -> Genauer aber mehr Rechenoperationen
Viterbi: Berechnet die Wahrscheinlichkeit für eine Sequenz bei der jeweils nur der wahrscheinlichste Pfad von einem hidden state zum nächsten mit einbezogen wird. -> Ungenauer aber effizienter
Nennen Sie 3 experimentelle Mehthode, um Transkriptionsfaktor Bindestellen (TFBS) zu bestimmen. Beshcreiben Sie kurz jede Methode, und nennen sie Vor- und Nachteile. (2P)
DNAse I – Footprinting = DNAse —> Protein gebundene DNA wird vor der Spaltung durch die DNAse I bewahrt.
die Stellen an denen das Chromatin nicht konserviert/frei zugänglich ist —> fragmentiert, —> geschnittenen Fragmente sequenzieren
Vorteil = In vivo Dichte der Spaltung Genauigkeit von einem Nukleotid
Nachteil: n vitro low-throughput Methode.
SELEX = Systematic Evolution of ligands by exponential enrichment
Zufällige Library von k-meren generiert —> mit TF of interest inkubiert wird
TF gebundenen Targets werden von den ungebundenen k- meren getrennt —> PCR angereichert —> Zyklus wird weiter fortgesetzt.
Vorteil = in vitro, medium throughput Methode
Nachteil = hochaffine Bindungsstellen überselektiert
ATAC-seq = using Tn5 transposase with sequencing primers
small numbers of input material (~10,000 cells)
identification of open chromatin regions (peaks)
Wie wird die Sensitivität berechnet?
TP/P = TP/(TP + FN)
how many true binding sites did I find?
Wie wird die Spezifizität berechnet? - LABERGEFAHR HOCH!
TN/N = TN/(TN + FP)
how many of the non-ninding sites did I identify correctly?
Wie wird der recall berechnet?
LABERGEFAHR HOCH!
Sensitivity also TP/P
Wie wird die Precision berechnet?
PPV = Positive Prediction Value
PPV = TP / (TP + FP)
Was ist die Bedeutung von 1 - Spezifizität?
1 - Spezifizität = False-positive rate
1 - TN / (TN + FP)
Allgemein
Gebe die Formeln für das log-likelihood ratio und den information content eine MATRIX an!
Gib die Formel an um das log-likelihood ratio einer BINDUNGSSEQUENZ zu berechen!
Je höher der Schwellenwert, desto…?
Desto mehr False Negatives (nicht so geil, weil die haben dann Krebs oder so, aber Compute sagt nein…)
Je niedriger der Schwellenwert, desto…
Desto mehr FPs. (ja auch nicht geil, aber dann macht man mehrere Tests und denkt sich geil, ich hab doch kein Krebs)
Mit welcher Strategie bekommt man eine Spezifität von 1?
Schwellenwert hochsetzen. —> Alle Bindestellen sind keine Bindestellen
AK 13/14
binominal Verteilung Formeln für P
AK13/14
E value aus P value berechnen bei Hexannucleotides?
Zuletzt geändertvor 2 Jahren