Was sind OTUs?
Kunstwort
Operational Taxonimic Unit
für alle Sequenzen verwendbar mit denen man arbeitet
z.B.: versch. Spezies
Welche zwei Formen von Stammbäumen (Topologien) gibt es?
gewurzelt (haben eine Richtung)
ungewurzelt (haben keine Richtung)
Wie viele OTUs werden bei gewurzelten Bäumen min. benötigt, um unterschiedliche Topologien zu erstellen? Und wie viele Topologien kann man mit dieser Mindestzahl erstellen?
es werden min. 4 OTUs benötigt (1 als Outgroup; 3 für die in-group)
es gibt 3 unterschiedliche Stammbäume die man damit erstellen kann
Wie viele OTUs werden min. bei ungewurzelten Bäumen benötigt um verschiedene Stammbäume zu erstellen? Wie viele Topologien lassen sich damit erstellen?
es werden min. 4 OTUs benötigt
daraus lassen sich 3 Topologien erstellen
Nenne Beispiele für diskrete/ diskontinuierliche Daten.
Basen/Nucleotide
Aminosäuren
Nenne ein Beispiel für kontinuierliche Daten. Wie werden diese gewonnen?
Distanzen
werden aus diskreten Daten gewonnen
Welche Baumrekonstruktionsmethoden basieren auf diskreten Daten?
Maximale Sparsamkeit
Maximum Likelihood
maximum posterior probability/bayesian inference
Welche Baumrekonstruktionsmethoden basieren auf kontinuierlichen Daten?
Neighbor Joining
Was machen die unterschiedlichen Baumrekonstruktionsmethoden im Grundsatz?
optimieren ein spez. Kriterium (maximale Sparsamkeit, maximum Likelihood, maximum posterior probability/bayesian inference)
gruppieren nach Ähnlichkeit (neighbor joining)
-> abstandsbasiertes Verfahren
Was ist der Grundsatz der Maximalen Sparsamkeit?
nutz die Sparsamste evolutionserklärung
-> Topologie, die die wenigsten Mutationen impliziert
Wie lautet der Grundsatz der maximum Likelihood?
sucht nach dem Baum, der das Auftreten eines Alignments vor dem Hintergrund einer Hypothese am Wahrscheinlichsten macht
Inwiefern unterscheiden sich bayesian inference und maximum likelihood?
Suchen beide nach dem Baum, der das Auftreten eines Alignments vor dem Hintergrund einer Hypothese am wahrscheinlichsten macht
-> wenn kein Vorwissen (auch nicht über Topologie) über die Hypothese vorhanden ist auch für bayesian inference zutreffend
Wenn Vorwissen vorhanden, dann kann bayesian inference die Baumrekonstruktion in Richtung einer bestimmten Topologie pushen
Woraus besteht die Hypothese bei maximum Likelihood und bayesian inference? Wie werden Teile der Hypothese weiterspezifiziert?
Hypothese besteht aus: Baum (topologie + Astlänge) & Substitutionsmodel
-> welches model genutzt wird, wird durch model testing bestimmt, durch quick-fit tree (modelle werden mit datenset verglichen -> neighbor joining)
Kriterium: AIC [Akaike information criterion]
-> wichtig: Anz. der Freiheitsgrade, Anz. der Stammbaum Äste, Likelihood unter der Annahme des Models
Auf was basiert bayesian inference?
maximum Likelihood
Warum lassen sich bayesian inference und maximum likelihood nicht komplette berechnen? Und welche methoden wird stattdessen genutzt?
beide methoden zu rechenintensiv, wenn man den ganzen Parameterraum nach globalem Optimum durchsuchen würde
-> heuristische Suche
Was ist eine heuristische Suche? und welches Risiko besteht?
auf basis einer Vorannahme wird der Parameterraum mit random samples durchsucht
-> ist ein sample besser als das vorherige, so wird von diesem aus weiter gesucht
Risiko: ein gutes lokales Optimum wird erreicht aber nicht das globale Optimum
Worauf liegt das Hauptinteresse bei einer Baumrekonstruktion?
liegt auf der Topologie, nur selten auf den Astlängen
es können Astlängen repräsentiert werden, genau so wie Support-werte
Was sagen Support-werte aus?
ob der Datensatz ein wiedersprüchliches Signal enthält und wie groß der Wiederspruch ist
-> wie gut ist der Datensatz
umso höher der wert, desto niedriger ist das Konfliktpotential im Alignment
-> je höher der Unterstützungswert für einen Ast/Knoten, desto klarer das dazugehörige Signal im Alignment
Worauf beziehen sich bootstrap-/jackknife-werte? Erkläre das Verfahren.
beziehen sich auf Präzision einer phylogenetischen Hypothese -> wie gut kann eine Messung (Ast) reproduziert werden
zusätzlich zu dem originalen Alignment werden Pseudoreplikate & pseudoreplikatbäume basierend auf dem original-Alignment erstellt (mit und ohne zurücklegen)
-> die frequenz mit der ein bestimmter Ast im originalbaum auch in den pseudoreplikatbäumen auftaucht, determiniert den Unterstützungswert des Astes (umso häufiger, desto höher ist der wert)
wann werden aLTR-werte genutzt?
approximate likelihood ratio tests
bei maximum likelihood- Verfahren genutzt
Warum ist die erstellung von aLTR-werten weniger rechenaufwendig als resampling methoden?
für jeden Ast im passendsten baum, werden die zwei Bäume
Zuletzt geändertvor 2 Jahren