Wann vergleicht man Sequenzen auf DNA- und wann auf Proteinebene miteinander?
Auf DNA-Ebene vergleicht man nah verwandte Taxa, da hier auch stille mutationen sichtbar sind -> DNA verändert sich schnell
Auf Proteinebene vergelicht man weiter entferntere taxa mit längerer Evolutionszeit. Stille Mutationen sind hier nicht sichtbar.
-> leichter Ähnlichkeiten zu erkennen, auch wenn sich die DNA-Sequenz stark unterscheidet
Um was für ein gen handelt es sich, wenn eine Sequenz nur einen Treffer in BLAST hat?
Single copy Gene
Was bedeutet bei BLAST query cover und E-value?
Query cover gibt an, wie viel % des Gens in der datenbak abgedeckt sind. (“query” ist die Suchsequenz)
Der E-Value gibt an, mit wie viel % der angezeigte Treffer ein zufälliges Ergenis ist. (also je kleiner desto besser)
Wie heißt der bekannteste Such-Algorithmus für Sequenzdatenbanken und wie funtioniert er?
BLAST:
- Teilt die Suchsequenz in viele überlappende Abschnitte (words) der Länge w und durchsucht die Datenbanksequenz nach einem ersten Hit. Wenn es auch einen zweiten Hit findet, werden Verknüpfungen gesucht.
- Es erkennt bei Proteinen auch biochemische Ähnlichkeiten
Woran kann es liegen, wenn in einem Alignment zwischen der query und Match in BLAST bei einem single copy gene leichte Unterschiede zu erkennen sind?
Mutation im sequenzierten Organismus
Fehler in der Sequenzierung
fehler in der Datenbank
Zuletzt geändertvor 2 Jahren