Was versteht man im Zusammenhang mit Sequenzierung unter dem Begriff „Assemblierung“?
Durch die technisch bedingte Begrenzung der Leselänge werden längere DNA-Moleküle in kleinen Stücken schrittweise sequenziert und danach zusammengesetzt.
Genstruktur Prokaryoten
Nennen Sie zwei wichtige Unterschiede die Genorganisation von Pro- und Eukaryoten betreffend.
Eukaryoten-Gene sind in Exons und Introns aufgeteilt und werden meist gespleißt, Prokaryoten-Gene sind meist in Operons arrangiert.
Definieren Sie den Begriff „Exon“.
Als Exon wird der Teil eines eukaryotischen Gens bezeichnet, der nach dem Spleißen erhalten bleibt. (nicht immer kodierend!)
Beschrifte
Definieren Sie den Begriff „Offener Leserahmen“ (ORF).
DNA-Abschnitt ohne Stopcodon, der sich in eine ununterbrochene Aminosäuresequenz übersetzen lässt.
Beschreiben Sie kurz die Funktionsweise von Hidden Markov Models (HMMs).
Aus einem Trainingsdatensatz wird ein HMM erstellt. Dabei handelt es sich um einen stochastischen Prozess, der nacheinander eine Reihe von Zuständen mit einer gewissen Wahrscheinlichkeit durchläuft. Dabei hängt die Wahrscheinlichkeit für den jeweils nächsten Zustand nur vom aktuellen Zustand ab. Das HMM verwendet statistische Informationen um Abfolgen (z.B. Sequenzen) zu klassifizieren. Anhand der statistischen Häufigkeiten wird bewertet, ob eine Sequenzabfolge gut in das Schema passt
Nennen Sie zwei Anwendungsbeispiele für HMMs in der Bioinformatik.
Vorhersage der Genstruktur (Exons, Introns), Vorhersage von Promoterbereichen -> ORF-finder
Beschreiben Sie das grundsätzliche Vorgehen bei Datenbanksuchen zur Identifizierung von Genen. Verwenden Sie hierbei Fachbegriffe!
Die uncharakterisierte Sequenz (query) wird mit allen Sequenzeinträgen verglichen. Ein Match auf Nukleotid- oder Aminosäure-Ebene ist der direkte Beweis, dass in der query ein Gen liegt.
Wofür steht die Abkürzung „BLAST“ und was beschreibt dieser?
Basic Local Alignment Search Tool, zum Vergleichen von DNA- sowie Protein-Sequenzen mit Datenbankeinträgen
Nennen Sie drei Vorteile von Molekularer Phylogenie im Vergleich zu Klassischer Phylogenie.
Konstengünstig, keine Umwelteinflüsse wie beispielsweise beim Vergleich von Schädelformen, ermöglicht Vergleiche von weit entfernten taxa
Wofür werden Substitutionsmatrizen verwendet? Nennen Sie ein Beispiel für eine Substitutionsmatrix.
Über Substitutionsmatrizen werden „Kosten“ und „Belohnungen“ von Aminosäure-austauchen definiert. Dabei bestimmt die chemisch-funktionelle Ähnlichkeit zweier Aminosäuren die Wahrscheinlichkeit eines Austauschs von Einer zur Anderen infolge einer Mutation. Ein Beispiel für eine Substitutionsmatrix ist die PAM-Matrix (PAM = Point Accepted Mutation).
Beschreiben Sie kurz die Funktionsweise des Needleman-Wunsch Algorithmus und wofür er verwendet wird.
Erstellung einer zweidimensionalen Matrix mit den beiden zu vergleichenden Sequenzen, der Alignment-Score für die einzelnen Matrixpositionen (für den Vergleich zwischen zwei Sequenzpositionen) berechnet sich aus einer Substitutionsmatrize, das Alignment ergibt sich als „Pfad“ durch die Matrix mit der höchsten Endsumme -> Alignment-Erstellung
Beschreiben Sie kurz die Vorgehensweise des Progressiven Alignments für mehrere Sequenzen.
paarweiser Vergleich aller Sequenzen miteinander
Berechnung der Distanzen zweier Sequenzen
Gruppieren der Sequenzen nach Ähnlichkeit (Cluster-Bildung)
Erstellung paarweiser Alignments
sukzessives Alignment nach Ähnlichkeit (ähnlichste Sequenzpaare zuerst)
Worauf beruht das Stammbaum-Rekonstruktionsverfahren UPGMA?
Berechnung von Distanzen zwischen alignierten Sequenzen
Last changed2 years ago