What is meant by conservative in multiple sequence alignments?
Amino acid was replaced, but same physochemical attributes -> protein structure/function is preserved
Eine Aminosäure wurde ersetzt, aber die gleichen physikochemischen Eigenschaften bleiben erhalten -> Proteinstruktur/Funktion bleibt erhalten
What are epigenetics? Name a tool to identify epigenetic information.
Changes in gene activity by modification -> DNA sequence not altered
Tool: Bisulfite sequencing’s purpose is to identify and map methylated cytosines in DNA, providing high-resolution epigenetic information about gene regulation, development, disease, and environmental effects
Änderungen der Genaktivität durch Modifikation -> DNA-Sequenz nicht verändert
Werkzeug: Zweck der Bisulfit-Sequenzierung ist es, methyliertes Cytosin in der DNA zu identifizieren und zu kartieren, um hochauflösende epigenetische Informationen über Genregulation, Entwicklung, Krankheiten und Umwelteinflüsse bereitzustellen
What is the difference between similarity and identity?
Similarity -> conserved amino acid ; same function/structure
Identity -> same amino acid
Ähnlichkeit -> konservierte Aminosäure; gleiche Funktion/Struktur
Identität -> gleiche Aminosäure
What is more reliable: pairwise alignment or multiple sequence alignement?
Multiple sequence alignment -> stastically significant
MSA implies PSA
What is a PAM matrix?
-substitution matrix to score how likely a amino acid is to be replaced by another
-also shows how far/close species are
-mechanism is used by BLAST (BLOSUM62)
-Substitutionsmatrix, um zu bewerten, wie wahrscheinlich es ist, dass eine Aminosäure durch eine andere ersetzt wird
-zeigt auch, wie nah oder fern Arten voneinander sind
-Mechanismus wird von BLAST (BLOSUM62) verwendet
What is an alignment? Name two variants.
An alignment is the identification of correspondences between different items to extract knowledge
Pairwise sequence alignment:
local/global alignment of two sequences (BLAST)
Multiple sequence alignment:
Aligns three or more sequences simultaneously to identify conserved motifs, evolutionary relationships, and structural/functional constraints (T-coffee)
Ein Alignment ist die Identifizierung von Übereinstimmungen zwischen verschiedenen Elementen, um Wissen zu extrahieren.
Paarweise Sequenzalignment:
Lokale/globale Ausrichtung von zwei Sequenzen (BLAST)
Mehrfachsequenzalignment:
Richtet drei oder mehr Sequenzen gleichzeitig aus, um konservierte Motive, evolutionäre Beziehungen sowie strukturelle/funktionelle Einschränkungen zu identifizieren (T-Coffee)
How can we spot/ differ gaps in an alignment as either in/del?
metrics (matrices) are needed to study the distance betqween the length of the sequences—>gaps
Multiple sequence alignment is needed so say if the gap in an alignment is an deletion/insertion
Metriken (Matrizen) werden benötigt, um den Abstand zwischen den Längen der Sequenzen zu untersuchen—> Lücken
Eine Mehrfachsequenzalignment ist erforderlich, um sagen zu können, ob die Lücke in einem Alignment eine Deletion oder Insertion ist
What´s the Hamming distance and the Levensthein distance? What´s the difference?
-Hamming distance is a metric that measures the number of positions at which two strings of equal length differ, commonly used in error detection and correction—> sequence needs same length
Levensthein distance is a measure of the similarity between two strings—>sequence doesn´t need same length
both do not include properties of Pyrimidines and Purines—> PAM matrices
-Die Hamming-Distanz ist eine Metrik, die die Anzahl der Positionen misst, an denen sich zwei Strings gleicher Länge unterscheiden, und wird häufig zur Fehlererkennung und -korrektur verwendet—> die Sequenz muss die gleiche Länge haben
Die Levenshtein-Distanz ist ein Maß für die Ähnlichkeit zwischen zwei Strings—> die Sequenz muss nicht die gleiche Länge haben
Beide berücksichtigen nicht die Eigenschaften von Pyrimidinen und Purinen—> PAM-Matrizen
What´s the difference between brute force algorhythms and dynamic programming?
Dynamic programming is much more efficient, need less computation time. It uses heuristic AI
What´s the purpose of phylogeny in bioinformatics?
In bioinformatics, phylogeny refers to the evolutionary relationships among organisms, genes, or proteins, usually represented as a phylogenetic tree:
Nodes represent ancestors
Branches represent evolutionary divergence
Branch length can represent evolutionary distance (mutations, substitutions)
In der Bioinformatik bezieht sich Phylogenie auf die evolutionären Beziehungen zwischen Organismen, Genen oder Proteinen, die normalerweise als phylogenetischer Baum dargestellt werden:
Knoten repräsentieren Vorfahren
Äste repräsentieren evolutionäre Divergenz
Die Astlänge kann die evolutionäre Entfernung (Mutationen, Substitutionen) darstellen
How can you approach building a phylogenetic tree? What tools do you know?
Phenetic = hierarchical clustering by similarity (UPGMA method —> distance matrices)
Cladistic = ancestor of each node (Cladogramm)
—>reflects true evolutional history
—>multiple sequence alignment tools like T-Coffee
Phenetisch = hierarchisches Clustering nach Ähnlichkeit (UPGMA-Methode → Distanzmatrizen)
Kladistisch = Vorfahr jedes Knotens (Kladogramm)→ spiegelt die wahre evolutive Geschichte wider
→ Werkzeuge für Multiple-Sequence-Alignment wie T-Coffee
Zuletzt geändertvor 7 Tagen