Wie unterscheidet sich die Gendichte von Bakterien mit der von höheren Eukaryoten?
Prokaryoten: 90%
Eukaryoten: 1-2%
Prokaryoten fast keine intronic regions, gengruppen werden in sogenannten Operons organisiert
Wie wird das Sequenzlogo mit dem EM-Algorithmus dargestellt?
start with initial motif guess
calculate first motif
Use motif model to update position likelyhoods (E-Step)
Use likelyhoods to update the motife (M-step)
Repeat until convergence
Was wird mit der Höhe der Abschnitte in einem Sequenzlogo ausgesagt?
information content
how conserved the site is
Warum ist es wichtig auch Pseudogene zu kennen?
pseudogenes:
non-functional sequences of genomic DNA
conventional:
duplicates with mutations e.g.
processed:
transcribed DNA that is reinserted
no introns, no promoters …
—> inactive
why analyse?:
can interfere with PCR/in situ hybridization
pseudogenes provide molecular record on the dynamics and evolution of genomes
Improvement of gene prediction and annotation efforts
Was bedeutet multiplicity und co-operativity in Zusammenhang mit miRNA target Interaktionen?
multiplicity:
one miRNA can target more than one gene
from ~250 to a few
most only a few
co-operativity:
One gene can be controlled by more than one miRNA
from ~20 to 1
most genes not more than 4 targets (for miRNA)
Wie verändert sich die Präzision wenn das Target mit dem Informaten übereinstimmt?
gene prediction
combine information from 2 genome alignments with DNA models (splice donors and acceptors, start, stop codons ..)
way less false positives compared to GENSCAN
Präzision geht nach unten —> zu gleiche genome sind schlecht für dual-genome gene prediction
Wie kann es dazu kommen, dass in ein Transkript ein alternatives Exon hunzugefügt wird und das zu einem verkürzten Protein-Produkt führt?
alternative initiation
Start an anderer Position —> frame shift
start wird durch das Exon ausgelöst
alternative termination
Hinzufügen Stopp-Codon
frame shift durch nicht durch 3 teilbares
termination codon in mitte
(ändern des inneren bereich durch insertion/deletion)
Nennen Sie den Proteinkomplex der dafür zuständig ist, dass tierische pre-miRNA in miRNA umgewandelt wird
Pri to pre by dorsha/pasha
pre-miRNA cleaved by dicer, in a imperfect double-stranded duplex
Incorporated into RISC
From RNA-induced splicing complex, to the gene or mRNA
Wie wirkt sich eine Vergrößerung des Frameshift der ORF-Länge auf die Genauigkeit der Vorhersage aus?
Falsche Proteinsequenzen
Veränderte Aminosäurensequenzen
Vorzeitige Stoppcodons
Verlust von Domänen
Funktionsverlust
Fehlfaltung
Vorhersageungenauigkeit
Fehlerhafte bioinformatische Vorhersagen
Fehlinterpretation von Daten
Evolutionäre Konsequenzen
Negative Selektion gegen Frameshift-Mutationen
Tools und ihre Funktionen
ORPHEUS
Geneprediction bacterial
Sift
SNP’s effect prediction
MiR
Suite for miRNA analysis
Welche Eigenschaften hat ein starker Promoter?
gut konservierter Promoter (Konsensusequenz)
35er und 10er Region (vor Start)
Was ist ein Sigma Faktor? Wofür wird dieser in der Transkription benötigt? Welcher Sigma Faktor tritt am häufigsten auf ?
wesentliche Rolle bei Initiaition der Transription bei Prokaryoten
teil der RNA-Polymerase
Ermöglicht Bindung an Promotersequenz
sigma^70 (E.coli)
Drei Unterschiede des Whole genome Shotgun und Clone-by-clone Verfahrens
Clone-by-clone shotgun: BAC clones werden benötigt, clones vorher mappen
Whole genome shotgun: Mapping-Phase wird übersprungen, Assembly dauert länger
Welches Verfahren wird eher für prokaryotische und welches für eukaryotische Genome verwendet? Erklären Sie genau warum dies so ist?
Eukaryotische Genome: Aufgrund ihrer größeren Größe und höheren Komplexität wird für eukaryotische Genome häufig das Clone-by-Clone-Verfahren verwendet. Dieses Verfahren ermöglicht eine geordnete und detaillierte Sequenzierung, was besonders wichtig für die Handhabung komplexer Strukturen und repetitiver Sequenzen ist.
Prokaryotische Genome: Für prokaryotische Genome, die kleiner und weniger komplex sind, wird bevorzugt die Shotgun-Sequenzierung eingesetzt. Diese Methode ist schneller und kosteneffizienter und eignet sich gut für die einfache Assemblierung der weniger komplexen prokaryotischen Genome.
Nennen Sie vier alternative splicing Verfahren
Wodurch kann man herausfinden, ob ein alternatives Splicing Event statt gefunden hat. Nennen Sie die Vorgehensweise
Computational
EST (Expressed sequence tag)
mRNA nur aus Exons -> cDNA
Abgleich mit Genom
Vergleichen verschiedener Splices
highly conserved introns can help to verify candidate splices
Experimentally:
RT-PCR
using primers that flank the as-region
high-throughput by microarrays
(Alternative splicing)
Welche Auswirkungen hat es, wenn das Proteinprodukt dadurch größer wird?
Alter protein binding properties, eg. receptor/ligand
Alter intracellular localization, eg. membrane insertion
Alter extracellular localization, eg. secretion
Alter enzymatic or signaling activities
Alter protein stability, eg. inclusion of cleavage sites
Insertion of post-translation modification domains
Change ion channel properties
Was für einen Vorteil hat es, wenn Gene sich zu einem Operon zusammengefügt haben?
Gene die einem Prozess zugehören können in einem Schritt transkribiert werden
schnelle Anpassung
funktion kann schnell gesilenced werden
genauso schnell aktiviert werden
energetische effizienz
Welche Daten werden für die Operon-Vorhersage benötigt?
(chatGTP weil nichts von Vorlesung)
Genomsequenz
Annotierte Gene
Promotor- und Terminator-Signale
Intergenische Abstände
Co-Expression Daten
Phylogenetische Profile und Konservierung
Regulatorische Sequenzen und Motive
Datenbanken und bioinformatische Tools
Welche zwei Klassen von Informationen werden in der Genvorhersage verwendet? Nennen sie je zwi Unterklassen dieser Informationen
intrinsic evidence:
ausreichende ORF Länge, lang eigentlich kein Zufall
spezifische Pattern von Codons (“coding potential”)
ribosome binding site (-20 bis -1)
extrinsic evidence:
Ähnlichkeit zu Bekanntem, vor allem experimetiell characterisierte, gen produkte
Skizzieren Sie den Ablauf von GenScan
a) Erklären Sie die einzelnen Schritte und skizzieren Sie diese
b) Wie könnte man obige Formel noch verbessern?
a)
i und j sine basen Paar, hinzugefügt zur Struktur bis i+1, j-1
i nicht gepaart und zu struktur i+1, j hinzugefügt
j nicht gepaart und zu struktur j+1, i hinzugefügt
i und j sind Basenpaar, über k als Gegenüber von i und k zu k+1 auf j Seite
b)
Considering pseudoknots, they cause a breakdown in the Dynamic Programming Algorithm
check whether base is already paired, break recurrence relations
Nennen Sie alle Klassen von interspersed repeats
retrotransposons:
LTR (long-terminal repeat transpons)
LINEs (long intersped elements)
SINEs (short interspersed elements)
DNA transposons:
Cut and paste mechanism
Nennen Sie 2 Eigenschaften von interspersed Repeats
~45% of the human genome
derived from biologically active “transposable elements”
Welche drei anderen repitiven Sequenzklassen gibt es noch ? (Außer interspersed)
tandem repeats
segmental duplications
Pseudogenes
Welche Unterschiede gibt es von interspersed Klassen zu den in c) genannten?
(
pseudogenes
)
(?)
stop codon or frameshift mutation
very high sequence identity
repeat dircetly follows origin
Was versteht man unter SNP?
single nucleotide polymorphism
single nucleotide mutation
mostly non-coding regions
Welche 2 Klassen unterscheidet man bei SNPs und was ist der Unterschied bei diesen?
in coding regions SNPs are either:
synonymous:
no change in AA sequence
non-synonymous:
change in AA sequence
Wieso kann es durch SNPs auf kodierenden und nicht kodierenden Regionen zu Krankheiten führen?
synonymous can alter the gene expression
Nennen Sie drei Unterscheide von Pflanzen miRNA und tierischer miRNA
Was sind covariance models, was sind deren Ziel?
Beschreiben sekundäre Struktur und primären Sequenz Konsensus einer RNA
Ziel, Anwendung bei:
Konsensus sekundäre Struktur Vorhersage
Multiples Sequenz Alignment
Datenbanken similarity searching
(Covariance models)
Welche Daten benötigt man für deren Berechnung?
Werden automatisch berechnet aus:
existierenden RNA sequenz Alignments
auch von ursprünglich nicht alignierten Beispielsequenzen
Welche Nachteile haben Covariance models ?
(Chat-GTP weil keine Antwort gefunden)
Hoher Rechenaufwand
deswegen auch limitierte Sequenzlänge
Stark abhängig von Qualität des MSA Input
Nennen Sie 3 Unterschiede zwischem Prokaryotischem und Eukaryotischem Genom
Alternative Splicing
Organisation in Operons
Gendichte:
1 Gen pro 100.000 Basen Eukaryoten
1 Gen pro 1000-1400 Basen Prokaryoten
Last changed3 months ago