Was versteht man unter Primär- bzw. Sekundär-Datenbank?
Primärdatenbanken sind Sequenzdatenbanken. Sekundärdatenbanken entnehmen aus anderen Datenbanken Informationen und sortieren und ergänzen die Informationen nah bestimmten Gesichtspunkten (z.B. Enzymdatenbank)
Welches ist die größte Nukleotid-Datenbank und zu welcher Institution gehört sie?
Die Genbank gehört zu NCBI
Welche Datenbanken sind älter: Nukleotid- oder Protein-Datenbank und Warum?
Proteinsequenzierung gibt es schon seit Mitte der fünfziger Jahre, während die DNA-Sequenzierung erst Anfang der siebziger Jahre entwickelt wurde. Daher gab es zuerst Proteindatenbanken.
Was versteht man unter Annotation?
Das Hinzufügen von zusätzlichen Daten zu Primärdaten.
Welche Datenbank ist die vom Umfang her größte vom Menschen erschaffene Datenbank?
Die Meterologische Datenbank
Welches sind die drei wichtigsten Nukleotid-Datenbanken?
Genbank, EMBL-Datenbank und DNA Data Bank of Japan
Welche Hauptaufgabe hat die ISNDC?
Die ISNDC sorgt für den täglichen Austausch von Daten zwischen den drei großen amerikanischen, europäischen und japanischen Datenbanken.
Welche Substanzklasse spielt neben den Nucleinsäuren und den Proteinen eine wichtige Rolle in den Datenbanken und warum? (eher nicht klausurrelevant)
Kohlenhydrate …
Nennen Sie zwei nicht elektronische Datenbanken aus dem letzten Jahrhundert?
Bücher, Mikrofilme
In welchem Journal werden jährlich biologische Datenbanken aufgelistet?
Nucleic Acids Research
Wie viele biologische Datenbanken gibt es ungfähr? (eher nicht klausurrelevant)
ca. 380 Tendenz steigend
Nennen Sie eine 3D-Struktur-Datenbank
wwPDB
Nennen Sie drei Methoden wie man von organischen biologisch aktiven Substanzen 3D-Strukturen erhalten kann. (eher wichtig)
Kristallstrukturen, NMR-Spektrometer und Computersimulation
Nennen Sie eine für sich isolierte biologische Datenbank.
gibt es nicht
Was versteht man unter “small molecule Datenbanken”?
Sie speichern Daten zu nicht polymeren Substanzen.
Welche Gründe gibt es für Redundanz in Sequenzdatenbanken?
-Genomische Sequenzen (mit Introns) / cDNA / mRNA mit jeweils eigenen Einträgen
-bei cDNA / mRNA : Splice-Varianten
-Sequenzierung durch mehrere Gruppen unabhängig voneinander
-Zunächst nur Teilsequenzen ermittelt, später dann vollständige(re) Sequenzen
Polymorphismen oder Sequenzierfehlern
Was ist das FASTA-Format?
Es ist ein textbasiertes Format zur Darstellung und Speicherung der Primärstruktur von Nukleinsäuren und Proteinen in der Bioinformatik. Die Nukleinbasen bzw. Aminosäuren werden durch einen Ein-Buchstaben-Code dargestellt
Was ist Exon und Intron?
Die Introns sind die nicht codierenden Abschnitte der DNA innerhalb eines Gens, die benachbarten Exons (codierende Abschnitte) von einander trennen.
Was ist eine Sequenzdatenbank?
Nukleotid-/Proteinsequenzen
-speichern Primärstruktur (sequenz) mit wenigen weiteren Informationen
-Primär-Datenbanken
Was ist eine annotierte Datenbank? Bsp.?
speichern Daten zur Funktion, Wechselwirkungen, Modifikationen, etc. zu einem bestimmten Protein
Bsp.: UniProt
Was ist eine 3D-Strukturdatenbank? Bsp.?
speichern experimentell ermittelte 3D-Strukturen
Bsp.: PDB
Was ist eine small molecule Datenbank? Bsp.?
speichern Daten zu nicht-polymeren Molekülen
Bsp.: PubChem
Was ist eine abgeleitete Datenbank?
sammeln Daten aus anderen Datenbanken zu einem bestimmten Thema (z.B. bestimmte Enzymfamilie) oder zu einer bestimmten Eigenschaft (z.B. Sequenzverwandschaft)
Sekundär-Datenbank
Welche Datenbanken haben sich zu UniProtKB zusammengeschlossen?
SwissProt, TREMBL, PIR
Warum ist die TREMBL Datenbank viel größer und wächst schneller als SwissProt, obwohl SwissProt 10 Jahre länger existiert als TREMBL?
SwissProt wird manuell gepflegt, TREMBL automatisch
Zählen Sie Vor- und Nachteile manueller bzw. automatischer Datenpflege auf.
manuelle:
genauer, weniger fehleranfälliger
dauert lange, personalkosten
automatisch:
geht schneller, günstiger
fehleranfällig
Was gibt der Annotation-Score bei UniProtKB an?
wieviele Daten ein Eintrag enthält -> Quantität
sagt aber nichts über die Qualität der Einträge aus
Nennen Sie 5 Daten, die man aus UniProtKB herausziehen kann.
Mutation
AS-Sequenz
Signalpeptid
Sekundärstruktur
pH-Optimum
Welche Substanzklasse ist in der ExPASy Datenbank hinterlegt?
Enzyme
Nennen Sie 5 Daten, die zu Enzymen in BRENDA hinterlegt sind.
Hemmstoffe
Reaktionsgleichung
Ionen
Temp. - Optimum
Was versteht man unter einer Ligase (EC 6) ?
Ligasen katalysieren die Verknüpfung zweier Moleküle durch eine kovalente Bindung?
Was versteht man unter KEGG Wegkarten?
Netzwerk molekularer WW und Reaktionen
Nach welchen Unterpunkten ist die KEGG Pathway Datenbank untergliedert?
Metabolismus
genetische Informationsverarbeitung
Umweltinformationsverarbeitung
zelluläre Prozesse
Organische Systeme
Humane Erkrankungen
Medikamentenentwicklung
Mit welchen Datenbanken pflegt die RCSB PDB (3D-Struktur-DB) regelmäßigen Austausch von Daten?
PDBe, PDBj, BMRB
Welche experimentell gewonnene Struktur Daten werden in der RCSB DB aufgenommen?
x-ray, NMR, Kyro-Elektronenmikroskopie
Welche Arbeitsschritte umfasst die Kristallstrukturanalyse?
Expression und Aufreinigung des Proteins
Kristallisation
Beschuss mit Röntgenstrahlen, Messung des Diffraktionsmusters
Errechnung der Elektronendichte aus den Diffraktionsdaten
Positionierung der Atome in den Elektronendichte-Karten
Welche Vor- und Nachteile hat die Strukturbestimmung mittels NMR?
Dynamik ist erkennbar
Größenlimitation
die Probe muss rein sein
Lösungsmitteleinfluss
Was ist der Ramachandranplot?
Bestimmte Aminosäuren haben ihre bevorzugten Psi und Phi Torsionswinkel, die im Ramachandranplot dargestellt werden.
Wie entsteht die Redundanz in der PDB-Datenbank?
Unterschiedlichen Auflösungen
Mutationen
Erst Teilstruktur ermittelt, später komplette Strukturen
Strukutren allein oder mit Ligand
Strukturen bei unterschiedlichen Bedingungen (pH,Temp.,…)
Welche Datenbank pflegt Proteinstrukturen aus Computersimulationen?
Modbase
Was versteht man unter einer biologischen abgeleiteten Datenbank?
abgeleitete biologische Datenbanken filtern und interpretieren die Informationen der primären Datenbanken nach bestimmten Kriterien
Was versteht man unter “consensus pattern”?
consensus pattern stellen charakteristische Muster dar, die z.B. beim Vergleich von Proteinen auftreten
Was ist ein globales Alignment?
Gesamtsequenz
-> Das Alignment umfasst beide sequenzen von der ersten bis zur letzten position
was ist ein lokales alignment?
Teilsequenzen
-> alignment zweier sequenzzen wobei nur die teilsequenzen zzugeordnet werden die einen maximalen score erreichen
-> mismatches und gaps an anfang und ende werden abgeschnitten
-> bereiche mit geringer ähnlichkeit werden nicht verwendet
-> kann identisch mit globalem alignment sein+
nennen sie verschiedene algorithmen zur berechnung von sequenzalignments
wunsch
hirschberg
smith-waterman
gotho
bei der score berechnung von alignments muss man verschiedene fälle unterscheiden. Welche sind das?
Match: I
Mismatch: .
Gap: =
Folgegap: -
ähnlichkeit: +
wie berechnet sich der score beim needleman-wunsch algorithmus?
pro verglichenem wert +4
gap -20
folge gap -5
mismatch -7
nennen sie drei wesentliche unterschiede bei der score berechnung nach dem needleman-wunsch und dem smith waterman algorithmus?
needleman wunsch ist immer ein globales alignment
bei needleman wunsch gibt es folgegaps
needleman wunsch kann außen gaps bzw folgegaps haben, smith waterman nicht
Matrizen
Smith-Waterman
seitlich -7
runter -7
Diagonal -1 und 5
Last changed5 months ago