Wofür brauch man die Bioinformatik?
Die Anwendung informatischer Methoden auf biologische Fragestellungen.
Was wird zukünftig das vierte Standbein der Bioinformatik sein?
Vorratsdatenspeicherung - Big Data
Was ist eine Datenbank?
Ein elektronisches System der Datenverwaltung.
Was sind die drei Standbeine der Bioinformatik?
Datenbanken
Sequenzanalyse: Durchsuchen der Datenbanken nach bestimmten Strukturphänomenen, Eigenschaften oder Funktion
Strukturbioinformation: Strukturanalyse aus den Daten der Sequenzanalyse (erzeigen einer 3D-Struktur)
Was ist eine Sequenzdatenbank?
Datenbank für Nukleotid-/Proteinsequenzen
speichern Primärstruktur (Sequenz) mit wenigen Informationen
Primär-Datenbanken
Was sind annotierte Datenbanken?
Insbesonderre UniProt
Speicher Daten zu Funktion, Wechselwirkungen, Modifikation, etc.
Was sind 3D-Strukturdatenbanken?
Insbesondere PDB
Speichern experimentell ermittelte 3D-Strukturen
Was sind “Small molecule” Datenbanken?
z.B PubChem
Speichern Daten zu nicht-polymeren Molekülen
Was sind abgeleitete Datenbanken?
Sekundär-Datenbanken
Sammeln Daten aus anderen Datenbanken zu einem bestimmten Thema (z.B Enzymfamilie) oder zu einer bestimmten Eigenschaft (z.B Sequenzverwandschaft)
Was ist eine der wichtigsten Datenbanken?
Die Genbank von NCBI
öffentlicge Nucleotid-Sequenzdatenbank
300 Milliarden Basenpaare
Fast jeder kann eine Sequenz einreichen
Mindestlänge der Basenpaare 50 Bp
Jeder Eintrag bekommt eindeutige Accession Number
Redundant
Wird alle 24h gegen EMBL-Bank und DNA DataBank of Japan synchronisiert
Was bedeutet die Redundanz in Sequenzdatenbanken?
Für viele Gene/Proteine gibt es mehrere Einträge in den Sequenzdatenbanken
Gründe dafür sind:
Genomische Sequenzen (mit Introns)/cDNA/mRNA mit jeweils eigenen Einträgen
bei cDNA/mRNA: Splice-Varianten
Sequenzierung durch mehrere Gruppen unabhängig voneinander
Zunächst nur Teilsequenzen erimttelt, später dann vollständige(re) Sequenzen
Polymorphismen oder Sequenzierfehler
Last changed9 months ago