Was ist Präzisionsmedizin?
Präzisionsmedizin ist ein medizinischer Ansatz, bei dem Diagnose und Therapie individuell an die genetischen, biomolekularen, umweltbedingten und lebensstilbezogenen Merkmale eines Patienten angepasst werden.
Ziel:
Höhere Wirksamkeit
Weniger Nebenwirkungen
Personalisierte Therapien
Prävention von Krankheiten
Wichtige Werkezeuge:
Genom-Analyse
Biomarker
Künstliche Intelligenz / Big Data
Biobanken
Unterschied zur klassischen Medizin:
Klassische Medizin: „One-size-fits-all“
Präzisionsmedizin: „Die richtige Behandlung für die richtige Person zur richtigen Zeit“
Was sind Prädikative Marker und was ist ein Beispiel?
Definition: Prädiktive Marker sind biologische Merkmale, die anzeigen, ob ein Patient auf eine bestimmte Behandlung ansprechen wird.
Zweck:
Therapiewahl optimieren
Nebenwirkungen vermeiden
Behandlungskosten reduzieren
Beispiele:
HER2 bei Brustkrebs: Nur HER2-positive Patientinnen sprechen auf Trastuzumab (Herceptin) an.
EGFR-Mutation bei Lungenkrebs (nicht-kleinzellig): Patienten mit einer EGFR-Mutation sprechen besser auf EGFR-Tyrosinkinase-Inhibitoren wie Erlotinib oder Gefitinib an.
Unterscheidung zu prognostischen Markern:
Prädiktiv = sagt das Ansprechen auf eine Therapie voraus
Prognostisch = sagt den generellen Krankheitsverlauf voraus
Was sind prognostische Biomarker und ein Beispiel?
Definition: Prognostische Biomarker sind biologische Merkmale, die den wahrscheinlichen Verlauf einer Erkrankung anzeigen – unabhängig von der Behandlung.
Einschätzung von Krankheitsverlauf, Rückfallrisiko oder Überlebenswahrscheinlichkeit
Entscheidung über Therapieintensität oder Nachsorge
Tumorstadium bei Darmkrebs: Fortgeschrittene Stadien (z. B. Stadium III oder IV) sind mit einer schlechteren Prognose verbunden – unabhängig von der gewählten Therapie.
LDH-Wert bei malignem Melanom: Ein erhöhter LDH-Wert (Laktatdehydrogenase) ist ein Hinweis auf eine ungünstige Prognose – unabhängig von der Therapieform.
Was für eine Rolle spielt NGS in der Präzisionsmedizin?
Definition NGS: Next Generation Sequencing (NGS) ist eine moderne Methode zur schnellen und umfassenden Analyse des Erbguts (DNA/RNA).
Bedeutung in der Präzisionsmedizin: NGS liefert genetische Informationen, die helfen, prädiktive und prognostische Marker zu identifizieren.
Bezug zu vorherigen Themen:
Prädiktive Marker:
NGS erkennt Mutationen (z. B. EGFR bei Lungenkrebs oder HER2 bei Brustkrebs), die das Ansprechen auf gezielte Therapien vorhersagen.
Prognostische Marker:
NGS kann genetische Veränderungen (z. B. TP53-Mutationen) aufdecken, die mit einem ungünstigen Krankheitsverlauf verbunden sind – unabhängig von der Behandlung.
Vorteile von NGS:
Hohe Geschwindigkeit & Genauigkeit
Analyse vieler Gene gleichzeitig
Grundlage für individuelle Therapieentscheidungen
Was kann mit NGS sequenziert werden?
1. Whole Genome Sequencing (WGS):
Das gesamte Genom (alle DNA-Bereiche, inkl. codierend & nicht-codierend) wird sequenziert.
Sehr umfassend, teuer & datenintensiv.
2. Whole Exome Sequencing (WES):
Nur die exonischen (codierenden) Abschnitte (~1–2 % des Genoms), wo die meisten krankheitsrelevanten Mutationen auftreten.
Kostengünstiger als WGS, hoher klinischer Nutzen.
3. Targeted Sequencing / Genpanels:
Nur ausgewählte Gene oder Genabschnitte werden analysiert, z. B. ein Krebs-Panel mit häufig mutierten Genen.
Schnell, günstig, für Diagnostik sehr effektiv.
4. Transcriptom-Sequenzierung (RNA-Seq):
Sequenzierung der RNA (statt DNA), um zu sehen, welche Gene tatsächlich aktiv (exprimiert) sind.
Wichtig für funktionelle Einblicke in Zellen.
5. Epigenom-Sequenzierung (z. B. Methylierungsanalyse):
Analyse von epigenetischen Veränderungen (z. B. DNA-Methylierung), die die Genaktivität regulieren – ohne die DNA-Sequenz selbst zu verändern.
Was ist Sequencing by Synthesis?
Illuminas „Sequencing by Synthesis“ ist eine Methode der Next Generation Sequencing (NGS), bei der die DNA durch schrittweises Einbauen fluoreszenzmarkierter Nukleotide sequenziert wird.
Ablauf (vereinfacht):
Fragmentierung der DNA
Adapter-Anlagerung
Clusterbildung (durch Bridge-PCR auf einer Flow Cell)
Sequencing by Synthesis:
Einbau von fluoreszenzmarkierten, reversibel blockierten Nukleotiden
Nach jedem Einbau: Lichtsignal wird gemessen (welcher Buchstabe?)
Blockade wird entfernt → nächstes Nukleotid wird eingebaut
Datenanalyse: Basenabfolge wird digital rekonstruiert
Merkmale:
Sehr präzise und hohe Durchsatzrate
Sequenziert Millionen Fragmente gleichzeitig
Besonders geeignet für Whole Genome, Exom, Panels
Vorteile:
Geringe Fehlerquote
Weit verbreitet & gut validiert
Breite Anwendungsbereiche in Forschung & Klinik
Was ist Paired-end sequencing?
Pair-End Sequencing sequenziert beide Enden eines DNA-Fragments und ermöglicht so eine präzisere Ausrichtung von Short Reads (kurzen Fragmenten) im Genom.
Mehr Kontext: Beide Enden eines Fragments bieten zusätzliche Informationen für die genaue Positionierung im Genom.
Besseres Alignment: Das zweite Ende hilft, Fehler bei der Zuordnung zu korrigieren und sorgt für genauere Ausrichtung, besonders bei komplexen oder repetitiven Regionen.
Erkennung von strukturellen Varianten: Insertions, Deletionen und andere Varianten werden besser erkannt durch den Abstand der Enden.
Was ist Liquid Biopsy?
Liquid Biopsy ist eine nicht-invasive Methode zur Diagnose und Überwachung von Krebs und anderen Erkrankungen, bei der Körperflüssigkeiten (z. B. Blut, Urin) auf biomolekulare Marker (wie DNA, RNA, exosomen) untersucht werden.
Weniger invasiv als herkömmliche Gewebeproben (Biopsien).
Frühzeitige Erkennung von Krebs oder Rückfällen.
Überwachung von Tumormutationen und Therapieansprechen in Echtzeit.
Anwendungen:
Krebsdiagnostik: Detektion von Tumor-DNA (ctDNA) oder Exosomen im Blut.
Monitoring: Überwachung der Krebsbehandlung, Identifikation von Resistenzmutationen.
Beispiel: Bluttest zur Identifikation von EGFR-Mutationen bei Lungenkrebs, um die Wirksamkeit von Targeted Therapies zu prüfen.
Was ist eine Fastq datei?
Eine FASTQ-Datei ist ein Dateiformat zur Speicherung von Rohsequenzdaten aus der DNA-Sequenzierung. Sie enthält sowohl die Sequenz als auch die zugehörigen Qualitätswerte.
Struktur:
Sequenz-ID: Einzigartige Bezeichnung für den Read.
DNA-Sequenz: Die basierte Sequenz (A, T, C, G).
Plus-Zeichen (+): Trennt die Sequenz von den Qualitätswerten.
Qualitätswerte: Ein ASCII-String, der die Zuverlässigkeit jeder Base (A, T, C, G) angibt.
Verwendung:
Rohdaten nach der Sequenzierung.
Qualitätskontrolle: Die Qualitätswerte helfen, Fehler in den Sequenzdaten zu erkennen.
Vorteil:
Ermöglicht die Analyse der Sequenzdaten zusammen mit der Qualität jeder Base.
Was ist eine QC?
QC (Qualitätskontrolle) bezieht sich auf den Prozess, bei dem die Qualität der Sequenzierungsdaten überprüft wird, um sicherzustellen, dass sie korrekt und zuverlässig sind.
Wichtige Aspekte der QC bei Sequenzierung:
Überprüfung der Qualitätswerte: In der FASTQ-Datei werden für jede Base Qualitätswerte angegeben. QC-Tools analysieren diese, um zu prüfen, ob die Sequenz zuverlässig ist.
Fehleranalyse: Identifikation von möglichen Sequenzierungsfehlern oder biases, die die Genauigkeit beeinträchtigen können.
Längenverteilung: Überprüfung der Länge der Reads (z. B. für Short Reads oder Long Reads), da zu kurze Reads die Analyse erschweren können.
GC-Gehalt: Der GC-Gehalt (Verhältnis von Guanin und Cytosin zu Adenin und Thymin) kann ebenfalls ein Indikator für die Datenqualität sein.
Tools für QC:
FastQC: Ein populäres Tool zur schnellen Qualitätsbewertung von FASTQ-Dateien.
MultiQC: Kombiniert mehrere QC-Berichte zu einer Übersicht.
Was ist Mapping bzw. Alignment?
Mapping bzw. Alignment bezieht sich auf den Prozess, bei dem Sequenzierungsreads (z. B. aus einer FASTQ-Datei) mit einer Referenzsequenz (z. B. einem Referenzgenom) verglichen und ausgerichtet werden.
Zuordnung der Reads zu den entsprechenden Positionen im Genom.
Identifikation von Variationen wie Mutationen, Insertionen oder Deletionen im Vergleich zur Referenz.
Vorgehensweise:
Reads werden sequenziert (z. B. in FASTQ-Dateien).
Mapping/Alignment-Algorithmus vergleicht die Reads mit einer Referenzsequenz.
Optimierung der Ausrichtung: Suche nach der besten Übereinstimmung, auch bei kleinen Fehlern oder Mutationen.
Was ist die Quantifizierung und warum sollte man Normalisieren?
1. Quantifizierung bei der Sequenzierung:
Definition: Quantifizierung bezieht sich auf die Messung der Gen- oder Transkriptmenge in einer Probe anhand der Sequenzierungsdaten (z. B. RNA-Seq oder DNA-Seq).
Sequenziertiefe (Sequencing Depth):
Die Sequenziertiefe beschreibt, wie viele Reads pro Region oder Gesamtproben-Sequenz erzeugt werden. Eine höhere Sequenziertiefe erhöht die Genauigkeit und Vollständigkeit der Quantifizierung.
Hohe Tiefe = Höhere Empfindlichkeit und Präzision bei der Quantifizierung seltener Transkripte oder Varianten.
Niedrige Tiefe = Möglicherweise Unterrepräsentierung von seltenen Varianten oder Transkripten.
2. Normalisierung bei Sequenzierungsdaten:
Warum normalisieren? Sequenzierungsdaten sind oft nicht direkt vergleichbar, da:
Sequenziertiefe kann zwischen Proben variieren (mehr oder weniger Reads).
Probenmenge (RNA/DNA) kann unterschiedlich sein.
Unterschiedliche Bibliotheksgrößen können das Ergebnis beeinflussen.
Normalisierung ist notwendig, um diese Unterschiede zu korrigieren und verglichen werden zu können, insbesondere bei der genauen Analyse der Genexpression.
Was sind Methoden der Normalisierung?
Methoden der Normalisierung:
RPM (Reads per Million): Normalisiert die Anzahl der Reads pro Probe auf eine Million Reads, sodass unterschiedliche Sequenziertiefen zwischen Proben berücksichtigt werden.
RPKM/FPKM (Reads/Fragments per Kilobase of transcript per Million mapped reads): Normalisierung der Genexpression unter Berücksichtigung der Länge der Gene und der Sequenziertiefe.
TPM (Transcripts per Million): Ähnlich wie FPKM, aber berücksichtigt zuerst die Länge der Gene und dann die Sequenziertiefe. Dies führt zu besseren Vergleichsmöglichkeiten zwischen Proben.
Was bedeutet differentielle Gendiagnostik?
Definition: Die differenzielle Gendiagnostik bezieht sich auf den Prozess, bei dem genetische Variationen zwischen gesunden und kranken Individuen oder innerhalb von verschiedenen Krankheitszuständen analysiert werden, um genetische Marker zu identifizieren, die mit bestimmten Krankheiten oder Zuständen in Verbindung stehen.
Erkennung von Krankheitsursachen durch Identifikation von Genmutationen, die mit bestimmten Krankheitsbildern korrelieren.
Differenzierung zwischen Erkrankungen mit ähnlichen Symptomen, aber unterschiedlichen genetischen Ursachen.
Methoden:
Vergleichende Genomanalyse: Untersuchung der DNA von Patienten und gesunden Kontrollpersonen.
Next Generation Sequencing (NGS): Häufige Anwendung, um mutierte Gene oder genetische Varianten zu identifizieren.
Targeted Genotyping: Fokussiert auf bekannte krankheitsassoziierte Gene oder Mutationen.
Krebsdiagnostik: Identifikation von Tumormutationen für personalisierte Therapien.
Erbkrankheiten: Feststellung von genetischen Mutationen, die zu spezifischen Erbkrankheiten führen.
Präzisionsmedizin: Hilfe bei der Wahl der richtigen Therapie basierend auf den genetischen Unterschieden zwischen Patienten.
Was für Analysen kann man bei der biologischen Interpretation machen und was für Datenbanken gibt es?
-Wo ist das Gen exprimiert
-Was für Funktionen hat es
-pathway enrichment
-drug repositioning
Datenbanken:
-pubmed
-Ensembl (Funktion: Bietet umfassende Genomannotation, Variation und Transkriptomdaten für verschiedene Organismen.)
-uniprot: Liefert detaillierte Funktionen, Strukturen und Wechselwirkungen von Proteinen.
-humanproteinatlas: wo wird es exprimiert
-quickgo: pathway analyse
-connectivity map: beziehung zwischen krankheiten, veränderung der genexpression(signatur genannt), behandlung
Was ist das drug repositioning?
Untersuchung und Anwendung bestehender Arzneitmittel für neue therapeutische Zwecke
Kürzere Entwicklungszeiten: Da bereits umfassende Sicherheits- und Verträglichkeitsdaten vorliegen, kann die klinische Entwicklung schneller voranschreiten.
Kostengünstiger: Die Entwicklungskosten sind oft deutlich niedriger als bei der Entwicklung neuer Medikamente, da viele präklinische Phasen übersprungen werden können.
Erweiterung der Anwendungsmöglichkeiten: Bestehende Medikamente können auf neue Krankheiten angewendet werden, für die keine spezifische Therapie existiert.
Wie funktioniert Drug Repositioning?
Biologische Mechanismen: Analyse von biologischen Mechanismen und Molekularen Zielen, um herauszufinden, ob ein Arzneimittel auch andere Ziele im Körper beeinflussen könnte.
Datenanalyse und Screening: Nutzung von Datenbanken und computergestützten Methoden zur Identifizierung von potenziellen neuen Anwendungsgebieten für bestehende Medikamente.
Wie sieht der klassische Bioinformatik Workflow aus ?
1. Datenerhebung:
Beschreibung: Sammlung der biologischen Daten, z. B. durch Sequenzierungstechnologien (RNA-Seq, DNA-Seq, etc.) oder Experimentaldaten (z. B. Protein-Interaktionsdaten).
Beispiel: RNA-Seq liefert Rohdaten in Form von FASTQ-Dateien.
2. Datenqualitätssicherung (QC):
Beschreibung: Überprüfung und Filtern von schlechten Daten zur Sicherstellung der Datenqualität. Tools wie FastQC werden verwendet, um Sequenzierfehler und unvollständige Reads zu identifizieren.
Beispiel: Trimming von Adaptersequenzen und Entfernen von Reads mit niedriger Qualität.
3. Datenvorverarbeitung:
Beschreibung: Bereinigung und Vorbereitung der Daten für die Analyse. Dies kann das Entfernen von Fehlern, das Trimmen von Reads oder das Zusammenfügen von Paired-End Reads beinhalten.
Beispiel: Adapter-Sequenzen aus den Reads entfernen und nur hochqualitative Reads behalten.
4. Mapping/Alignment:
Beschreibung: Ausrichtung der Sequenzierungsdaten auf eine Referenzsequenz (z. B. Genom oder Transkriptom). Dies hilft dabei, die Positionen und Strukturen der genetischen Variationen zu identifizieren.
Beispiel: Verwendung von Tools wie BWA, Bowtie2 oder HISAT2, um kurze DNA-RNA-Sequenzen auf eine Referenz zuzuordnen.
5. Quantifizierung:
Beschreibung: Bestimmung der Genexpression oder genetischen Varianten (z. B. SNPs, Indels). Häufig verwendet werden RPKM, FPKM oder TPM zur Messung der Transkriptmenge.
Beispiel: Berechnung der Transkriptmengen in RNA-Seq-Daten nach Alignment.
6. Normalisierung:
Beschreibung: Anpassung der Daten, um systematische Verzerrungen durch Sequenziertiefe und Probenunterschiede zu vermeiden, sodass die Daten zwischen Proben vergleichbar sind.
Beispiel: Anwendung von TPM oder RPKM, um Unterschiede in der Sequenzierungstiefe zwischen Proben auszugleichen.
7. Datenanalyse:
Beschreibung: Statistische Analyse der quantifizierten Daten, um genetische Muster zu erkennen, wie z. B. Differenzielle Genexpression oder Mutationen zwischen verschiedenen Bedingungen.
Beispiel: Verwendung von DESeq2 oder edgeR zur Analyse der differenziellen Genexpression in RNA-Seq-Daten.
8. Interpretation der Ergebnisse:
Beschreibung: Interpretation der analysierten Daten in biologischer Hinsicht, z. B. Krankheitsassoziationen oder biologische Mechanismen.
Beispiel: Identifikation von mutierten Genen, die mit Krebs oder anderen Erbkrankheiten in Verbindung stehen.
9. Visualisierung:
Beschreibung: Darstellung der Daten in grafischer Form (z. B. Heatmaps, Volcano Plots oder PCA-Diagramme), um Muster und signifikante Ergebnisse zu verdeutlichen.
Beispiel: Heatmaps zur Visualisierung von Differentiellen Genexpressionen in verschiedenen Proben.
Wichtige Werkzeuge:
Zuletzt geändertvor 19 Tagen