Was ist Genexpression?
- Prozess, bei dem die in einem Gen gespeicherte Information in ein funktionelles Produkt (RNA oder Protein) umgesetzt wird./Messbar über die Menge an mRNA in einer Zelle.
Was ist das Transkriptom?
- Gesamtheit aller RNA-Moleküle, die in einer Zelle zu einem bestimmten Zeitpunkt exprimiert sind./Abbild der aktiven Gene.
Was ist das Ziel von Genexpressionsstudien?
- Identifikation von Unterschieden in der Genaktivität zwischen verschiedenen Bedingungen (z. B. gesund vs. Tumor).
Was ist eine „Differential Expression Analysis“?
- Vergleich der Expressionsniveaus zwischen Gruppen (z. B. Tumorarten) zur Identifikation signifikant veränderter Gene.
Was ist Co-Expression?
- Wenn zwei oder mehr Gene ähnliche Expressionsmuster über verschiedene Proben zeigen./Deutet auf gemeinsame Regulation oder Funktion hin.
Was bedeutet Expression Profiling?
- Erfassung und Vergleich der Expressionsmuster tausender Gene über viele Proben hinweg.
Was ist ein Microarray?
- Experimentelle Plattform mit immobilisierten DNA-Sonden, die fluoreszenzmarkierte cDNA aus Proben binden./Liest Genexpression über Hybridisierungssignal aus.
Was ist RNA-Seq im Vergleich zu Microarray?
- RNA-Seq sequenziert direkt alle RNA-Fragmente./Erfasst sowohl bekannte als auch neue Transkripte und bietet höheren Dynamikbereich.
Was ist der Unterschied zwischen biologischer und technischer Replikation?
- Biologisch: verschiedene Individuen derselben Bedingung./Technisch: wiederholte Messung derselben Probe zur Fehlerkontrolle.
Was ist ein Expressionsvektor?
- Numerische Darstellung der Expressionswerte eines Gens über mehrere Proben hinweg.
Was ist eine Distanz zwischen Expressionsprofilen?
- Maß für Unterschiedlichkeit zweier Genprofile (z. B. Euclidische Distanz, 1 − Korrelation).
Was ist eine Ähnlichkeit zwischen Expressionsprofilen?
- Maß für Gemeinsamkeit oder Gleichlauf zwischen Profilen (z. B. Korrelation, Kosinus-Ähnlichkeit).
Was ist die euklidische Distanz?
- Geometrisches Maß des Abstands zwischen zwei Punkten im n-dimensionalen Raum der Proben./Kleine Distanz → ähnliche Expression.
Was ist die Winkel-Ähnlichkeit?
- Maß für Richtungsgleichheit zweier Vektoren im Merkmalsraum./Winkel 0° → identische Richtung (voll korreliert).
Was ist das Skalarprodukt (Dot Product)?
- Produkt zweier Vektoren = Σ xᵢ·yᵢ./Je größer, desto ähnlicher die Richtung.
Was ist die Korrelation zwischen Genprofilen?
- Maß für linearen Zusammenhang zwischen Expressionsmustern zweier Gene./r = 1 → perfekt gleichgerichtet
Was ist der Unterschied zwischen Distanz und Korrelation?
- Distanz misst Unterschied in Absolutwerten./Korrelation misst Übereinstimmung in Form (Richtung) unabhängig vom Betrag.
Was ist hierarchisches Clustering?
- Verfahren zur Gruppierung ähnlicher Objekte (Gene, Proben) basierend auf Distanz- oder Ähnlichkeitsmaßen.
Was ist ein Dendrogramm?
- Baumstruktur, die Ähnlichkeitsbeziehungen in hierarchischer Clusteranalyse visualisiert./Höhe der Verzweigung = Distanz zwischen Clustern.
Was ist WPGMA?
- Weighted Pair Group Method with Arithmetic Mean./Cluster-Methode, die Distanzen zwischen Gruppen als Mittelwert aller Paarabstände gewichtet berechnet.
Was ist der Unterschied zwischen WPGMA und UPGMA?
- UPGMA (unweighted) behandelt alle Cluster gleich groß,/WPGMA gewichtet Clustergrößen unterschiedlich.
Was ist das Ziel der Clusteranalyse in Genexpressionsdaten?
- Gruppierung von Genen oder Proben mit ähnlichen Expressionsmustern → Erkennung biologischer Subtypen.
Was ist ein Heatmap?
- Farblich kodierte Matrix von Genexpressionen über Proben./Rot = hoch exprimiert, Blau = niedrig exprimiert (je nach Skalierung).
Was ist die Bedeutung von Clustern in einer Heatmap?
- Zeilencluster → Gene mit ähnlicher Regulation./Spaltencluster → Proben mit ähnlichen Expressionsprofilen.
Was sind „Basal-like“, „Luminal A/B“, „HER2“ in Brustkrebsprofilen?
- Molekulare Subtypen basierend auf charakteristischen Genexpressionsmustern./Erlauben genauere Klassifikation als histologische Diagnosen.
Was bedeutet „Molekularer Subtyp“ in der Krebsforschung?
- Gruppe von Tumoren mit ähnlichem Expressionsprofil und biologischem Verhalten.
Was ist der Nutzen molekularer Klassifikation?
- Präzisere Diagnosen und gezieltere Therapien durch Expressions-basierte Unterteilung von Tumoren.
Was ist Daten-Normalisierung in Genexpressionsanalyse?
- Entfernung technischer Einflüsse zwischen Arrays oder RNA-Seq-Samples, um reale Unterschiede sichtbar zu machen.
Was ist Feature Selection in Genexpressionsanalyse?
- Auswahl der Gene, die am stärksten variieren oder zur Klassifikation beitragen.
Was ist eine PCA (Principal Component Analysis)?
- Dimensionsreduktion → fasst Variabilität der Daten in wenigen Hauptkomponenten zusammen./Erlaubt visuelle Trennung von Gruppen.
Was ist der Unterschied zwischen Clusteranalyse und PCA?
- PCA reduziert Dimensionen, Clusteranalyse gruppiert Objekte./Beide ergänzen sich zur Datenexploration.
Was ist eine Signatur (Gene Signature)?
- Gruppe von Genen, deren kombiniertes Expressionsmuster charakteristisch für einen Zustand oder Subtyp ist.
Was ist das Ziel der Brustkrebs-Studie von Perou et al. (2000)?
- Identifikation molekularer Subtypen von Brustkrebs anhand von Genexpressionsprofilen.
Was zeigte die Perou-Studie?
- Brustkrebs besteht aus klar unterscheidbaren molekularen Gruppen (Luminal, Basal, HER2), die klinisch relevant sind.
Was ist der Nutzen solcher Studien?
- Bessere Prognosemodelle, personalisierte Therapieansätze und Einblicke in Krankheitsmechanismen.
Wann verwendet man euklidische Distanz statt Korrelation?
- Wenn absolute Unterschiede der Expressionsniveaus relevant sind (z. B. Gesamtlevel wichtig)./Korrelation ignoriert Betrag, fokussiert nur Muster.
Wann ist Korrelation sinnvoller als Distanz?
- Wenn nur die Form des Profils zählt (z. B. gleiches Muster bei unterschiedlicher Intensität)./Typisch für Co-Expression-Analysen.
Wann nutzt man Kosinus-Ähnlichkeit?
- Wenn Vektoren unterschiedlich skaliert sind, aber Richtung entscheidend ist./cos θ ≈ 1 → ähnliche Regulation.
Wann verwendet man Spearman statt Pearson?
- Bei nicht-normalverteilten oder rangbasierten Daten./Pearson für lineare, Spearman für monotone Zusammenhänge.
Wann deutet ein kleiner Winkel zwischen Profilen auf Co-Expression hin?
- Wenn θ ≈ 0° → Gene reagieren synchron über alle Proben.
Wann sind negativ korrelierte Gene biologisch interessant?
- Gegensätzliche Regulation (eins hoch, eins runter)./Hinweis auf inhibierende oder komplementäre Funktionen.
Wann nutzt man hierarchisches Clustering?
- Wenn man Gruppenstruktur ohne vorgegebene Clusterzahl erkunden will./Zeigt Beziehungen in Dendrogrammform.
Wann ist WPGMA sinnvoll?
- Wenn Cluster unterschiedliche Größen haben und gewichtete Distanzen berücksichtigt werden sollen.
Wann ist UPGMA sinnvoller?
- Wenn alle Cluster gleich behandelt werden sollen (ungewichtetes Mittel).
Wann ist Ward-Clustering geeigneter?
- Wenn kompakte, varianzbasierte Cluster bevorzugt werden./Minimiert Varianz innerhalb der Cluster.
Wann verwendet man Heatmaps?
- Zur visuellen Darstellung von Genexpression über viele Proben./Farbverlauf → Ausmaß der Expression.
Wann interpretiert man Zeilen- und Spaltencluster getrennt?
- Zeilen = Gene mit ähnlichem Muster,/Spalten = Proben mit ähnlichen Expressionsprofilen.
Wann erkennt man potenzielle Biomarker in einer Heatmap?
- Gene, die stark differentiell zwischen Gruppen exprimiert sind und klar getrennte Cluster bilden.
Wann ist eine PCA hilfreich?
- Wenn man Hauptunterschiede der Daten visuell darstellen und Clustereffekte prüfen will./Trennung von Gruppen → biologisch relevant.
Wann wählt man Distanzbasiertes statt Korrelations-Clustering?
- Wenn absolute Expressionsniveaus biologisch bedeutsam sind (z. B. Überexpression bestimmter Gene).
Wann prüft man Daten vor Clustering auf Normalisierung?
- Immer → unnormierte Werte können Distanzen verzerren und Cluster verfälschen.
Wann ist eine z-Transformation sinnvoll?
- Wenn Gene unterschiedlich stark exprimiert sind → Standardisierung macht sie vergleichbar.
Wann sollte man Gene mit geringer Varianz ausschließen?
- Wenn sie in allen Proben konstant bleiben → tragen nichts zur Gruppierung bei.
Wann ist ein Dendrogramm „stabil“?
- Wenn Cluster über verschiedene Distanzmetriken und Methoden konsistent auftreten.
Wann ist ein hoher Korrelationswert biologisch relevant?
- r > 0.8 → Gene wahrscheinlich ko-reguliert oder an gleichem Pfad beteiligt.
Wann ist ein Cluster biologisch interpretierbar?
- Wenn enthaltene Gene gemeinsame Funktionen, Pfade oder Gewebe-Spezifität zeigen.
Wann kann Clustering irreführen?
- Bei zu wenigen Proben, starkem Rauschen oder fehlender Normalisierung → zufällige Muster.
Wann sollte man Proben-Clustering verwenden?
- Wenn man Krankheits- oder Zustandsgruppen (z. B. Tumor vs. normal) identifizieren will.
Wann ist Gen-Clustering sinnvoller?
- Wenn funktional verwandte Gene oder Signalpfade gesucht werden.
Wann ist eine Kombination aus beiden sinnvoll?
- Für ganzheitliche Analyse: Gene × Proben-Beziehungen sichtbar (Heatmap-Clustering).
Wann deutet eine scharfe Trennung der Cluster in Heatmap auf gute Daten hin?
- Wenn Unterschiede reproduzierbar und technisch nicht erklärbar sind → echte biologische Signale.
Wann sind Batch-Effekte problematisch für Clustering?
- Wenn Proben nach Sequenzierlauf statt Biologie gruppieren./Korrektur nötig (ComBat, DESeq2 Normfaktoren).
Wann ist eine starke euklidische Distanz aussagekräftig?
- Wenn Unterschiede in absolutem Expressionsniveau groß und biologisch bedeutsam sind (z. B. Gen-Überexpression).
Wann ist Co-Expression biologisch relevant?
- Wenn Gene im gleichen biologischen Prozess aktiv oder durch denselben Transkriptionsfaktor reguliert werden.
Wann sind „Basal-like“, „Luminal“, „HER2“ Cluster wichtig?
- Sie definieren Brustkrebs-Subtypen mit unterschiedlichen Therapieresponsen und Prognosen.
Wann spricht man von einer „Gen-Signatur“?
- Wenn eine Gruppe von Genen gemeinsam auftritt und ein klinisches oder biologisches Merkmal beschreibt.
Wann kann Clustering zur Diagnose beitragen?
- Wenn Expressionsmuster klar zwischen Krankheitsgruppen trennen (z. B. Tumor- vs. Normalgewebe).
Wann deutet eine breite Verzweigung im Dendrogramm auf unsichere Clusterung hin?
- Wenn Distanzen zwischen Gruppen gering → unscharfe Trennung, evtl. mehr Proben nötig.
Wann kann man Clustering quantitativ validieren?
- Mit Silhouettenwerten, Cophenetic Correlation Coefficient oder Bootstrapping.
Wann ist hierarchisches Clustering ungeeignet?
- Bei sehr großen Datensätzen oder nicht-hierarchischer Struktur → besser k-Means oder graphbasierte Methoden.
Wann ist Kombination aus PCA + Clustering nützlich?
- PCA visualisiert Struktur, Clustering formalisiert Gruppenzuordnung → bestätigt visuelle Trennung.
Last changed2 months ago