What are the challenges in RNA sequencing data analysis?
-Choosing an appropiate statistical distribution
-Normalization between samples
-Few samples available make it difficult to estimate parameters
-Many genes and many tests -> high dimensionality
Auswahl einer geeigneten statistischen Verteilung
Normalisierung zwischen den Proben
Wenige verfügbare Proben erschweren die Parameterschätzung
Viele Gene und viele Tests → hohe Dimensionalität
What is fold change?
Reads of a gene in one condition compared to reads of the same gene in another condition
Lesungen (Reads) eines Gens unter einer Bedingung im Vergleich zu den Reads desselben Gens unter einer anderen Bedingung
What tell the FASTQ-files?
Sequence + base quailty
How is the data normalised?
RPKM/FPKM -> Reads or fragments per kilobase of transcript per million reads of library
TPM -> transcripts per million
RPKM/FPKM: Reads bzw. Fragmente pro Kilobase Transkript pro Million Reads der Bibliothek
TPM: Transkripte pro Million
What are the challenges in RNA-seq data analysis?
-Choosing an appropriate statistical distribution
-Few samples available make it difficult to estimate parameters (e.g., variance)
Wenige verfügbare Proben erschweren die Parameterschätzung (z. B. der Varianz)
How can you handle the high dimensionalty?
-FDR -> multiple test correction
-filter out genes that have little chance of showing significance
-independent hypothesis weightening
FDR (False Discovery Rate) → Korrektur für multiple Tests
Filterung von Genen, die nur geringe Wahrscheinlichkeit haben, signifikant zu sein
Unabhängige Gewichtung der Hypothesen (Independent Hypothesis Weighting, IHW)
What is DeSeq2 doing?
-estimation of size factor
-estimation of the dispersion value for each gene
-fitting of the generalized linear model and performing statistical testing
-> which genes are expressed differently in different conditions
Schätzung des Size-Faktors
Schätzung des Dispersionswertes für jedes Gen
Anpassung des generalisierten linearen Modells und Durchführung statistischer Tests
→ Bestimmung, welche Gene unter verschiedenen Bedingungen unterschiedlich exprimiert werden
What shows the log2FoldChange?
How much gene expression changes in different conditions
Wie stark sich die Genexpression unter verschiedenen Bedingungen verändert
Last changed8 days ago