Histogramm
Sinnvoll für kontinuierliche Daten für einen Messwert
Balken gleicher Breite
Balken ohne Platz dazwischen
Klassenbreite: Messwertintervall (Bin)
Dichteplot
Kontinuierliche Variante des Histogramms
(Graph)
Scatterplot
Punktdiagramme (sehr verstreut)
Zur Darstellung bivariater Daten
—>Wie hängen 2 Sachen miteinander zsm?
Pearson-Korrelation
Korrelationskoeffizient r:
+1 steigende Gerade, starke Korrelation
0 wolkenförmige Verteilung der Punkte im Scatterplot keine Korrelation
-1 fallende Gerade, negative Korrelation
nur für lineare Zusammenhänge aussagekräftig!
Keine robuste Bewertung!
Spearman-Korrelation
Für monotone Zusammenhänge aussagekräftig
tatsächliche Werte irrelevant da Korrelation nicht zwischen den Datenpunkten sondern zwischen den Rängen der Datenpunkte berechnet wird
Ausreißer machen keinen großen Unterschied
—> robuste Bewertung
Einfach nur Reihenfolge (Ränge) vergleichen
Arithmetisches Mittel
Summe der Werte : Anzahl der Werte
—>Mittelwert
Formel für den z-score
Formel für Varianz
((x1-Arithmetisches Mittel)^2 + (x2-Arithmetisches Mittel)^2 + … ):n
Spezifität
Wahrscheinlichkeit, dass Gesunder als gesund erkannt wird (Spezi = gesund)
—>Keine falsch positiven Resultate
Sensitivität
Wahrscheinlichkeit, dass kranke Person als krank erkannt wird (krank = sensibel)
—>keine falsch negativen Resultate
Thermodynamisches Gleichgewicht—> totes biologisches System
Formel für Berechnung arithmetischen Mittels
Was ist der C-Wert?
Anzahl der Basenpaare eines haploiden Genoms
Formel zur Berechnung der Standard Abweichung (sigma)
Wurzel (varianz)
Formel zur Berechnung der Stichprobenvarianz
So wie man normale Varianz berechnet, nur statt n als Nenner benutzt man n-1
Formel zur Berechnung der Stichprobenkovarianz
Für bivariate Daten (Vergleich zweier Gruppen)
Pearson Koeffizient r berechnen
Korrelation ungleich Kausalität
Kausalität bedeutet, dass ein Ereignis durch ein anderes Ereignis verursacht wurde. Korrelation (oder Assoziation) bedeutet, dass zwei Dinge miteinander verbunden sind, aber sie impliziert keine Kausalität
Lagemaße
Modus —> häufigster Wert (nicht eindeutig, kann mehrere gleich häufige Werte geben)
Mittelwert —> alle Werte sind inkluiert, ändert sich ständig (müssen numerische Werte sein)
Median —> Mittlerer Wert, Daten werden nach Größe sortiert, bei gerader Anzahl von Werten ist der Median der Mittelwert der beiden mittleren Zahlen (auch wenn’s gleiche Zahlen sind: (3+3):2)
(müssen Ordinale Werte sein)
Formel für Stichprobenstandardabweichung
Wurzel aus Stichprobenvarianz
Streumaße
Spannweite —> größter minus niedrigster Wert —>Sp(x)=max(x)-min(x) (unrobust)
Varianz —> mittlerer, quadratischer Abstand der Daten um den Mittelwert (unrobust)
Standardabweichung —> Streuuung, gleiche Einheit wie ursprüngliche Messung (unrobust)
IQR (Interquartile Range) —> 3. Quartil - 1. Quartil (robust)
MAD (Mean Absolute Deviation) —> Median der Abweichung aller Datenpunkte vom Median (xi-x), bei 10 werten der Mittelwert des 5. und 6. Wertes (robust)
Quartil —> Einteilung des Datensatzes in 4 gleich große Teile
Quantil —> Einteilung in x gleich große Teile
Fehler 1. Art (alpha)
Nullhypothese wird abgelehnt obwohl wahr
—>schlimmer
—>falsch positiv
—>Gegestück zur Spezifität
Fehler 2. Art (beta)
Nullhypothese angenommen obwohl falsch
—> falsch negativ
—>Gegenstück zur Sensibilität
Was ist der p-Wert?
die Wahrscheinlichkeit, dass H0 richtig oder noch extremer ist
—>er gibt an wie wahrscheinlich es ist, das Stichprobenergebnis zu erhalten, wenn die Nullhypothese wahr ist (also rein zufällig)
—>H0 wird abgelehnt wenn der p-Wert kleiner oder gleich dem Signifikanzniveau a ist
—>je kleiner der p-Wert, desto mehr spricht das Ergebnis gegen die Nullhypothese
what’s special about a histogram?
it allows graphical representation of the data distribution
It divides the ordered measured values into classes
It is, in this way, the bar chart of the measured values und the k classes
Was ist der MAD?
Median der Abweichung vom Median
Wie viele Basenpaare gibt es im menschlichen Erbgut?
3,2 Mrd
Wie viele Chromosomen hat der Mensch?
46 (23 Chromosomenpaare)
Was ist der Modus?
Der häufigste Wert
Was ist ein T-Test?
Verwendet man wenn man die Mittelwerte von 2 Gruppen miteinander vergleichen will
—>z.B. sind Männer durchschnittlich größer als Frauen?
Was ist der Median?
Der Wert, der in der Mitte steht bzw. das Mittel der beiden mittleren Werte
Oder der um 50% getrimmte Mittelwert
Robuste Maße
IQR
Median
Getrimmtes Mittel
MAD
Unrobuste Maße
Varianz
Standardabweichung
Spannweite
Modus
Mittelwert (Arithmetisches Mittel)
Wie viele Proteingene hat das menschliche Erbgut?
22.000
Wann wurde das menschliche Genom vollständig sequenziert?
2001
Was ist das C-Wert Paradoxon?
Fehlende Korrelation zwischen C-Wert und genetischer/morphologischer Komplexität
Warum ist trotz des C-Wert Paradoxons der Mensch komplexer als die Nematode?
Der Mensch hat mehr Exons und mehr unterschiedliche Spleißvariationen
Formel für p-Wert
Was sagt der T-Wert über die Signifikanz aus?
Je kleiner der T-Wert, desto weniger signifikant
Formel für Binomialverteilung
Formel für Normalverteilung
Welcher Zusammengang besteht zwischen Streuuung und dem z-Wert?
Je mehr Streuung, desto geringer der Betrag von z
Formel für die Poisson-Verteilung
Was ist Clustering?
Unterteilung der Daten in Gruppen (Cluster)
Welches Fusionierungsverfahren wird bei minimalem Abstand zwischen Cluster verwendet?
Single Linkage
—>kleinste Einzeldistanz
Welches Fusionierungsverfahren wird bei maximalem Abstand zwischen Cluster angewendet?
Complete linkage
—>größte Einzeldistanz
Welches Fusionierungsverfahren wird bei mittlerem Abstand zwischen Cluster verwendet
Average linkage
—>Mittelwert aller paarweisen Abstände
Welches Fusionierungsverfahren bei Abstand zwischen Clusterschwerpunkten?
Zentroid
Was ist der Unterschied zwischen supervised und unsupervised Clustering?
Supervised: es wird bereits ein klassifizierter Datensatz benötigt
—>man will neue Daten in bereits bestehende Gruppen einordnen
Unsupervised: man hat noch keine klassifizierten Daten und möchte einzelne Gruppen finden
Ist der Pearsons oder der Spearman Korrelationskoeffizient robuster?
Der Soearman-Korrelationskoeffizient ist robuster als der Pearson
Deutet eine hohe Spearman Korrelation auf einen kausalen Zusammenhang hin?
Nein
Deutet eine hohe Pearson Korrelation auf einen kausalen Zusammenhang hin?
Deutet eine hohe Pearson Korrelation auf eine hohe lineare Assoziation hin?
Ja
Können nicht lineare Zusammenhänge vom Pearson Koerelationskoeffizienten modelliert werden?
Sollten kausal zusammenhängende Größen einen hohen Pearsons-Korrelationskoeffizient aufweisen?
Es gibt in der DNA:
Bedeutung
Struktur
Grammatik
Interpunktion
auch unleserliche Bereiche
Was ist richtig?
Alles (1-5)
Ist es richtig, dass ein Histogramm auf die Datenverteilung fokussiert, wogegen ein Balkendiagramm allgemein mit Balken arbeitet?
richtig
Was ist die Spannweite?
Differenz vom niedrigsten bis zum höchsten Wert
Wie berechnet man den MAD?
Berechne das arithmetische Mittel
Berechne, wie weit jeder der Datenpunkte vom arithmetischen Mittel entfernt ist, indem du positive Distanzen angibst. Diese nennt man absolute Abweichungen
Summiere diese Abweichungen auf
Teile die Summe durch die Anzahl an Datenpunkten
Sie haben bei einer Analyse von normalverteilten Daten für einen Messwert einen Z-score von +2 erhalten.
Was heißt das?
Weniger als 2,3% der Werte sind größer als diese Messung
Was bedeutet ein hoher T-Wert?
Umso größer der Wert für T ist, desto stärker spricht dies gegen die Nullhypothese
Ist ein p-Wert unter 0,05 immer signifikant?
Kann die Nullhypothese verworfen werden wenn der p-Wert über dem abgegebenen Signifikanzniveau ist?
Trifft die Nullhypothese zu wenn der p-Wert über dem angegebenen Signifikanzniveau ist?
Wann ist eine p-Wert Korrektur notwendig?
Wenn dieselben Daten in mehreren Vergleichen verwendet werden
Wenn ein p-Wert eines t-Tests kleiner als 0,05 ausfällt, sagt dies zwangsläufig aus, dass
das zufällige Eintreten unserer getesteten Beobachtung sehr unwahrscheinlich ist
Nenne Cluster-Methoden
Single-Linkage
Average-Linkage
Complete-Linkage
K-means
Fallen bei der Manhattan oder bei der Euklidischen Distanz Ausreißer mehr ins Gewicht?
Bei der Euklidischen Distanz
Ist die Ausgleichsgerade robust gegen Ausreißer?
Was minimiert die Ausgleichsgerade?
Sie minimiert die mittleren quadratischen Residuen
Was ist der QQ Plot und wofür braucht man ihn?
Der Quantil-Quantil Plot wird verwendet wenn man wissen will, ob die Daten normal verteilt sein
Wie verändert sich der Fehler (Residuen) zu den möglichen Ausgleichsgeraden durch eine Punktwolke bei veränderter Steigung?
Er verändert sich quadratisch
Was sagt ein R-squared Wert nahe 1 aus?
Dass die Ausgleichsgerade korrekt ist
Wie wird die Sauerstoffaustauschfläche im menschlichen Blut erhöht?
Durch eine hohe Anzahl an Hämoglobinmolekülen in den Erythrozyten
Ist die Energie von kovalenten oder die Energie von nicht kovalenten Bindungen höher?
Die kovalenten Bindungsenergie ist typischerweise höher
Was ist die Anzahl der Erythrozyten im Blut?
25 Billionen
Was ist das TIM Barrel?
häufigste Proteinfaltungsstruktur
Was ist die SH2 Domäne (Src homology 2 Domäne) und was macht sie?
Die SH2 Domäne ist eine selbstständige Faltungseinheit
Sie erkennt phosphorylierte Aminosäuren in anderen Proteinen (Phospho-Tyrosine)
Wie viele Hämoglobinmoleküle hat ein menschlicher Erythrozyt?
etwa 280 Millionen
—>für Optimalen Sauerstoffaustausch
Aus was ist das TIM Barrel zusammengesetzt?
aus 8 beta-strands und 8 Helices
Wo kommt die SH2 Domäne vor und woraus ist sie aufgebaut?
IN Proteinen, kann also mehrfach dort vorkommen oder komplett fehlen
100 aa lang
Aufgebaut aus alpha & beta, Halbkugel, antiparalleles beta-sheet
Wie sieht exponentielles Bakterienwachstum in doppelt logarithmischer Darstellung (Anzahl gegen Zeit) aus?
Linear
Was ist der Lineweaver-Burk Plot?
Das Lineweaver-Burk-Diagramm ist eine grafische Darstellung der Enzymkinetik. Es entspricht der doppelt-reziprokenAuftragung der Michaelis-Menten-Gleichung
—>Einfache Möglichkeit vmax und Km zu bestimmen
—>Verschiedene Arten der Inhibitoren erkennbar
Was stellt die Michaelis-Menten Konstante beim Lineweaver-Burk Plot dar?
Die Substratkonzentration mit der halbmaximalen Geschwindigkeit
Wie kann man Differentialgleichungen im Computer lösen?
Näherungsweise durch Differenzengleichungen
Typische large-scale Techniken in der Systembiologie
Ultrafast Sequencing
(Metabolite Profiling)—>wenig Verwendung
Massenspektroskopie (für Proteine)
Genome Array Analysen
Kann man Leben als System fernab vom thermodynamische Gleichgewicht bezeichnen?
Ja, da im thermodynamischen Gleichgewicht Hin- und Rückreaktion gleich schnell verlaufen und damit alle thermodynamischen Gradienten zusammenbrechen (=toter Zustand)
Wie bezeichnet man stabile Systemzustände?
Als Attraktoren
Was hilft einem biologischen Sytem stabiler zu werden?
Eine geringe Anregung über dem energieärmsten Zustand
Was bestimmt die Höhe der Signalamplitude bei einer Kinasenkaskade?
Phosphatasen
Woraus können biologische Signalkaskaden bestehen?
Aus verschiedenen signalverstärkenden Proteinen hintereinander
Wenn 5 Proteine miteinander reagieren können was ist dann die Anzahl der möglichen paarweisen Interaktionen?
10
—>generell für n Proteine: (n^2-n):2
Kann eine Phosporylierung systembiologisch betrachtet inhibierend oder aktivierend wirken?
Beides
Was ist eine Phosporylierungskaskade?
Eine Reihe von Kinasen, die sich nacheinander phosporylieren und die Aktivierung damit immer weiter verstärken
—>positives Feedback Loop (positive Rückkopplungsschleife)
Wer wurde für seine Katastrophentheorie bekannt?
Herr Thom
—>bezogen auf mögliche “katastrophale” Systemänderungen
Was ist eine “broken Stick” Verteilung?
Eine Rang- Abundanzkurve
Welche beiden Verfahren sind in einem ökologischen Experiment unumgänglich, wenn die Daten statistisch ausgewertet werden sollen?
Randomisieren und Replizieren
Was ist eine ANCOVA?
Eine ANCOVA entspricht statistisch einem General Linear Model
Was ist eine ANOVA?
Eine ANOVA ist ein Spezialfall eines General Linear Models
Ist eine multiple Regression ein Spezialfall eines General Linear Models?
Wie lautet die fundamentale Gleichung für die Populationsgröße?
N(t+1) = N(t) + Geburten - Sterbefälle + Immigration - Emmigration
Was bedeutet eine Evenness von 1?
es bedeutet, dass alle Arten eines Patches die gleiche Individuenzahl haben
Wozu dient eine Artenakkumulationskurve?
Zum Erkennen ob ein Gebiet repräsentativ beprobt wurde
Man sucht neue Arten aus den gesammelten Datensätzen und berechnet daraus die Steigung der Kurve
Deskriptive Statistik
Methoden um Daten zusammenzufassen mit möglichst wenig Informationsverlust
Balkendiagramm
Sinnvoll für diskrete Daten für wenige Kategorien
Ein Balken pro Kategorie
Balkenbreite nur kosmetisch
Formel für Pearson-Korrelationskoeffizient
Berechnung des Spearman-Korrelationskoeffizient
Durch den Pearson-Korrekationskoeffizienten auf den Rängen der Daten berechnet: r(Rang(y1), Rang(y2))
Berechnung des MAD
Was ist ein guter p-Wert und eine gute Effektstärke für eine Studie?
niedriger p-Wert: <0,05, besser <0,01
große Effektstärke: 10% oder mehr
Bakterielles Wachstum vs. Wachstum durch Agglomeration (Proteinfamilien) graphisch vergleichen
Bakterielles Wachstum: Log-Linear Plot (Exponentialfunktion wird Gerade)
Wachstum durch Agglomeration: Log-Log Plot (doppelter logarithmischer Plot, Potenzfunktion wird Gerade)
Wie ist das Hämoglobin Molekül aufgeteilt?
Tetramer mit 2 alpha und 2 beta Strukturen
—>17000 g/Mol pro Kette—> 68000g/Mol insgesamt
Was ist die durchschnittliche Länge für Proteindomänen?
100-150 aa
Was ist das Power Law
Verteilung nach Potenzgesetz
Wachsen durch Agglomeration (z.B. Freunde von Freunden)—> Anlegen an etwas Vorhandenes
Wichtige Zeitverhältnisse
Wichtige Energieverhältnisse
Wichtige Längen- bzw. Größenverhältnisse
Wie viel größer ist das Genom von höheren Zellen (Eukaryoten) im Vergleich zu dem Genom von Bakterien?
etwa 1000 mal größer
Wie groß ist eine Lipid-Doppelmembran ca?
10 nm
Spielen die Gesetze der Kernphysik eine Rolle für die Berechnung biologischer Vorgänge?
Nein, da der Atomkern etwa 10 000 mal kleiner ist als das Atom
Verhulst Gleichung
Was sind die 4 Phasen des Bakterienwachstums?
Anlaufphase
Exponentielle Phase
Stationäre Phase
Abbauphase
—>1. bis 3. lässt sich durch Verhulst-Gleichung beschreiben
Enzymkinetik
Beschreibung von enzymkatalysierten chemischen Reaktionen
Reaktionsgeschwindigkeit ist abhängig von Konzentration
Geschwindigkeit der Teilreaktionen durch Differentialgleichung beschrieben
Autokatalyse verläuft exponentiell
Begrenzungen: Substratmenge, Enzymmenge
—>Sättigung
Michaelis-Menten Gleichung
vmax= Maximalgeschwindigkeit, alle Substratbindestellen besetzt
Km= Substratkonzentration bei der vmax/2
Wozu dient das Hill Modell?
Dazu kooperative Proteine mathematisch beschreiben
Biologische Bedeutung: positive Kooperativität: ist Sauerstoff gebunden, wird leicht noch mehr Sauerstoff gebunden
Hill-Koeffizient h
Steilheit der Kurve der Bindung eines Inhibitors bzw. eines Substrates
Kooperativität der der Substratbindung eines Enzyms
Mit dem t-Wert wird die Größe der Differenz relativ zur Streuung in den Stichprobendaten gemessen. Anders ausgedrückt, ist t einfach die berechnete Differenz, dargestellt in Einheiten des Standardfehlers. Je größer der Betrag von t ist, umso stärker spricht dies gegen die Nullhypothese
Erkläre Modell vs Simulation
Modell: -Abbildung um gewisse Eigenschaften eines komplexen Systems zu versnschaulichen
-Vereinfachung
-Zielorientiert (Für Wen? Wann? Wo?)
Simulation: -Durchspielen von Prozessen (falls die Verwendung des realen Systrms zu teuer, zu gefährlich, ethnisch nicht vertretbar, zu komplex oder nicht möglich ist)
Welche 3 Gewebemodelle gibt es in der Systembiologie?
Kontinuierliches Modell
Zentroidmodell
Vertexmodell
Erkläre das Kontinuierliche Modell in der Systembiologie
-Gewebe wird als kontinuierliches Material dargestellt
-Einzelne Zellen sind nicht aufgelöst
—>z.B. Musterbildung, Gewebewachstum/-verformung, Gen-/Proteinexpression im Gewebe
-geringe Rechenzeit
Erkläre das Zentroidmodell
-Zellen werden durch ihren Schwerpunkt beschrieben
-2 Zellen interagieren nur dann, wenn sie nah genug beisammen sind (Interaktionsradius)
-Der Interaktionsgraph kann sehr dynamisch sein und muss dann regelmäßig angepasst werden
—>z.B. Einzelne Zellen, Zelltypen, Gen-/Proteinexpression in der einzelnen Zelle, mechanische/chemische Interaktionen zwischen Zellen, Gewebewachstum/-verformung, Zellteilung, Zellbewegung
-mittlere Rechenzeit
Erkläre das Vertexmodell
-Zellen werden durch Kanten und Knoten beschrieben
-Zellteilung geschieht explizit, indem eine neue Kante hinzugefügt wird
-was kann dargestellt werden:
—>Einzelne Zellen, Zellform, Zelltypen, Gen-/Proteinexpression in Teilen der Zelle, mechanische/chemische Interaktionen zwischen Zellen, Gewebewachstum/-Verformung, Zellteilung, Zellbewegung
-hohe Rechenzeit
Was sind Sphäroide?
3-dimensionale Zellaggregate
Dienen als Modell für avaskuläre Tumore
—>Untersuchung der Zell-Zell-Adhäsion in 3D
Wichtige Parameter für die Sphäroidformierung mit dem Zentroidmodell
Pbinding: Bindewahrscheinlichkeit
Punbinding: Auflösen von Verbindung
—>Zellen sind Kugeln
—>Zell-Zell-Verbindung können entstehen oder aufgelöst werden
Was ist das Ziel vom Fitten eines Modells?
Die Residuen zu minimieren
Was ist ausschlaggebend für die Bindung in einem Sphäroid
Cadherine zum Binden
—>L-Zellen haben keine Cadherine
—>cis und Trans Mutante binden nur aight
Was ist die Bonferroni Schwelle?
Dieser Schwellenwert bestimmt die Menge an Beweisen, die erforderlich sind, um die Nullhypothese abzulehnen . Üblicherweise werden Signifikanzniveaus von 0,05 (5 %) und 0,01 (1 %) verwendet, die die Wahrscheinlichkeit der Beobachtung der Daten angeben, wenn die Nullhypothese wahr wäre.
—>Signifikanzlevel : Antahl der grnomischen Marker
—>für Untersuchung der Korrelation von einer Region im Genom mit dem Phänotyp
Formel für k-mers (Genom Zusammenfügen nach Sequenzierung)
Readlänge - Kmerlänge + 1
Readlänge: sequenzierte Basenabfolge (CTGGTATGAGG…)
K-merlänge: z.B. Zerlegung in 5-merks (CTGGT, ATGAG, G…)
Was sind GWAS?
Genom-weite Assoziations-Kartierung
—>Assoziation von Geno- und Phänotyp
Wie funktioniert GWAS?
DNA Isolierung
Sequenzierung
Korrelation von Genotyp mit Phänotyp suchen
Was ist Occams Rasiermesser?
Bei 2 Modellen, die die Daten gleich gut erklären nimmt man das Einfachere
Welche Anwendungsschritte braucht man für ein systembiologisches Modell?
Modelltests
Bei mehreren “guten” Modellen nimmt man entweder das mit dem kleinsten Fehler oder das simpelste
Nutzen von Informationen aus Datenbanken, Literatur, aber auch Feedback von Experten um ein Netzwerk aufzubauen und realistisch zu gestalten
Alle Komponenten auffinden (zeitaufwendig, langsam, viele Tests)
Mit was für einer Art von Gleichung wird ein Bindungsassay korrekt beschrieben?
Mit einer logistischen
Wofür wird eine Power-Analyse durchgeführt?
Um die für einen signifikanten Effekt notwendige Stichprobengröße zu ermitteln
Was soll mit einem Matching-Verfahren erreicht werden?
dass in allen Stichproben bestimmte Merkmale gleich verteilt sind
Wann spricht man von einem systematischen Fehler?
Der Fehler zeigt immer die gleiche Tendenz und ist nicht normalverteilt
Was ist eine partielle Korrelation?
Eine Korrelation die durch eine zusätzliche Variable beeinflusst oder bedingt wird
Was besagt die Nullhypothese?
Die Nullhypothese sagt aus, dass zwischen zwei geprüften Daten kein Unterschied bzw. kein Zusammenhang besteh
Was ist die Grundgesamtheit?
Die Menge an statistischen Einheiten, über die man Aussagen treffen möchte
Untersucht wird aber nur die Stichprobe n (=Teilmenge der Grundgesamtheit)
Was ist die Irrtumswahrscheinlichkeit?
Die Wahrscheinlichkeit für den Fehler 1. Art
—>Nullhypothese wird abgelehnt, obwohl sie in Wirklichkeit richtig ist
Verschiedene T-Tests
T-Tests um auf Unterschiede zu testen: t-Test, z-Test
T-Tests um auf Zusammenhänge zu testen: Chi-Quadrat-Unabhängigkeits-Test
—>testet Unterschiede zwischen Häufigkeits-Verteilungen
Verschiedene Clustermethoden
Linkage-Methoden
Was wird bei der Regression untersucht?
Die Abhängigkeit einer Variablen von der anderen
Es muss klar sein welche die abhängige und welche die unabhängige ist
Ziel der Regression ist es ein möglichst einfaches Modell der unabhängigen Variablen zu finden, das die abhängige Variable gut beschreibt
Was ist ein Residuum?
Der Fehler bzw. Unterschied zwischen Messpunkten und Regressionskurve
—>Differenz zwischen Messwert und Wert der Kurve
—>Histogramm ist nützlich um zu schauen ob Residuen normalverteilt sind
Wie unterscheidet sich lineare und nichtlineare Regression?
Bei der nichtlinearen Regression kann der Determinationskoeffizient nicht verwendet werden
Der Determinationskoeffizient bestimmt ob die Gerade mit Steigung 0 ein besseres Modell ergibt —> für nichtlineare Abhängigkeiten wird das nie der Fall sein. Er ist also immer sehr hoch und hat daher keine Aussagekraft
Ansonsten ist das Vorgehen bei beiden gleich und damit auch die Ermittlung der Parameterwerte, die Residuenanalyse und die Möglichkeit der Vorhersage
Wie viele Beobachtungen brauche ich, damit ich diese mit einer Normalverteilung beschreiben kann?
Mindestens 20-30
Was wird in der Systembiologie untersucht?
Das Zusammenwirken zellulärer Prozesse auf unterschiedlichen Ebenen
Mithilfe mathematischer Modelle kann das Verhalten eines Systems unter bestimmten Bedingungen vorhergesagt werden
Stabiles Gleichgewicht der Kugel in der Kule
Wer ist der Attraktor?
Die Kule ist der Attraktor
Tipping Point wäre ein Gipfel = labiler Systemzustand das Gleichgewicht ist gegenüber leichten Störungen nicht stabil
Was bedeutet Emergenz?
“Das Ganze ist mehr als die Summe seiner Teile”
Es entstehen neue Eigenschaften eines Systems auf der Grundlage des Zusammenspiels seiner Elemente
Diese emergenten Eigenschaften können nicht aus den einzelnen Eigenschaften der Elemente vorhergesagt werden
—>z.B. Protein besitzt Eigenschaften, die die einzelne Aminosäure nicht besitzen
Was sind Thrombozyten?
Die kleinsten und kernlosen Bestandteile des Blutes
Geringe Stoffwechselaktivität
Formel für mögliche Proteininteraktionen unter n Proteinen
(n^2-n)/2
Wie viele Proteinkomplexe sind möglich bei n Proteinen?
2^n
Zuletzt geändertvor 5 Monaten