4. Evaluation von Veränderung

Forschungsmethoden und Evaluation Master

von Nipu D.

Was ist “Echte Veränderung”

-Schwierigkeiten die sich in dem Zusammenhang ergeben können

 Ist es eine Situative Fluktuation oder eine „echte“ Veränderung die wir hier beobachten?

bsp. wenn wir mehrere Messzeitpunkte innerhalb einer Therapie haben und wir stellen fest, dass der Patient mittlerweile weniger depressiv ist dann stellt sich die Frage ist das eine echte Veränderung oder ist es einfach eine fluktuation(=auf und ab) und beim nächsten Messzeitpunkt könnte es wieder so sein das die Perosn wieder erneut depressiver ist

 Kontinuierliche Veränderung oder diskontinuierliche

Veränderung?

—>Wie verlaufen Veränderungen? sind sie kontinuierlich oder diskontinuerlich? kontinuierlich könnte dann heißen der Patient graduell linear über den Verlauf der Behandlung. Und diskontinuierlich würde eher bedeuten, dass Sprünge sind. Tatsächlich zeigt sich für die Psychotherapie eher diskontinuierliche Veränderungen. Diese werden auch als Sudden gains in der Psychotherapie bezeichnet. Wenn man diese Sudden gains frühzeitig in der Therapie hat, ist die wahrscheinlichkeit hoch später auch eine erfolgreiche Therapie zu haben. Es sind eher nicht lineare verläufe in der Psychotherapie sondern sprunghafte.

 Quantitative Veränderungsaussagen

—>Veränderungen kann man Quantitativ erfassen dh mithilfe von Zahlen, von durchschnittswerten die sich verändern

 Qualitative Veränderungsaussagen

—>oder man erfasst Veränderungen qualitativ mit qualitativen aussagen die nicht die größe sondern die art der Veränderungen ausmachen

Welcher Bias kann in der Messung von Veränderung auftreten?

Auf das folgende beispiel bezogen merke aber die Punkte kannst du ja auf andere Beispiele auch anwenden zb mangelnde objektvität etc.

Was ist die Take home message?

Mangelnde Objektivität weil die Klassenlehrer Teil der Studie sind und weil die Beziehung zu den Schülern durch ihre vorangegangenen erfahrungen zu sehr geprägt sind die sie mit den jeweiligen schülern haben.
Drop - Out Problem = Kinder oder Lehrer können möglicherweise aufgrund von Krankheiten oder anderen gesundheitlichen oder privaten Sachen nicht immer anwesend sein. Dann fehlt zb eine ganze woche des Trainings.
Bewertung der aggression findet nur anhand des Verhaltens statt , Umweltfaktoren/-einflüsse spielen eine rolle zb Tagesform, Situationen wie schlechte Noten, Streit etc beeinflussen das verhalten der schüler.
Lehrer können nur das bewerten was sie mitbekommen also nur die Zeiträume in denen sie anwensend sind zb in der Klasse aber was außerhalb passiert wird nicht miteinbezogen zb in Pausendynamiken
—>Also die Informationsquelle ist dann doch zu limitiert wenn man es nur von den lehrer/-innen evaluieren lässt die eben teil der studie sind was problematisch ist und die eigentlich nur einen kleinen ausschnitt der schüler/-innen mitbekommen , nämlich was in der klasse passiert. Wir bräuchten also hier eine multimethodale erfassung dieses konstruktes.
Confirmation Bias: Man hat ja eine gewisse erwartung an gewisse dinge / Menschen —> War ja klar das sich person x so und so verhält. oder die lehrer finden das training ganz gut und die glauben dann direkt an das training und sieht dann eher veränderungen bzw bewertet dies dann eher als veränderung
Soziale erwünschtheit: das die lehrer den anspruch haben vor allem weil sie mehrere wochen teil dieser studien haben möchten dass diese studie etwas gebracht hat. Deren Objektivität ist nicht unbedingt gegeben.
Das ist so problemtisch weil die Lehrer Teil der Studie sind, Externe würden vlt weniger unter diesen BIAS fallen.
Langer Zeitraum und wir haben NUR 2 Messzeitpunkte: problematisch weil man die entwicklung nicht anhand 2 messzeitpüuinkte darstellen kann , es würden mehrer Zeitpunkte fehlen, Umwelteinflüssen können die messung beeinflussen zb man hat an einem messzeitpunkt einfach einen streit gehabt davor
—>Take Home Message: Messung von Veränderung ist schwierig , ist häufig mit Bias assoziert.

unabhängige vs abhängige Variable

abhängige ist immer dss was gemesen wird

Sind diese Fragen geeignet, um die Aggressivität zu erfassen? Erklären sie bitte den Unterschied zwischen sensitivität und spezifisch

 „Hat der/die Schüler*in in der vergangenen Woche einmal

etwas Böses oder Freches zu einem seiner/ihrer

Mitschüler*in gesagt?“

 „Hat der/die Schüler*in in der vergangenen Woche einen

seiner/ihrer Klassenkamerad*innen krankenhausreif

geschlagen?“

 „Ist der/die Schüler*in ein aggressiver Mensch?“

1. Ungeeignet —>denn Was bedeutet Böse genau? Und die lehrperson kann nicht genau sagen ob der schüler das zu einem gesagt hat., weil er ja nur einen kleinen ausshcnitt mitbekommt des schülerverhaltens.
2. ungeeignet —> sensitivität vs spezifität = die begriff ekommen aus der epidemiologischen forschung, wärend deer corona zeit war das zb sehr relevant wenn wir jetzt einen corona schnelltest haben , sensitivität würde bedeuteten das dieser test in der lage ist jemanden der corona hat auch korrekt zu identifizieren , spezifität würde bedeuteten das jemand der kein corona hat das dieser auch korrekt ausgegeben wird als gesund. Also sensitivität korrekt als krank, spezifität korrekt als gesund. Und in diesem fall hier wäre die frage ungeeignet , denn da wäre zu wenig Variation in den Daten, denn das dieses Ereignis passiert ist relativ unwahrscheinlich. dh hier wäre die spezifität eigentlich zu groß von dieser Frage. es ist sehr wahrscheinlich, dass diese frage mit nein beantwortet wird und am ende haben wir wenig variation.
3. auch hier ungeeignet= weil es wird hier ein Trait erfasst. ist jemand ein aggressiver mensch ist nicht das worum es geht sondern ob sich die person aggressiv verhält. also das heißt wir wollen nach staits fragen und nicht nach traits. (Traits sind Persönlichkeitseigenschaften die über die zeit und über situationen bedauern, staits hingegen sind momentane eigenschaften, verhaltenszüge die zu beobachten sind.
—>dh alle drei fragen sind ungeeignet um veränderungen zu erfassen.die fragen müssen nämlich so gestellt sein, dass die person die sie evaluiert auch tatsächlich beantworten kann weil sie im bereich des beobachtbaren verhaltens liegt also auch der ausschnitt der beobachtet werden kann das trifft eben auf die erste frage nicht zu , die fragen müssen so gestellt sein das sie die richtige , wenn wir sensitivität und spezifität nochmal heranziehen das sie in dem fall spezifität hat dh das sie variationen zu lässt und die fragen müssen so gestellt werden das sie sich auf staits und nicht auf traits beziehen, dh ob jemand ein aggressiver mensch ist oder nicht ist kein bestandteil der untersuchung sondern ob sich jemand aggressiv verhält.

Was ist “Echte Veränderung”? Direkte / indirekte Veränderungsmessung

Wir können veränderungen entweder durch direkte veränderungsmessung erfassen oder durch indirekte veränderungsmessung erfassen. UNBEDINGT MERKEN UNTERSCHIED
Direkte Veränderungsmessung: Art und Ausmaß der Veränderung wird direkt erhoben zum Zeitpunkt t1 zb durch retrospektive Daten: ökonomisch, indikator für die subjektive erlebte veränderung ABER: Konfirmationseffekt, Soziale Erwünschtheit
—>direkte veränderungsmessung bedeutet also das art und ausmaß der veränderung zu einem zeitpunkt nur erhoben wird zb dann einfach am ende dh am ende des anti agressions trainings wird befragt, hat sich die aggressivität der schüler/-innen durch das training verändert. Bei einer direkten veränderungsmessung könnte man sagen das es ökonomischer ist, weil man eben nur einmal misst aber meistens ist es so das hierbei die nachteile überwiegen da wir das retrospektiv gar nicht mehr richtig beurteilen können ob diese veränderung wirklich stattgefunden hat. und auch hier konfirmationseffekt, soziale erwünschtheit als BIAS. “Naja die werden sich schon in ihrer aggressivität verändert haben”
—>Also direkte veränderungsmessung sollte man in der regel nicht vornehmen um veränderungen zu erfassen sondern die indirekte veränderungsmessung!!!!!
Indirekte Veränderungsmessung: Daten werden zu t1 und t2 gemessen und miteinander verglichen zb durch die Berechnung standardisierter Differenzwerte: Weniger anfällig für Erinnerungseffekte und absichtliche Verzerrungen, objektivierbar ABER BIAS: Response Shift und Testübungseffekte

BIAS in der Messung von Veränderungen IMMER BEISPIELE MIT LERNEN

 Konfirmationseffekt: Man beantwortet die Frage nach der

Veränderung so, wie man es von vornherein erwartet hat, das

Antwortverhalten bestätigt also lediglich bereits vorgefasste

Meinungen und Erwartungen.

 Soziale Erwünschtheit: Die Fragen werden von der Person

dahingehend beantwortet, wie sie glaubt, dass es der

Testleiter oder die Gesellschaft von ihr erwartet.

—>bei der sozialen erwünschtheit geht es eher um das was von mir erwartet wird und so beantworte ich die frage, bei dem konfirmationseffekt geht es eher darum um das was ich glaube, also die meinung und den glauben den ich mit mir herumtrage bezogen auf das zu untersuchunde konstrukt. Man sucht hier dann eher nach bestätigung des zu erwartenden.

 Erinnerungseffekte/Testübungseffekte : Personen können sich zu
T2 daran erinnern, was sie zu T1 angegeben haben und
orientieren sich daran bzw. können die Fragen besser
beantworten, weil sie die Aufgaben schon kennen.
—>ist grade bei leistungstests wie intelligenztests besonders interessant, personen können sich zb erinnern was sie zu t1 angegeben haben und orientieren sich dann bei t2 danach. beim zweiten mal schneidet die person dann möglicherweise besser ab.

 Response Shift: Zwischen den Messzeitpunkten hat sich
nicht die wahre Ausprägung eines Merkmals möglicherweise garnicht verändert , sondern
vielmehr die subjektive Repräsentation des Merkmals
verändert. So werden Personen z.B. zu T2 sensibler in der
Wahrnehmung des fraglichen Merkmals.
—>dh die person die das evaluiert wird aufgrund des trainings einfach sensibler dafür was alles aggressives verhalten ist : zb lehrerin frau x bewertet zum zeitpunkt t1 das aggressive verhalten der schüler als mittel und zum zeitpunkt t2 nach dem training bewertet sie das verhalten sogar als stark. hier könnte ein response shift stattgefunden haben: ihr war vorher garnicht klar was eigentlich aggressives verhalten alles ist, sie dachte zb immer aggressives verhalten drückt sich nur in prügelein schubsen aus und durch das training weiß sie das es auch genauso durch die sprache ausgedrückt wird. Jetzt sieht sie natürlich viel mehr in dieser Aggressivität als vor dem training. S
=i!!!!!!!!!! Ich bin sensibler / sensitiver für das fragliche konstrukt geworden und bewerte es dadurch anders.
Regression zur Mitte: Im Rahmen einer indirekten
Veränderungsmessung mit Hilfe eines intraindividuellen
Designs kann es sein, dass Werte, die zu T1 weit vom
Mittelwert abweichen, zu T2 weniger weit vom Mittelwert
abweichen (oder vice versa). Die Veränderung geht jedoch
möglicherweise lediglich auf ein mathematisches Artefakt
zurück. Regression zur Mitte unvermeidlich wenn…
1. Autokorrelation 𝑟 12 < 1 und
2. Die beiden Messwertreihen identische Varianzen haben 𝜎 1 hoch 2 = 𝜎 2 hoch 2
—>dh Im rahmen einer indirekten veränderungsmessung soll mithilfe eines intraindividuelles designs ein wert erfasst werden und zu t1 also zu beginn der intervention weicht der wert deutlich vom mittelwert ab , zu t2 wird er möglicherweise weniger stark von diesem mittelwert abweichen oder anders herum. Tatsächlich ist es ein artefakt nämlich ein mathematischer artefakt den wir regression zur mitte nennen. Wenn die autokorrelation von t1 und t2 kleiner als ist und die beiden messwerte rein identische verianzen haben, haben wir notwendigerweise die reggression zur mitte. Autokorrelation heißt: t1 und t2 korreliert miteinander, das die nicht perfekt miteinander korrelieren ist ziemlich wahrscheinlich, das die beiden messzeitpunkte identische varianzen haben ist. eher unwahrscheinlich. heißt aber einfach nur wenn eins und zwei vorliegt dann liegt auf jeden fall eine reggression zur mitte vor. auch wenn 1 und 2 nicht erfüllt sind kann trotzdem eine regression zur mitte vorhanden sein.
- geht auf francis galton ( 1822-1911) zurück.
BSP FÜR REGGRESSION ZUR MITTE UNBEDINGT DAS BEISPIEL LERNEN SO IST ER NÄMLICH AUF DIE REGGRESSION ZUR MITTE GEKOMMEN : ist ziemlich bedeutsam für die statistik, er hat einige dinge entwickelt die wir heute noch benutzen. war zum beispiel einer der ersten die reggressionsverfahren verwendet hat in den naturwissenschafen. Er hat zb erbsen untersucht also erbseneltern und deren durchmesser und in eine rangreihe gebracht erfasst (war botaniker) und hat festgestellt interessanterweise das die erbsenkinder etwas kleiner sind als die überdurchschnittlichen Eltern anders herum hat er erbseneltern genommen die besonders klein sind und hat dann festgestellt die nachkommen sind etwas größer als die besonders kleinen erbsen. Was hat also festgestellt..> er hat festgestellt, dass diese erbsen einer normalverteilung folgen, regression zur mitte heißt also einafch wenn wir eine normalverteilung haben dann liegt der größte teil der verteilung um den mittelwert. je weiter ich mich vom mittelwert entferne desto unwahrscheinlicher ist es das dieses ereignis auftritt. wenn er jetzt also erbsen aus diesem bereich nimmt, zb muttererbse ist sehr groß dann ist tochter erbse ein bisschen kleiner, wird also eher in richtung mitte der verteilung gehen. so ist er auf die reggression zur mitte gekommen.
-Bsp für die regression zur mitte: in der klassischen testtheorie gehen wir ja davon aus, dass es einen wahren wert gibt so das es vlt auch für die klasse einen wahren wert ihrer aggression gibt nun könnte es so sein zu t1 das die klasse besonders aggressiv war , aggressiver als sie eiegntlich ist (zb gabs streit davor) , wenn wir jetzt garkein training machen würden und zu einem späteren zeitpunkt nochmal die aggressivität mit der klasse messen würden wäre es wahrscheinlicher das sie weniger aggressiv sind und das wir eher den wahren wert ihrer aggressivität erfassen.
Weiteres beispiel für die reggression der mitte: in den USA gibt es diesen sport ilustrated fluch, oder maden fluch , das ist eine sportzeitschrift, das bedeutet das sportler die besonders herausragende leistungen in diesem jahr gezeigt haben kommen dann auf das cover jetzt ist der sportler aber verflucht, weil es sich zeigt das sportler die auf dem cover dieser zeitschrift sind im folge jahr weniger erfolgreich sind. = Warum ist das jetzt ein beispiel für die reggression zur mitte ?
—> sie kommen nur auf das cover weil sie eine HERAUSragende leistung erbracht haben in der vergangenheit die nicht dem enstpricht was sie auch in den jahren davor geleistet hat sondern das es so bisschen glück, besonders gut trainiert, war das sie in diesem jahr herausragende leistung erbracht haben und dann im folgejahr gleicht sich die leistung wieder an die durchschnittliche leistung an der person. also sie haben überperformend, sie lagen in ihrer performance über ihrem wahren wert. Der sporler hat bewegt sich halt normalerweise in einer bestimmten rage seines wahren werts. und auch das kann man sich wie eine normalverteilung vorstellen.

Differenzmaß auf einzelfallebene

Standardisierte Differenz

Wenn wir jetzt veränderungen erfassen wollen dann haben wir dazu unterschiedliche Möglichkeiten. wir können auf Populationsebene veränderungen erfassen von t1 zu t2 könnte ich zb einen t-wert berechnen, dieser t-wert würde dann die beiden mittelwerte von t1 und t2 miteinander vergleichen und gucken ob die sich signifikant unterscheiden. Das wäre eben eine Veränderung auf Populationsebene oder auf gruppenebene.
Ich kann aber auch Veränderung auf einzelfallebene untersuchen zb möchte ich schauen welche schüler haben sich wie stark verändert das kann ich mithilfe der standardisierten differenz. also ich habe ein maß für die Aggresssivität zu x1 und ein maß für die aggressivität zu x2 nun standardisiere ich das ganze anhand der standardabweichung aller schüler der aggressivität zu t1. warum wird das gemacht? wenn ich die schüler innerhalb der kohorte vergelcihen möchte dann bräuchte ich diese standardisierung nicht möchte ich die schüler unterschiedlicher kohorten, unterschiedlicher schulen miteinander vergleichen, brauche ich die standardisierung dann wäre es wichtig. Diese veränderung kann ja nicht absolut betrachtet werden sondern immer in relation zur gruppe und in relation zur eingesetzten messinstrument dh wenn ich vt sogar für dieses maß derr aggressivität unterschiedliche messinstrumente haben dann macht das schon einen unterschied ob dieses messinstrument von 1 -10 reicht oder von 1-100 reicht. dann wäre die differenz ja sehr unterschiedlich, durch diese standardisierung anhand der standardabweichung kann ich über verschiedene kohorten hinweg und sogar verschiedene Messinstrumente hinweg individuelle Veränderungen erfassen!!!!!!!!!!
Unterschiede relativ zur gruppe und relativ zum eingesetzten Messinstrument zu interpretierten sind. STandardisierte differenz ist also etwas was genutzt wird wenn wir auf einzelfallebene gucken wollen wie stark hat sich denn jetzt eine person verändert das ist sowas wie eine effektstärke auf individiumsebene. (effekstärken sind ja sonst auf gruppenebene)
Klinische Signifikanz ist in der psychotherapie eine ganz wichtige methode um wirksamkeit zu erfassen.

Was sagt das aus? Beschreiben sie erklären sie

Stellen wir uns vor wir haben behandlungsbeginn t1 und behandlungsabschluss t2 und wir haben hier eine gruppe von 30 Patient/-innen also frau m, herr t usw.. deren depressivität erfassen wir zur beginn der behandlung und daraus können wir einen mittelwert errechnen und mit dem BDI (becks,, depressions inventar oder so) haben wir eine depressivität von 38. nach behandlungsabschluss messen wir die gruppe erneut und berechnen daraus einen mittelwert also für jeden einzelnen erfassen wir den BDI und errechnen den mittelwert aus. jetzt können wir einen t test berechnen und dieser t test würde aussagen: das testergebniss ist offensichtlich signifikant, da der p wert kleiner 0,05 ist das heißt wir haben einen signifikanten unterschied zwischen t1 und t2. und wenn ich die werte hier betrachte kann ich also sagen, dass die depressivität sich signifikant verringert hat. (beim BDI ist es so je höher die werte desto größer die depressivität)
wenn man zb wissen will ob frau m nach der behandlung in ihrer depressivität geheilt ist, kann ich keine aussage drüber treffen hier weil ich auf gruppenebene mir eine veränderung anschaue und eine veränderung analysiere auf gruppenebene. Tatsächlich möchte ich eine aussage über eine veränderung auf einzelfallebene machen. ich möchte nicht sagen ob sich die gruppe der behandelnden signifikant verändert sondern ob sich FRAU m signifikant verbessert hat oder sogar geheilt ist, und dafür brauchen wir das konzept der klinischen signifikanz. dh das konzept der klinischen signifikanz ist auf einzelfallebene wohin gegen die statistsiche signifikanz auf gruppenebene sich abspielt.

Klinische Signifikanz

KLINISCHE SIGNIFIKANZ

—> Zum Verstehen;

Klinische Signifikanz basiert auf RCI und Cut Off das sind die zwei Konzepte im Zusammenhang mit der Klinischen signifikanz. MERKEN!!!

—> Der RCI ist der reliable change index das ist ein maß, der statistischen bedeutsamkeit der intraindividuellen veränderung und zwar schaut sich der RCI an wie groß die veränderung zwischen t1 und t2 einer bestimmten person ist und setzt diese veränderung in relation zur reliabilität des messinstruments welches eingesetzt wird.

—>Ein Cut off ist ein festgelegter trennwert der kranke personen von gesunden personen hinsichtlich des zu testenden merkmals trennt und somit eine interpretation des testergebnisses ermöglicht. das ganze konzept von clinical significance stammt von jacobson turex aus den 90 jahren.

 Von folie;

Statistische Signifikanz ≠ Klinische Signifikanz

 Konzept der klinischen Signifikanz basierend auf RCI und CUT-Off Werten

 RCI = Reliable Change Index Maß der stat. Bedeutsamkeit der intraindividuellen Veränderung.

Während der t-Test für abhängige Stichproben prüft, ob sich der Mittelwert einer Gruppe über die Zeit verändert, quantifiziert der RCI die Veränderung der Messwerte von Einzelpersonen. Es wird geprüft, ob die indiv. Veränderung stärker ausgeprägt ist, als dies aufgrund der mangelnden Zuverlässigkeit der Messungen erwartet werden kann

 Ein CUT-OFF Wert ist ein festgelegter Testtrennwert, der kranke Personen von gesunden Personen hinsichtlich des zu testenden Merkmals trennt und somit eine Interpretation des Testergebniswertes ermöglicht

 Jacobson, N. S. & Truax, P. (1991). Clinical significance: A statistical approach to defining meaningful change in psychotherapy research. Journal of Consulting and Clinical

Psychology, 59, 12-19.

Klinische Signifikanz

RCI

zunächst einmal zur formel erklärung : die gilt immer für die berechnung des RCI. Undzwar haben wir jetzt von Frau müller ne depressivität zum zeitpunkt 1 minus ihrer depressivität zum zeitpunkt 2 zum ende der behandlung. das ganze müssen wir jetzt normieren teilen durch ist eine wurzel 2 mal die standardabweichung der normpopulation / der normstichprobe mal die reliabilität des Messinstruments. dafür steht rttt.
was hier im nenner steht ist variabel je nachdem welches messinstrument angewendet wird. wenn wir jetzt zb das BDI anwenden gibts dazu ein manual und in diesem manual kann ich gucken welche reliabilitä wird denn für den BDI eigentlich angegeben, häufig wird die reliabilität in forn von Cronbachs alpha angegeben. wie groß ist die denn eigentlich zb liegt die bei punkt 8. dann wäre hier reliabilität bei 8. die standardabweichung der normstichprobe auch das kann ich im manual des BDI nachschauen und damit ist gemeint der BDI , bei der entwciklung des BDI hat man ihn von vielen menschen ausfüllen lassen das ist die normstichprobe dadurch habe ich eine genaue formkentniss der verteilung vom BDI innerhalb dieser normstichprobe. also das ist dann auch eine normalverteilung und ich weiß was ist der mittelwert dieser verteilung und was ist eben die standardabweichung dieser normalverteilung. Diese standardabweichung nehme ich aus dem manual und kann sie dann eben hier auch verwenden.
also das ist die formel, und jetzt gilt das was hierbei herauskommt soll größer 1,96 sein . ist es größer als 1,96 spricht es für eine reliable veränderung. warum 1,96= das entspricht in der standardnormalverteilung 1,96 ist der trennwert der 95% von 5% der verteilung abtrennt.
Merken: DER RCI MUSS GRÖßER 1,96 SEIN DAMIT EINE RELIABLE VERÄNDERUNG STATTFINDET UND DAS GILT IMMER , IST GENERELL SO

Formel: Kritische differenz
—> Formel ist einafch umgestellt von der vorherigen. Dann kommt man zur kritischen differenz, wenn man diesen teil ausrechnet dann kommt da eine bestimmte zahl für den BDI raus vlt kommt da 14 raus. das würde bedeuten eine person muss sich im BDI von prä zu post um 14 punkte verändern mit ihrer depressivität , also die muss also die depressivität muss um 14 punkte zurück gehen dann ist es eine reliable veränderung. also beide formeln kann man anwenden.

Der RCI MUSS GRÖßER 1,96 SEIN ER mACHT EINE AUSSAGE DARÜBER OB DIE VERÄNDERUNG VON PRÄ ZU POST FÜR EINE BESTIMMTE PERSON SO GROß IST DAS SIE ALS RELIABEL ALS ZUVERLÄSSIG ANGESEHEN WERDEN KANN.

Der CUTT OFF IST EIN TRENNWERT DER ZWISCHEN GESUND UND KRANK UNTERSCHEIDET. DA IST NÄMLICH DIE FRAGE HAT FRAU MÜLLER DIESEN CUT OFF ÜBERSCHRITTEN- war sie vorher in der kranken population und nach der Behandlung ist sie in der gesunden Population dann pricht das ja dafür das sie recovered ist also das sie gesund ist.

Klinische Signifikanz

CUT OFF

-wie komme ich jetzt auf diese verteilung hier: beim bDI könnte es jetzt so sein das die normstichprobe eine stichprobe von gesunden ist sprich ich gebe den menschen die nicht depressiv sind den BDI und guck mir an wie sie diesen raten also ausfüllen denn auch gesunde menschen würden ja nicht alle fragen mit null beantworten und wir hätten hier auch einen mittelwert aber der wäre hier deutlich niedriger als bei depressiven menschen. das wäre dann eine normstichprobe des BDIS bei gesunden es könnte aber auch sein , dass der BDI normiert wird indem man zuvor dieganostiert ist jemand depressiv oder nicht, ist jemand depressiv bekommt er den BDI FÜLLT ihn aus und daraus entwickelt sich dann ne normstichprobe. normstichproben basieren in der regel auf irgendwas zwischen 1000 und 2500 personen die möglichst repräsentativ rekrutiert werden um so eine normstichprobe zu bilden. dh die normstichprobe könnte entweder aus gesunden menschen oder aus kranken personen bestehen. wenn wir davon ausgehen, dass wir eine normstichprob nur von kranken personen haben also ein clinical sample dann wäre der cut off das wir mindenstens am ende der behandlung sollten wir mindestens zwei standardabweichungen vom Mittelwert der kranken population entfernt sein. das wäre diese rote linie. frau müller lag vorher irgendwo hier , nach der behandlung sollte sie mindestens 2 standardabweichungen vom mittelwert der depressiven entfernt. käm es nur von der gesunden population dann würden wir fordern das frau müller nicht mehr als 2 standardabweichungen am ende der behandlung von der gesunden population entfernt ist. das wäre dann die blaue linie. oder schließlich die grüne linie wenn wir kenntnisse in beider abteilung haben dann könnten wir einfach den mittelwert berechnen , also den mittelwert aus beiden mittelwerten und würden dann sagen dieser wert c sollte überschritten werden. der mittelwert von beiden sollten in richtung gesunder population überschritten werden.

es gibt drei unterschiedliche wege cut offs zu berechnen, wenn man sich entscheidet welchen man anwendet sollte man gucken was steht zur auswahl man guckt in die testmanuale rein , zb BDI welche cut offs stehen mir zur verfügung? wurde zb der BDI anhand einer klinischen stichprobe normiert dann würde ich mir den mittelwert dieser klinsichen stichprobe angucken und die standardabweichung würde vom mittelwert 2 standardabweichungen abziehen und dann wäre das mein cut off.

Klinische Signifikanz

WELCHE entscheidungsregeln leiten sich ab?

wenn der RCI für frau müller größer als 1,96 ist und der Cut off wurde überschritten. Gleichzeitig ist ihre veränderung so groß, dass sie alsreliabel angesehen kann, dann sagen wir frau müller ist am ende genesen.

es könnte aber auch sein das der cut off nicht überschritten oder unterschritten wurde aber die veränderung sehr groß war, dann ist es eine signifikante verbesserung (significantly improved) aber eben nicht genesen.

außerdem besteht auch die möglichkeit das sie sich signifikant verschlechtert (Deteriorated)

und dann kann ich anhand dieser entscheidungsregeln für jede einzelne person feststellen hat sie sich signifikant verbessert, signifikant vershclecht oder ist sie genesen. also ein sehr nützliches instrument.

Anwendungsaufgabe zum RCI

Cut off wert = 15 dh wenn man über 15 punkte hat zählt man zur kranken population, ist man unter 15 punkten zählt man zur gesunden population (lern mal noch die größer kleiner zeichen)
anfangs = 20 punkte danach 10 punkte
cut off wert hat sie also unterschritten und nur aufgrund des cut offs würden wir erstmal sagen sie zählt danach mit einer größeren wahrscheinlichkeit zu den gesunden als zu den kranken.
Der RCI wert muss größer 1,96 sein dann ist es reliabel. jetzt können wir ja die formel umstellen wie davor gezeigt, das hat den vorteil ich kann die differenz berechnen die erzielt werden muss damit sie als reliabel angesehen werden kann sprich größer 1,96 ist das ist die kritsiche differenz also das wären 11 punkte , wenn also die differenz größer als 11 punkte ist dann haben wir eine reliable veränderung weil das ist gleichbedeutend als haben wir einen RCI VON größer 1,96
Frau K differenz liegt bei 10 punkten, hinsichtlich des RCI werts ist es bei ihr nicht klinisch reliabel. also die veränderung ist nicht so groß das wir sie zuverlässig auf die intervention attribuieren können. weil der RCI ja nicht überschritten wurde. sie hätte eine veränderung von mindestens 11 punkten gebraucht , damit wir sagen können diese veränderung ist wirklich zuverlässig aber sie hat sich ja nur um 10 punkte verbessert. sie hat den cut off überschritten gehört also am ende der behandlung mit einer görßeren wahrscheinlichkeit zu den gesunden als zu den kranken. können wir sie also als recovered bezeichnen also gesund? =ABER man kann noch nicht zurückführen das es wirklich auf die therapie zurückgeht die verbesserung. also die verbesserung durch die intervention zustande kann man nicht sagen. weil der RCI kleiner als 1,96.

Differenzmaß auf gruppenebene

 Intraindividuelle Veränderung

 T-Test für abhängige Stichproben

 > 2 Messzeitpunkte: Varianzanalyse mit Messwiederholung

 Häufigkeitsverteilung: McNemar-Test (nonparametrisch)

 Interindividuelle Veränderung

 T-Test für unabhängige Stichproben

 > 2 Messzeitpunkte Varianzanalyse

 Häufigkeitsverteilung: Chi-Quadrat-Test (nonparametrisch)

erklärung: bei veränderungen müssen wir unterscheiden zwischen inter und intraindividuell. intraindividuell =dasselbe individum , anhängige stichproben wird zu t1 und t2 untersucht und hat eine veränderung zwischen diesen beiden messzeitpunkten stattgefunden wäre hier die fragestellung da ist der t test mit abhängingen variablen oder varianzanalysen und messwiederholungen geeignet.

interindividuell = bedeutet einen veränderung die ich festmachen möchte indem ich zwei unterschiedliche gruppen vergleich eine haben zb eine intervention bekommen die anderen haben diese intervention nicht bekommen. und ich vergleiche die gruppen miteinander, unabhänginge stichprobe, hier würden wir einen t test für unabhängige stichproben verwenden oder varianzanalyse.

TRENDANALYSEN (INTERINDIVIDUELL

welche trends unterscheiden sich ?

 Lineare Trends: Monotone Veränderungen über die Zeit

hinweg – kontinuierlicher Anstieg

 Quadratische Trends: Nicht-lineare Veränderung z.B. sind

Zuwächse in der ersten Messphase noch relativ gering und

werden in späteren Messphasen kontinuierlich größer

 Polynomiale Trends: Sprunghafte Anstiege oder Trends mit

systematisch wechselnden Anstiegskurven

ZEITREIHENANALYSEN

(INTRAINDIVIDUELL)

 Beschreibt den Trend einer Veränderung über die Zeit hinweg für

dieselbe Person. Zu allen Messzeitpunkten werden Daten von der

gleichen Person erfasst.

 Die Messwerte einer Person zu verschiedenen Zeitpunkten

korrelieren mit sich selbst – es liegt eine Autokorrelation vor

 In Zeitreihenanalysen kann die Autokorrelation berücksichtigt

werden

 Zeitreihenanalysen lassen sich gut durch Mehrebenenmodelle

modellieren

erklärung: wenn es um veränderungen über die zeit geht dann sind wir bei zeitreihenanalysen und die können wir eben gut mit mehrebenenmodellen analysieren. Zeitreihenanalyse ist ein spezialfall der regressionsanalyse weil sie sich auf eine abhängige stichprobe zieht.

DOSE-EFFECT MODELL IN DER PSYCHOTHERAPIE ein beispiel aaus der forschung ABER MUSST DU LERNEN

SEHR WICHTIG LERNEN

Was sagt dieses Modell aus? Was siehst du an der Grafik?

der howard hat eben geguckt wie verhält sich veränderung in relation zur therapiedosis. also veränderung über die zeit innerhalb einer therapie. und da zeigt sich eine sogenannte log-lineare beziehung.
Howard et al. (1986) konnten zeigen, dass zwischen dem therapeutischen Fortschritt und der Anzahl der durchgeführten therapeutischen Sitzungen eine log-lineare Beziehung besteht
 Eine log-lineare Beziehung im Sinne einer negativ beschleunigten Kurve
 Die Analyse verdeutlicht, dass viele Patienten bereits
GRAFIK: Hier haben wir die number of sessions und hier haben wir eine recovery rate % , bei 100% wär man komplett geheilt und 50% zu 50% geheilt , bei diesem beispiel einer einzelperson sieht man zb sprunghafte veränderung, es ist kein perfekter linearer trend, sind sogenannte sudden gains. untersucht man jetzt von vielen 1000 patienten den verlauf dann kommt man nicht auf einen linearen trend sondern auf einen sogenannten logemierten Trend. am anfang der therapie deutlichen zuwachs bei sitzung 6 schon 15% der recovery erreicht und so geht der trend nicht weiter, er verlangsamt sich, dh je mehr therapie dann gemacht wird desto weniger größere zuwachsraten haben wir. die meiste verbesserung findet bereits in den ersten sitzungen interessanterweise statt.

indirekte vs direkte Veränderungsmessung unterschiede erklären

übung 2 Frage: Antworten auf die Fragen vom Seminar ,zweites seminar 4.11

Zweites Seminar 4.11.24

Übung 2

Geringer effekt = es gibt ein Treatment as usual

warum machen wir alpha 5%?

Power= für denbeta fehler= für den beta fehler gilt er sollte nicht größer als 4 mal der alpha fehler sein. der beta fehler sollte maximal 20% betragen , weniger als 80% teststärke sollten wir nicht haben.

-Alpha fehler= wir akzeptieren die h1 obwohl eiegtnlich die h0 zutrifft.

wir erkennen nicht das das treatment eigentlich wirksam ist, das wäre der beta fehler.

-Alpha fehler hochsetzen= stichprobenumfang wird kleiner.

effektsträke geht hoch= optimaler stichprobenumfang geht wieder runter

-mit welchem statistischen testverfahren lässt sich die wirksamkeit überprüfen übung 2 = AV= BDI

uv1= treatment

uv2= Messzeitpunkt, gestuft in t1 und t2

av= immer das was wir messen

also insgesamt zwei unabhängingen variablen haben wir

hier könnten wir vier mittelwerte erfassen. der bezieht sich auf unseren BDI also unsere AV.

-Testverfahren welches wir anwenden sollten: Nennt sich 2 faktorielle Anova = ist das häufigste design bei experimentellen designs , da hätten wir den haupteffekt treatment , und den interaktionseffekt= ob die depressivität in der gruppe stärker zurückgeht als in der kontrollgruppe ?

mixed anova = hier steckt beides drinne, weil wir einmal eine messwiederholung haben also “within”, und einmal “between”. also zwei unterschiedliche Stichproben insgesamt haben wir.

within= zwei messzeitpunkte bei derselben person.

das verfahren ist ein multivariates verfahren.,solche verfahren brauchen in der regel eine gerine stichprobe. = multifaktorielle Anova.

der interaktionseffekt vergleicht die beiden differenzwerte miteinander. bdi prä minus bdi post also.

wir haben hier insgesamt zwei Haupteffekte hierbei:

induktiv / Deduktive Schlussfolgerung=

Vor und Nachteile=induktion wir stellen keine hpothesen erst auf sondern leiten aus der untersuchung erkenntnisse ab aus denen wir dann hypothesen

induktiv nachteil= kann immer zu einer unzureichenden Verallgemeinerung kommen.

regt aber positiv auf neue Forschungslücken auf

deduktiv = ist wissenschaftlicher, an theorien angelegt

2a) richtig

quirfragen am eden 2b) schwierig= es ist zufällig gezogen,

es gibt schwarze schwäne= ja kann man, weil man kann ja immer noch irgendwo einen schwarzen schwan finden, kann man also verifizieren. dh einfach
weil das keine all aussage ist.
4.a) = fachwort das gesucht ist= exhaustion , wir werfen nicht die ganze hypothese sondern schränken den geltungsbereich der hypothese ein.
4b) wie lautet die unformulierte Hypothese: induktiv weil wir aus den ergebnissen ja wieder eine hypothese gebildet haben. wichtig= man könnte empfehlen basierend auf einer neuen stichprobe diese hypothese dann überprüfen.

zweiter Foliensatz Seminar 2: folie 10

erste aufgabe Quizaufgaben

1.a) falsch

b) richtig

c) richtig (psychometrische stehen den projektiven gegenüber)

d) nein

e) richtig, mittel wäre 0,5, klein wäre 0,2

folie 10 benchmarks
drei benchmarks: idealnorm zb vollzeitsbeschäftigung in deutschland, kriterialnorm= zb prüfung bestanden oder nicht bestanden, kriterialnorm an der HSD wär zb 50%, Realnorm= IQ 85-115 , 130 überdurchschnittlich.

aufgabe folie 11: vom neuen foliensatz 04.11.24 wietere Quifaufgaben

realnorm handelt es sich, weil wir ja einen vergleich machen, mittelwert haben und einen Durchschnitt haben.

-in den zähler kommt=475-473

-in den Nenner kommt= 100.000 (strich also geteilt zeichen bzw bruch) und unten steht wurzel von 13.000 (kannst du auch mit dem taschenrechner ausrechnen)

1,52 kommt raus ( der testwert würde dann im bereich h1 zeigen also nicht beim bereich ho. der unterschied wäre also nicht signifikant.

genau so wird es gerechen t

-standardfehler des mittelwerts

-normative Vergleiche= sind oft einstichtests

-von einer normalverteilung auf eine standardnormaverteilung, die immer mitte 0 und standardabweichung 1 hat.

-durch die z transofrmation haben wir nicht mehr die normalverteilung sondern die testverteilung, also die standardnormalvertilung statt die normale

folie 12 aufgabe letzte Aufgabe prof. schlaufuchs

Überprüfung ob professor schlaufuchs um eine Standardabweichung besser ist also seine Kolleg/-innen

gesuchter Z-wert= Standardabweichung muss man plus dem mittelwert rechnen.

insgesamt kommt 3,26 raus = was sagt uns das? = hoch signifikant- (es ist signifikant weil wir 3,6 standardabweeichungen besser sind es ist auch der größer ist als 1,64 also größer als der Kritische Wert.

Aufgabe Cohens D berechnen

0, 5 Standardabweichung ,

folie 17:

aufgabe 1: interindividueller vergleich, weil man ja mehrere Patienten vergleicht.

hier kann man in beide richtungen diskutieren. Inferenzstatistischer Test= mit zb vier messzeitpunkten= anova mit messwiederholung wäre für interindividuell

(klassisch wär für intraindividuelle veränderungen)

folie 18:

beispiel: regrression zur MItte: Erbsen beispiel, sportler / Performance Beispiel

-konsequenzen folie 18 frage:

regression zur Mitte= unsystematisch , weil es kann immer sein das wir mal drüber oder drunter liegen. , wir haben mehr Variationen in den Werten

folie 23. Berechnung des RCI und des Cut offs

cut off der sich anbietet=

alpha 5%=0,05 macht man immer

Aggressionstrainings in der Schule

seminar 2 4.11

lösungen stehen in der folie

Beitreten

Vorschau

Author

Nipu D.

Informationen

Zuletzt geändert
vor 5 Monaten

Kurs melden