Nenne Anforderung an diagnostische Tests. (8)
Anforderungen an diagnostische Tests (nach Knottnerus et al. 2009)
Technische (instrumentelle) Funktionsfähigkeit, Anwendbarkeit
Lieferung klinisch plausibler Informationen (Inhalts- und Konstruktvalidität)
Geringe Streuung der Werte (Zuverlässigkeit = Reliabilität)
Ausreichende diagnostische Genauigkeit für die Bestätigung einer Diagnose (Kriteriumsvalidität)
Lieferung relevanter prognostischer Informationen (prädiktive Validität, Unterform der Kriteriumsvalidität)
Lieferung relevanter Informationen für die klinische Entscheidung über anzuwendende Maßnahmen/günstige Effekte auf die Einleitung von Behandlungs- oder Pflegemaßnahmen *
Günstige Effekte auf patientenrelevante Ergebnisse *
Kosteneffektivität
*Wichtigste Punkte aus Sicht der evidenzbasierten Pflege
Was ist Reliabilität?
Reliabilität = Zuverlässigkeit
Fähigkeit eines diagnostischen Tests, „natürliche“ Schwankungen oder Unterschiede von Werten abzubilden →eine Voraussetzung für Validität
Maß für das Risiko von Messfehler
Maße der Reliabilität: interne Konsistenz, Beobachterübereinstimmung oder Übereinstimmung bei Messwiederholung
Reliabilität ist die Obergrenze der Validität!
Ein Instrument was nicht ausreichend reliabel ist, kann nicht ausreichend valide sein.
Was ist Validität?
Validität = Gültigkeit
Fähigkeit eines diagnostischen Tests, das Phänomen zu messen, das es messen soll
„Klassische“ Unterscheidung zwischen drei Arten der Validität
Inhaltsvalidität
Kriteriumsvalidität →z.B. diagnostische Genauigkeit
Konstruktvalidität (Zusammenhang mit theoretisch ähnlichen und unterschiedlichen Phänomenen)
Wenn Sie eine Studie lesen, auf welche Informationen achten Sie, wenn Sie überprüfen wollen, ob diese ausreichend reliabel ist?
Reliabilität: eine Messung ist wiederholbar mit ähnlichen Ergebnissen
Interrate-Übereinstimmung = zufällige Übereinstimmungen werden ausgerechnet
Kohens-Kappa = wird das korrigiert
->Messen alle Reliabilität: je dichter an 1, desto besser!
Szenario
Sie haben ein neues Assessmentverfahren entwickelt, um Durstgefühle von
beatmeten Patienten während der Weaning-Phase frühzeitig zu erfassen. Sie
möchten nun wissen, ob der Test in der Lage ist, Durst bei diesen spezifischen
Patienten ausreichend genau zu erfassen. Sie planen eine Studie …
Wie müsste die Studie aussehen?
Was ist der Referenzstandard ?
Referenzstandard (nach Knottnerus et al. 2009)
Diagnostischer Vergleichstest, der nach aktuellem Stand des Wissens die beste Reliabilität und Validität für die Erkennung des interessierenden Gesundheitsproblems aufweist
In Studien zur diagnostischen Genauigkeit die Vergleichsgröße (Referenz) für Bestätigung oder Nicht-Bestätigung der Ergebnisse des Index-Tests
Meist kein „perfekter“ Referenzstandard („Goldstandard“) verfügbar
Oft auch kein adäquater Referenzstandard (z.B. Dekubitusrisiko, Sturzrisiko, Malnutrition) verfügbar
Was bedeutet eine Hohe Sensitivität?
Hohe Sensitivität
Eine hohe Sensitivität hilft, viele Erkrankte zu finden – oft auf Kosten einer hohen Rate falsch positiver Testergebnisse.
Was bedeutet eine Hohe Spezifität?
Hohe Spezifität
Eine hohe Spezifität hilft, falsch positive Testergebnisse zu vermeiden (= hohe
Sicherheit, dass eine Erkrankung vorliegt) – oft auf Kosten einer hohen Rate falsch negativer Befunde
Abhängigkeit der diagnostischen Genauigkeit von der untersuchten Population
Die Prävalenz oder Inzidenz einer Erkrankung beeinflussen die diagnostische Genauigkeit.
Je höher die (bekannte) Prävalenz oder Inzidenz, desto höher meist die Sensitivität und der negative prädiktive Wert, aber desto niedriger die Spezifität und der positive prädiktive Wert.
Je niedriger die (bekannte) Prävalenz oder Inzidenz, desto niedriger meist die Sensitivität und der negative prädiktive Wert, aber desto höher die Spezifität und der positive prädiktive Wert.
Was sind die 3 Bewertungsbereiche der Studienqualität?
Bewertungsbereiche der Studienqualität
Risiko von Verzerrungen (Bias)
statistische Präzision der Ergebnisse
Anwendbarkeit und Übertragbarkeit
Was sind typische Verzerrungsquellen in Studien zur diagnostischen Genauigkeit?
Typische Verzerrungsquellen in Studien zur diagnostischen Genauigkeit (nach Whiting et al. 2011)
Nicht wahrscheinlichkeitsbasierte Gewinnung der Stichprobe (z. B. bei Gelegenheitsstichproben)
Durchführung des Index-Tests
Abhängig vom Referenzstandard (Ergebnisse Referenzenstandard beeinflussen Indextest.)
Schwellenwerte nicht vorab definiert („fishing for best values“)
Durchführung des Referenzstandards
Unzureichende Validität und Reliabilität
Abhängig vom Indextest (Ergebnisse Indextest beeinflussen Referenzstandard.)
Reihenfolge, Zeitspanne und Vollständigkeit der Daten
Großer Zeitabstand zwischen Referenzstandard und Indextest
Einfluss von Präventions- oder Behandlungsmaßnahmen („treatment paradoxon“)
Nicht alle Tests bei allen Teilnehmenden durchgeführt
Ausschluss von Teilnehmenden/Testergebnissen aus der Analyse
Wie statistisch zuverlässig sind die Ergebnisse? Nennen Sie Signalfragen.
Kriterien für die Bewertung der statistischenPräzision
Kernfrage: Wie statistisch zuverlässig sind die Ergebnisse?
Signalfragen für die Bewertung von Studien:
Wurde vorab die erforderliche Stichprobengröße für die Bestimmung einer erwarteten Sensitivität oder Spezifität berechnet, unter Annahme einer bestimmten Prävalenz oder Inzidenz der Zielerkrankung?
Wurde die berechnete Stichprobengröße erreicht?
Entspricht die gemessene Prävalenz oder Inzidenz der Zielerkrankung den Erwartungen (je geringer, desto unsicherer die Ergebnisse)?
Sind Konfidenzintervalle für die Sensitivität, Spezifität etc. berichtet?
Wie breit sind die Konfidenzintervalle (je breiter, desto unsicherer die Ergebnisse)?
Was sind typische Beeinträchtigungen der Übertragbarkeit und
Anwendbarkeit der Studienergebnisse?
Typische Beeinträchtigungen der Übertragbarkeit und Anwendbarkeit der Studienergebnisse (nach Whiting et al. 2011)
Untersuchungsteilnehmer/-innen sind nicht ausreichend repräsentativ für Zielpopulation in der praktischen Versorgung (vermutlich Unterschiede in der Prävalenz der Zielerkrankung).
Durchführung des Index-Tests:
Zeitpunkte und Methoden entsprechen nicht den Prozeduren im Versorgungsalltag.
Die Testdurchführenden entsprechen nicht den Anwenderinnen und Anwendern im Versorgungsalltag (Qualifikation, Erfahrung, Rolle in der Versorgung, Patientenkontakt …).
Der Referenzstandard ist klinisch nicht ausreichend angemessen.
Likelihood Ratios
Likelihood Ratios (Wahrscheinlichkeitsverhältnisse) geben Auskunft über den zu erwartenden Informationsgewinn durch einen diagnostischen Test.
LR+
Wahrscheinlichkeit für ein positives Testergebnis bei einer Person mit der Zielerkrankung/ Wahrscheinlichkeit für ein positives Testergebnis bei einer Person ohne diese Erkrankung
Je höher >1 (am besten >10), desto höher der Informationsgewinn für die Bestätigung der Erkrankung
LR+ helfen, den geeigneten Schwellenwert für einen diagnostischen Test zu finden und die Genauigkeit verschiedener Tests zu vergleichen
LR-
Wahrscheinlichkeit für ein negatives Testergebnis bei einer Person mit der Zielerkrankung/ Wahrscheinlichkeit für ein negatives Testergebnis bei einer Person ohne diese Erkrankung
Je kleiner LR- <1 (am besten um 0,1), desto höher der Informationsgewinn für Ausschluss der Erkrankung
-> Mithilfe der Likelihood Ratios lässt sich mittels Fagan-Nomogramm bei bekannter Vortest- Wahrscheinlichkeit die zu erwartende Nachtest-Wahrscheinlichkeit berechnen
Vorteile LR
Sie geben Auskunft über den Informationsertrag durch einen diagnostischen Test.
Sie sind weitestgehend unabhängig von der Prävalenz oder Inzidenz der Zielerkrankung
Was ist der klinischer Nutzen diagnostischer Strategien?
Klinischer Nutzen diagnostischer Strategien
= Resultat der Patientenmerkmale, der diagnostischen Genauigkeit, des Informationsgewinns für die Behandlungs-/ Pflegeentscheidung und der Effekte der Intervention
Last changeda year ago