Beschreiben Sie in genau vier Sätzen was im Rahmen des Models unter “Diagnostik” verstanden werden soll.
Unter Diagnostik versteht man die regelhafte Zuordnung von Individuen zu vordefinierten Zustands-/ Interventionsklassendurch die Messung von geeigneten Parametern. Die Zuordnung erfolgt auf der Basis von gemessenen Indikatoren (Objekt erhobene Merkmale), welche den Aufschluss über den Zustand von der Person geben. Das Ziel ist es hierbei, auf der Grundlage der gemessenen Werte sinnvolle Entscheidungen/Maßnahmen abzuleiten, die dem Status von der jeweiligen Person entsprechen.Die Diagnostik unterscheidet sich von der Evaluation oder Forschung darin, dass sie individuell ausgerichtet ist und praktische Konsequenzen für die betroffene Person hat.
Alle Spielerinnen, die nicht mindestens 40cm hoch springen, müssen im den folgenden 6 Wochen ans einem Sondertraining zur Steigerung der Sprungkraft teilnehmen
Damit der Test, als ein diagnostisches Verfahren gilt, muss er zu der Leistungsmessung, auch noch die Zuordnung von den Spielerinnen zu bestimmten Statusklassen mit den entsprechenden Konsequenzen berücksichtigen.
Zum Beispiel misst Herr Fitmacher die Sprunghöhe von jeder einzelnen Spielerin mit dem Jump- and- Reach- Test, um eine Entscheidung treffen zu können, wer von ihnen für die anstehende Spiele eingesetzt wird. Er legt dann somit einen Wert fest. Die Spielerinnen, die diesen überschreiten, werden als „angriffsfähig“ betitelt und dürfen die kommenden Spiele spielen, während die die diesen Wert unterschreiten, als „nicht-angriffsfähig“ betitelt werden und somit beim nächsten Spiel nicht spielen.
Somit sind alle Merkmale der Diagnostik abgedeckt: Die Messung von einem Indikator, in dem Fall die Sprunghöhe und die regelhafte Zuordnung zu Statusklassen mit den daraus abgeleiteten individuellen Maßnahmen.
Wie müsste das Beispiel weiter ausgestaltet werden, damit es nicht unter den Begriff “Diagnostik” fällt?
Wenn der Mittelwert der gemessenen Sprunghöhen niedriger als 40 cm sein sollte, müssen in den folgenden 6 Wochen alle Spielerinnen an einem Sondertraining zur Steigerung der Sprungkraft teilnehmen.
Keine Diagnostik liegt in diesem Beispiel vor, wenn der Test nur zu einer allgemeinen Leistungsbeschreibung oder Datensammlung dient, sprich die individuelle Zuordnung/Konsequenzen nicht berücksichtigt werden.
Zum Beispiel misst Herr Fitmacher den Jump-and-reach-test, um eine durchschnittliche Mannschaftsleistung zu dokumentieren. Hier spielt also der individuelle Aspekt keine Rolle bzw. es erfolgt keine individuelle Entscheidung. Es handelt sich hier somit nicht mehr um eine „Diagnostik“.
Die beiden Testaufgaben zielen darauf ab, die latente Variable „Ausdauerleistungsfähigkeit" zu messen.
Ein Korrelationskoeffizient von 0.71 bedeutet, dass ca. 50 % der Unterschiedlichkeit zwischen den getesteten Personen auf einen gemeinsamen Faktor (hier, so der Anspruch der Tests, also die „aerobe Ausdauer") zurückgeführt werden können.
Umgekehrt bedeutet dies, dass 50% nicht durch diesen Faktor erklärt werden können.
Die Testleistung hängt also auch noch von anderen Faktoren ab. Dies könnte beim Gehen auf der Stelle z.B. mangelnde Kraft sein, aufgrund derer es dann nicht möglich ist, das Bein bis zu der geforderten Höhe anzuheben.
Beim Gehtest über 6-Min könnten z.B. Schmerzen in einzelnen Fällen die erreichte Gehstrecke limitieren.
Der jeweilige Testwert lässt sich um so eindeutiger als Indikator für „Ausdauer" interpretieren, je besser es gelingt, diese überlagernden Faktoren auszuschließen.
Dazu könnte es z.B. sinnvoll sein, auch mit zu überprüfen, wie stark das Herz-Kreislaufsystem tatsächlich in Anspruch genommen wurde und somit als leistungslimitierend angenommen werden kann, indem man auch die Herzfrequenz mit erfasst.
Insgesamt sind beide Tests durchaus geeignet, Hinweise auf die körperliche Leistungsfähigkeit der untersuchten Personen zu liefern, allerdings kann dies nicht mit letzter Sicherheit dem Faktor aerobe Ausdauer zugeschrieben werden.
Beide Tests wurden jedoch für den Einsatz bei älteren Personen konzipiert. Hier ist diese Unschärfe möglicherweise als weniger gravierend anzusehen, da mögliche Interventionen nicht so sehr an die genaue Kenntnis der Ausdauerleistungsfähigkeit gebunden sind (wenn also z.B. ein individuell gestaltetes Ausdauertraining geplant werden soll) sondern stärker der Gesamtzustand interessiert (Person kann die Anforderungen des Alltags bewältigen, z.B. Treppen steigen).
Wie könnte die Validität des in Aufgabe 5 genannten Step-Tests überprüft werden?
Skizzieren Sie beispielhaft das Vorgehen.
Validität bedeutet, dass der Test auch den Aspekt misst, den er angibt zu messen. Der Step-Test wird als Test der „aeroben Ausdauer" eingesetzt.
Eine erste Möglichkeit zur Validierung bietet die Befragung von Experten, die aufgrund von Plausibilitätsüberlegungen eine erste Bewertung vornehmen könnten. Es wäre denkbar, dass diese aufgrund der relativ kurzen Testdauer (2 Min.) Zweifel daran äußern würden, ob tatsächlich die aerobe Ausdauer der leistungslimitierende Faktor ist und damit aus der Testleistung die Ausprägung dieser Komponente bei der jeweiligen Person abgelesen werden kann.
Ein weiterer Schritt könnte darin bestehen, zu überprüfen, inwieweit sich die Ergebnisse des Step-Tests mit der Testergebnissen decken, die aus bereits als gültig angesehenen Testverfahren stammen.
In diesem Sinne könnte man wie folgt vorgehen: Eine Stichprobe aus dem Personenkreis, für den man später Gültigkeit beanspruchen möchte, absolviert mit geeignetem zeitlichen Abstand (ausreichend lang, um nach dem ersten Test wieder voll erholt zu sein, aber auch ausreichend kurz, um langfristigen Veränderungen des Niveaus auszuschließen)sowohl den Step-Test als auch einen Ergometer-Stufentest.
Der Step-Test kann als valide angesehen werden, wenn die Werte aus beiden Tests über die Personen hinweg ausreichend korrelieren.
Welche verschiedenen Formen der Validierung werden unterschieden? Wie lassen sich diese jeweils charakterisieren?
Validität lässt sich in die Inhaltsvalidität, die Kriteriumsvalidität und die Konstruktuinsvalidität unterteilen.
Die Inhaltsvalidität ist die „Validierung durch Nachdenken“. Die Validität wird aufgrund von inhaltlichen Argumenten und Expertenwissen beurteilt. Hier wird theoretisch überlegt, ob die Testung beziehungsweise die Indikatoren des zu messenden Konstrukt inhaltlich vollständig und angemessen abbilden. Die Grundlagen hierfür sind die Plausabilitätsüberlegungen, sprich kein statistischer Nachweis. Es beruht auf logischer Argumentation, die höhe der Validität kann nicht quantifiziert werden, die subjektive Einschätzung wird oft durch Expertenbefragungen gestützt und es liegt eine Zielvorgabe vor. Im Foliensatz wurde als Beispiel die Sehschärfe genommen. Sie ist valide, von die Fähigkeit, die Symbole zu sehen, tatsächlich von der Schärfe des Netzhautbildes abhängt.
Bei der Kriteriumsvalidität findet die Validiierung durch Vergleich mit anderen Messungen statt. Sie wird mit anderen Ausagekriterien verglichen, sprich einem bereits als valide angesehenen Verfahren (Goldstandart). Es wird geprüft, ob die Werte des Tests mit den Wertzen des Kriteriums übereinstimmen. Dies ist eine statistische erheben (Korrelation) zwischen dem Testwert und dem Kriteriumwert. Die Voraussetzung ist, dass das Außenkriterium selbst inhaltlich valide sein muss. Es wird unterschieden zwischen der Übereinstimmungsvalidität, sprich das Test und Kriterium gleichzeitig erhoben werden und der prognostischen Validität, sprich das der test zukünftiges Verhalten vorhersagen soll. Hier wird als Beispiel der Vergleich verschiedener Laktatwerte mit dem Laktat-Steady-State genommen.
Bei der Konstruktionsvalidität wird die Validierung durch vergleichen mit erwarteten Effekten bestimmt. Sie überprüft, ob der Test sich so verhält, wie es die Theorie zum Konstrukt vorhersagt. Es wird geprüft, ob sich hypothesenkonforme Zusammenhänge zeigen. Es werden Beziehungemn zu anderen Merkmalen, Gruppen oder Interventionen hergestellt. Es ist kein einzelnes Aussagekriterium nötig. Die theoretischen Annahmen werden empirisch überprüft. Als Beispiel wird hier die Applied Kinesiology genutzt. Sie überprüft, ob eine Diagnose zu tatsächlichen Therapieerfolgen führt
In Tab. 1 (Folie 20) ist angegeben, wie viele Klimmzüge die Studenten mit den beiden Griffarten (chin-up; pull-up) jeweils schafften. Besteht ein Zusammenhang zwischen den beiden Ausführungsvarianten? Quantifizieren Sie die Stärke dieses Zusammenhangs.
Unter welchen Bedingungen kann das Verfahren der Retest-Reliabilitäts-Bestimmung nur mit Einschränkung eingesetzt werden?
Beschreiben Sie diese Bedingungen und illustrieren Sie die Problematik an einem Beispiel.
Sie sollen einen Test zur Abschätzung der Kraftausdauer der Bauchmuskulatur auf seine Zuverlässigkeit (Reliabilität) überprüfen. (Als Indikator wird die maximale Anzahl korrekt ausgeführter Crunches erfasst). Welche Methode wählen Sie? Erläutern und Begründen Sie das Vorgehen ihrer Untersuchung.
Die Antworten „hardly ever – sometimes – often“ sind drei geordnete Kategorien. Damit liegt bei jedem Item Ordinalskalenniveau vor. Die Reihenfolge (wenig → mittel → viel Angst) ist eindeutig. Die Abstände zwischen den Antwortkategorien sind allerdings nicht bekannt und nicht zwingend gleich. Die Autoren gaben den Kategorien die Werte 1,2 und 3. Das ist eine numerische Codierung ordinaler Kategorien. Sie suggeriert dann gleiche Abstände, was allerdings theoretisch nicht gesichert ist. Die Punktevergabe spricht nicht direkt für eine Intervallskala.
Der Gesamtscore ist die Summe von ordinalen Werten.Die Skalenlogik ist entscheidend. Die Summe ist formal wieder ordinalskaliert, es sei denn, man trifft zusätzliche Annahmen. Ohne weitere Annahmen wäre es nicht zulässig, den Score als intervallskalliert zu behandeln.
Damit die Addition der Punktwerte eine sinnvolle Abbildung des Merkmals „Wettkampfangst“ ergibt, müssen folgende Annahmen erfüllt sein: Gleiche Abstände zwischen den Antwortkategorien messen erfüllt sein „hardly ever → sometimes“ entspricht demselben psychologischen Abstand wie „sometimes → often“. Nur dann kann man 1, 2 und 3 als intervallskalierte Abstände interpretieren. Zweitens misst jedes Item dieselbe zugrunde liegende Dimension. Alle Items müssen denselben latenten Faktor („Wettkampfangst“) messen, sprich Eindimensionalität. Drittens sie Additivität der Itembeiträge. Jedes Item trägt in gleicher Weise zur Gesamtausprägung bei. Die Summe repräsentiert dann den Gesamtgrad der Angst. Zuletzt die Realibilität und Validität der einzelnen Items. Somit sollen Verwechslungen vermieden werden.
Beim Messsystem von Jamphay wird die Sprunghöhe über die Flugzeit gemessen. Die Flugzeit ist eine physikalische Zeitmessung (in Sekunden) mit einem natürlichen Nullpunkt. Damit handelt es sich um eine verhältnisskalierte Größe (Ratio-Skala): Abstände sind bedeutungsvoll Ein natürlicher Nullpunkt existiert (0 Sekunden Flugzeit = kein Sprung) Vielfachrelationen sind zulässig (z. B. „Schüler A war doppelt so lange in der Luft wie Schüler B“). Da die Daten verhältnisskaliert sind, darf ein Mittelwert gebildet werden. Das ist die korrekte und statistisch sinnvolle Größe für verhältnisskalierte Messwerte. Der arithmetische Mittelwert der Flugzeiten repräsentiert die „typische“ Sprunghöhe der Gruppe. Alternatriv, aber wenig üblich ist der Median, der robust gegen Ausreißer reagiert und die Standartabweichung zur Bestimmung der Streuung Der Mittelwert ist erlaubt, weil das Messverfahren eine verhältnisskalierte Variable erzeugt, der Mittelwert laut Theorie erst ab intervallskala zulässig ist und das Verhältnis- bzw. Rationierung die höchste Stufe ist.
Für die Berechnung einer empfohlenen Trainingslast als prozentualer Anteil der maximal bewegbaren Hantellast ist ein Verhältnisskalenniveau erforderlich. Nur eine Verhältnisskala erlaubt es, Messwerte sinnvoll in Prozent auszudrücken, da dafür vorausgesetzt wird, dass zwischen den Messwerten lineare Abstände bestehen und insbesondere ein absolut sinnvoller Nullpunkt existiert. Dieser Nullpunkt müsste bedeuten, dass eine Last von 0 kg auch tatsächlich „keine Kraftleistung“ repräsentiert. Bei Kraftleistungen ist dies jedoch problematisch. Eine Hantel nicht anheben zu können bedeutet nicht, dass die zugrunde liegende Kraftleistung wirklich „null“ ist. Zudem ist der Messwert „Maximallast“ kein reiner Ausdruck des Konstrukts Kraft, sondern ein zusammengesetzter Wert, der von Technik, Koordination, Bewegungsumfang und zahlreichen situativen Faktoren abhängt. Damit ist nicht gewährleistet, dass die Abstände zwischen verschiedenen Lasten tatsächlich proportional zur Kraftleistungsfähigkeit sind. Folglich ist das für Prozentrechnungen notwendige Verhältnisskalenniveau nicht erfüllt, obwohl in der Praxis häufig so gerechnet wird. Das Vorgehen erscheint daher zwar pragmatisch, ist aber skalentheoretisch nicht gerechtfertigt.
Der 40-Sekunden-Liegestütztest kann hinsichtlich bestimmter Komponenten des Kraftleistungsvermögens als valide eingestuft werden, insbesodere für die lokale Kraftausdauer der oberen Extremitäten, da die Testperson über einen längeren Zeitraum wiederholt submaximale Kraftleistungen der Arm- und Rumpfmuskulatur erbringen muss. Diese Dauerbelastung entspricht sehr gut dem, was inhaltlich unter Kraftausdauer verstanden wird. Weniger geeignet ist der Test hingegen zur validen Erfassung der Maximalkraft, da diese durch kurze, maximal mögliche Spannungsentwicklung gegen einen hohen Widerstand definiert ist. Im Liegestütztest wird jedoch nur das eigene Körpergewicht bewegt, und der Test wird zudem in einer seriellen Wiederholungsform durchgeführt. Dadurch hängt das Ergebnis stark von der Ermüdungstoleranz, der Bewegungstechnik, der Rumpfstabilität und auch von dem Körpergewicht der Testperson ab. Diese Faktoren verfälschen den Bezug zu der eigentlichen Muskelkraft. Deshalb kann der Test zur Bestimmung der Maximalkraft „nichtvalide“ sein. Er misst nicht die höchste mögliche Kraftentwicklung, sondern das Zusammenspiel aus Technik, Körperkomposition und Ausdauerfähigkeit. Insgesamt ist der Liegestütztest also primär ein valider Indikator für die Kraftausdauer, jedoch kein geeigneter Indikator für Maximalkraft.
Die in der Abbildung dargestellten beiden Kurven beschreiben den grundlegenden Zusammenhang zwischen Kraft (force) und Leistung (power) eines Muskels in Abhängigkeit von seiner Verkürzungsgeschwindigkeit. Die durchgezogene Linie zeigt die klassische Kraft-Geschwindigkeits-Beziehung: Je höher die Verkürzungsgeschwindigkeit eines Muskels ist, desto geringer ist die Kraft, die er dabei entwickeln kann. Bei sehr langsamer oder isometrischer Kontraktion ist die Kraft am größten, während sie bei schnellen Bewegungen deutlich abnimmt. Die gestrichelte Liniestellt dagegen den Verlauf der Muskelkraft multipliziert mit der Verkürzungsgeschwindigkeit dar – also die mechanische Leistung. Diese Kurve erreicht ihr Maximum nicht bei maximaler Kraft und auch nicht bei maximaler Geschwindigkeit, sondern in einem mittleren Geschwindigkeitsbereich, in dem das Produkt aus moderater Kraft und moderater Geschwindigkeit am höchsten ist.
Für den Geltungsbereich eines Krafttests bedeutet dieser Zusammenhang, dass ein einzelner Test nur einen eng begrenzten Ausschnitt des gesamten Kraft-Leistungs-Spektrums einer Person erfassen kann. Wird beispielsweise ein isometrischer Test genutzt, misst man die maximale Kraft bei null Bewegungsgeschwindigkeit, also im Bereich der höchsten möglichen Kraft, aber fern des Leistungsmaximums. Ein Test mit hoher Bewegungsgeschwindigkeit erfasst dagegen eher Aspekte der Schnellkraft, aber nicht die maximale Kraftfähigkeit. Keine einzelne Testform kann daher alle Bereiche der Kraft-Leistungs-Kurve vollständig abbilden. Um die Validität einer Kraftdiagnostik richtig einzuordnen, muss man deshalb immer berücksichtigen, unter welchen Bewegungs- und Kontraktionsbedingungen ein Test durchgeführt wurde, da seine Aussagekraft auf den Bereich beschränkt ist, in dem die entsprechende Kurve – Kraft oder Leistung – ihren relevanten Wert hat.
Anna hat die größere Kraftausdauer. Beide erreichen zwar die gleiche Halbzeit, von 30 Sekunden, aber Kraftausdauer bedeutet, einer Belastung möglichst lange stand zu halten, bei einer möglichst geringen Ermüdung. Da Anna bis kurz vor Schluss kaum Anzeichen einer Ermüdung zeigt, fällt ihr das Halten leichter als Kim. Kim muss nämlich bereits früh maximal kämpfen, um überhaupt auf 30 Sekunden zu kommen.
Um die Validität der Conconi-Schwelle zu überprüfen, müsste man die im Conconi-Test ermittelte Schwelle mit einem wissenschaftlich anerkannten Verfahren vergleichen, das die anaerobe Schwelle zuverlässig misst. Dazu könnte man eine Stichprobe von Personen zunächst den Conconi-Test absolvieren lassen, um für jede Person den sogenannten „Deflection Point“ der Herzfrequenz-Leistungskurve zu bestimmen. Anschließend würden dieselben Personen in einem gesonderten Termin einen laborbasierten Stufentest mit Laktatmessungen durchführen, bei dem die anaerobe Schwelle anhand objektiver physiologischer Marker (z. B. Laktat-Steady-State) bestimmt wird. Diese Schwellenwerte dienen als Außenkriterium. Im nächsten Schritt würden die im Conconi-Test ermittelten Schwellenwerte statistisch mit den objektiv gemessenen Schwellen verglichen, etwa über Korrelationen oder Bland-Altman-Analysen. Zeigen sich hohe Übereinstimmungen und geringe Abweichungen, wäre die Conconi-Schwelle als valide einzustufen. Fallen die Unterschiede jedoch groß aus oder fehlt ein klarer Zusammenhang, würde dies die Zweifel an der Validität des Conconi-Verfahrens bestätigen
Die verschiedenen Teilsysteme der Ausdauerleistungsfähigkeit unterscheiden sich deutlich hinsichtlich ihres Steigerungspotenzials und der Zeit, die für Anpassungen benötigt wird. Die maximale Sauerstoffaufnahme (VO₂max)weist ein eher moderates Trainierbarkeitspotenzial auf. Bei zuvor untrainierten Personen sind Steigerungen von etwa 10–30 % üblich, also ein mäßiges Ausmaß, wobei die wesentlichen Anpassungen mittelfristig innerhalb mehrerer Wochen erfolgen. Die anaerobe Schwelle, also der prozentuale Anteil der VO₂max, der über längere Zeit aufrechterhalten werden kann, lässt sich hingegen meist stärker verbessern. Da sie vor allem von peripheren Anpassungen der Muskulatur und der Laktatverarbeitung abhängt, sind hier Steigerungen von über 30 % möglich; damit besitzt sie eine gute Trainierbarkeit, die ebenfalls vorwiegend mittelfristig über Wochen hinweg erfolgt. Die Herzgröße, insbesondere das Schlagvolumen, reagiert langsamer. Das Herz hypertrophiert durch Ausdauertraining strukturell, was ein langfristiger Prozess über Monate bis Jahre ist. Das Steigerungspotenzial ist dennoch moderat und liegt im mäßigen Bereich. Deutlich schneller reagieren die Energiespeicher, also Muskel- und Leberglykogen. Durch regelmäßiges Ausdauertraining, kombiniert mit angemessener Ernährung, können diese Speicher kurzfristig innerhalb weniger Tage bis Wochen deutlich vergrößert werden. Das Trainierbarkeitsausmaß ist hier gut, da Glykogenspeicher um mehr als 30 % wachsen können. Auch die Kapillarisierung der Arbeitsmuskulatur besitzt ein hohes Anpassungspotenzial. Durch Ausdauertraining nimmt die Kapillardichte im Muskel deutlich zu, was den Sauerstofftransport verbessert. Diese Anpassungen benötigen mittelfristig einige Wochen bis wenige Monate und liegen im Bereich starker Trainierbarkeit. Ähnlich verhält es sich mit der Kapazität der O₂-aufnehmenden, -transportierenden und -verwertenden Systeme insgesamt: Die peripheren Anpassungen in den Mitochondrien, enzymatischen Systemen und der oxidativen Stoffwechselkapazität zeigen ein gutesSteigerungspotenzial und treten mittelfristig über Wochen auf. Die psychische Ermüdungswiderstandsfähigkeit schließlich – also die Fähigkeit, trotz subjektiver Erschöpfung weiterzuleisten – ist ebenfalls trainierbar, jedoch weniger klar quantifizierbar. Das Ausmaß der Verbesserung ist typischerweise mäßig, während die benötigte Zeit stark variieren kann. Erste Fortschritte treten mittelfristig ein, eine stabile Veränderung kann jedoch auch langfristiges Training erfordern, da hier Gewöhnung an Belastung, Motivation und mentale Strategien eine große Rolle spielen
Last changed25 days ago