Arten mündlicher Prüfungen
Jäger 2000
Kritik an mündlicher Prüfung - Sozialpsychologischer Aspekt
Prüfungssituation = asymmetrische Sozialsituation, die einen definieren die Prüfungsnorm, die anderen haben sich anzupassen (Lautmann, 1977)
Kritik - Psychoanalytischer Aspekt
Mündliche Prüfung stark angstbesetzt
Gütekriterien - Kritik an mündl. Prüfungen
Objektivität
Nicht sichergestellt, dass alle Prüflinge dieselben Bedingungen haben
Durchführungsobjektivität:
Mangelhaft: nicht dieselben Fragen; unterschiedl. Zeitpunkte
Auswertungsobjektivität:
Unzureichend: situativ; Kriterien für richtig/falsch oft vage definiert
Interpretationsobjektivität:
Großes Ausmaß an Nicht-Übereinstimmung (Objektivitätskoeffizienten zw. .40 und .80, Häufig bei .60)
Reliabilität
Wiederholungsreliabilität
Prüfer prüft nach einiger Zeit erneut; kaum Untersuchungen vorhanden (Koeffizient etwas höher als bei Paralleltests)
in der Schule nicht vorgesehen
grundsätzliches Problem bei Leistungsbeurteilung: Prüfer ist zugleich Messinstrument
Messinstrument ist nicht stabil
Paralleltestreliabilität
Prüfen durch 2 Prüfer hintereinander bzw. zeitgleich; Äquivalenzkoeffizient zwischen .00 und .60, Häufig bei .45
Birkel & Pritz (1980): Streuung von Note 1 bis 5 unter allen Bedingungen —> Beurteilung durch Zweitprüfer; in der Regel nur bei Abschlussprüfungen vorgesehen
Validität
Inhaltsvalidität:
Beeinträchtigt durch situativen Charakter
Fragen nicht repräsentativ
keine Staffelung nach Schwierigkeit
aber: i.d.R curriculare Validität/Lerngelegenheit berücksichtigt
empirische Validität:
Übereinstimmung zw. mündl. und schriftl. Prüfungen nur .30
Zusammenhänge mit Dozentengutachten u.Ä. mäßig
Konstruktvalidität:
Durch Interaktionseffekte beeinträchtigt (Siehe Studien: 2 Videos einer mündl. Prüfung wurden 150 Lehrern gezeigt)
Schriftliche Prüfungen - Vorteile
Schulaufgaben sind i.d.R standardisiert
Beurteiler müssen Entscheidung nicht sofort treffen —> in Ruhe mit seinem Maßstab vergleichen
weil viele oder nur wenige SuS eine Aufgabe/Frage lösen, erhält der Lehrer eine Vorstellung von Schwierigkeitsgrad der Aufgabe
Für Zuverlässigkeit der Prüfung ist Anzahl der gestellten Aufgaben wichtig—> schriftl. Prüfungen enthalten mehr Aufgaben
Leistungsfremde Faktoren (Aussehen…) spielen bei schriftl. Prüfungen keine Rolle
Blockierungen durch Ängste können bei schriftl. Prüfungen leichter überwunden werden
Schriftl. Prüfungen sind i.d.R besser strukturiert
Grundlagen und Ergebnisse der schirftl. Prüfungen sind öffentlich, d.h. sie können mit den Betroffenen nachbesprochen werden
Formen schriftlicher Prüfungen
Heller & Nickel 1978
Aufsatz
Nachteile: mangelnde Auswertungs- und Interpretationsobjektivität, Reliabilitätskoeffizienten um .5, Vielfalt der Bewertungsmaßstäbe beeinträchtigt Validität
Freie Hausarbeit
Vorteile: differenzierte Erfassung produktiver Denkleistungen, umfassendere Rückmeldung der Prüfer und Prüflinge, intrinsische Motivation
Nachteile: größerer Zeitaufwand bei Korrektur, geringere Objektivität (—> Beeinträchtigung der Reliabilität u. Validität)
Klassenarbeiten
Nachteile: meist klasseninternes Bezugssystem zur Beurteilung, mangelnde Objektivität u. Validität, Kriterien oft nicht im Voraus festgelegt
Erfüllung der Gütekriterien bei schriftlichen Prüfungen
Durchführungsobjektivität
relativ günstig a.g des Gruppenbezugs und des transsituativen Charakters
besser als bei mündl. Prüfungen, schlechter als bei Tests (Standardisierung fehlt)
Auswertungsobjektivität
z.T. mangelhaft
—> Williams (1933): Mathematikaufgabe sollte von Lehrkräften mit 0 bis 100 Punkten beurteilt werden; Beurteilung schwankt zw. 16 und 96 Punkten
—> Starch & Elliot (1913): Abschlussarbeit in Mathematik sollte von ca. 130 Schulen mit 0 bis 100 Punkten bewertet werden; Streuung von 25 bis 89 Punkten bei Gesamtbewertung, ähnlich starke Schwankungen bei einzelnen Aufgaben
Interpretationsobjektivität
beeinträchtigt
—> Starch & Elliot (1913): Bestehensgrenze variiert von Schule zu Schule zw. 70 bis 80 Punkten, Objektivitätskoeffizient zw. .5 und .7 (Ingenkamp)
Bewertung ist unzureichend stabil
—> Hartog & Rhodes (1936): 15 Prüfungsarbeiten aus dem Fach Geschichte wurden von 15 Prüfern bewertet; nach 12 bis 19 Monaten wurde die Beurteilung wiederholt
—> Bewertung wurde in fast 50% der Fälle geändert
Paralleltest-Reliabilität
Beurteilung schwankt mit dem Prüfer
—> Starch & Elliot (1913): Streuung von 25 bis 89 Punkten bei Gesamtbewertung, ähnlich starke Schwankungen bei einzelnen Aufgaben
Inhaltsvalidität
curriculare Validität und Lerngelegenheit i.d.R. berücksichtigt
besser als bei mündlichen Prüfungen a.G. des transsituativen Charakters, schlechter als bei Tests
Konstruktvalidität
Beurteilung wird durch verschiedene sachfremde Faktoren beeinflusst z.B durch Sympathie
—> Hadley (1954): beliebte Schüler erhielten im Vergleich zu Unbeliebten in den Testergebnissen zu 50% bessere Noten, als angemessen wäre und umgekehrt
Empirische Validität
Empfehlungen der Grundschullehrer bestätigen sich zu 60% —> Sommer (1983)
relativ hohe Korrelation zw. Noten in der 4. Klasse und am Gymnasium —> Roederer (1997)
Vor- und Nachteile schirftl. Prüfungen in Abgrenzung von Schulleistungstests
Mündliche vs. schriftliche Prüfungen
Last changed2 years ago