Was ist Schulleistung?
Leistung als schulische Forderung an den Schüler
Leistung als Tätigkeit des Schülers
Leistung als Ergebnis der Tätigkeit des Einzelnen innerhalb der verschiedenen Leistungsbereiche
Leistung als besonderer Beitrag der Schule für andere, z. B. Gesellschaft, Staat, Wirtschaft und Wissenschaft
Schulleistung:
= curricular geplante Lernvorgänge und ihre Ergebnisse
Schulleistungsmodell Bloom
Zensuren & Zeugnisse als Methode pädagogisch psychologischer Diagnostik
Funktion von Zensuren
• Auslesefunktion
• Anreizfunktion
• Berechtigungsfunktion
• Disziplinierungsfunktion
• Orientierungsfunktion
• Selbstkontrollfunktion
Varianzaufklärung bei Schülern der 4. Klassen
–> Leistung hängt nicht nur von Kognitiven Umständen ab
Was wird beurteilt?
• Leistungsbewertung im Vergleich zu den Lehrzielen des Lehrplans/ den Unterrichtszielen des Lehrers
• Notenskala ist eine Ratingskala (1-6)
• Notengebung im Schätzverfahren über einen komplexen Sachverhalt
• Lehrer = Messinstrument / Schätzinstrument
Problem: Welche Leistung wird mit welcher Note bewertet?
Wie kommt man vom Punktwert (Rohwert) zur Note?
Vorgehen (nach Schulz, 1988, bei Hauptschülern in einem Mathetest)
1. Äquidistante Punktverteilung: Erreichbare Punkte werden in 6 ungefähr
gleiche Wertebereiche eingeteilt
2. Verschärfte Bewertungsrichtlinie: für eine ausreichende Leistung (Note 4) müssen mindestens die Hälfte der Punkte erreicht werden
Genauigkeit von Lehrerurteilen
Korrelationen:
Lehrerurteil x formeller Leistungstest, r = .66 (Schwankungsbreite: .28-.92)
Testintelligenz x Lehrerurteil über Intelligenz, r = .67 (Schwankungsbreite .45-.70)
- Unabhängig von der Klassengröße
- Probleme bei der Erkennung hoher Intelligenz bei geringen Leistungen
Persönlichkeitsmerkmale (Angst, FSK, Lernmotivation) in Selbst – und Lehrerurteil, schwache Zusammenhänge
Schulstudie SALVE (Systematische Analyse des Lernverhaltens und des Verständnisses in Mathematik, 5. und 6. Klassenstufe, alle Schularten, n = 654) von Hosenfeld, Helmke, Schrader, 2002
Methode: Befragung von Schülern und Lehrern nach jeder Unterrichteinheit in Mathe
Pygmalioneffekt
Bewertung identischer Mathearbeiten in Abhängigkeit von der Vorinformation über den Schüler
Verzerrungsfaktoren bei Schätzurteilen (Problem der Objektivität und Validität)
Urteilsfehler passieren immer wieder und sind menschlich.
Schwierig ist es, wenn es systematische, wiederkehrende Urteilsfehler sind.
Urteilsfehler kann man nicht abstellen, aber deren Auftretenswahrscheinlichkeit minimieren.
Weiß (1989) kategorisiert Urteilsfehler in
• Referenzfehler
• Korrelationsfehler
• Interaktionsfehler
Referenzfehler
–> entstehen, wenn sich Beurteiler unangemessen auf unterschiedliche Bezugsgruppen/ Bezugsnormen beziehen.
Milde-/Strenge-Fehler: Der Lehrer beurteilt generell zu positiv bzw. zu negativ.
Fehler der zentralen Tendenz / Extremurteile: Die Lehrkraft beurteilt alle gleich
(alle 2-3) bzw. extrem (nur 1-2 & 5-6).
Reihungseffekte: Durch Ermüdung bei längerer Korrektur kommt es später eher zu Pauschalurteilen
Rhythmische Schwankung: Bei der Korrektur und mehrfacher identischer Notenvergabe neigt man dazu, bei der nächsten Arbeit eine andere Note vergeben zu wollen.
Bezugsgruppenfehler: Neigung, in einer Klasse das gesamte Notenspektrum zu vergeben, selbst wenn alle Schüler sehr gut oder sehr schlecht sind (insbes. bei soz Bezugsnorm)
Referenzfehler verhindern
–> Bezugswerte & -normen vor der Prüfungserstellung festsetzen: was gibt einen Punkt, wie viele Punkte ergeben eine 1, 2 , 3 etc. (sachliche Bezugsnorm).
verringert: alle Referenzfehler
–> Identische Notenbereiche festlegen: Bsp. 100%; Intervall 12,5%:
verringert: Mathematische Fehler; Milde-/Strenge-Fehler; Fehler der zentralen Tendenz / Extremurteile;
Bei der Korrektur...
(a) Pausen machen,
(b) erst die Punkte vergeben, und danach Punkte zur Note zusammenzählen
(c) anonyme Korrektor (Schülername verdeckt) und
(d) Zweitkorrektur in zufälliger Reihenfolge.
(e) Erst Frage 1 bei allen korrigieren, dann mischen, dann Frage 2 ...
verringert: Reihungseffekte, rhythmische Schwankung
Korrelationsfehler
–>wenn Zusammenhänge bei Merkmalen angenommen werden, die nicht bestehen.
Halo-Effekt: Leistungsbewertungen in einem Fache beeinflussen die Noten in einem anderen Fach.
Logische Fehler (Variation Halo-Effekt): Wesenszüge eines Schülers werden ungerechtfertigt mit Leistungen verknüpft.
Implizite Persönlichkeitstheorie: Persönlichkeitsmerkmale eines Schülers werden mit der angenommenen Leistungsfähigkeit verknüpft
Korrelationsfehler vermeiden
Sensibilisierung für die eigene Fehleranfälligkeit durch Vorurteile & eigene Vorlieben
Trennung von Fächern sowie der unterschiedlichen Benotungen
Interaktionsfehler
–> ergeben sich durch die unmittelbare Beziehung zwischen Beurteiler und Beurteiltem. Besonderheiten der Person verhindern hier ein objektives Urteil.
Primacy /Receny: erste und letzte Prüflinge / Antworten werden besonders gut erinnert.
Konstanzeffekte: trotz Leistungsänderungen bekommt der Schüler dieselbe Note („Klebe-Effekt“).
Einstellungsfehler: Projektion eigener Einstellungen und Wünsche auf den Schüler; objektive Leistung tritt in den Hintergrund.
Soziale Wahrnehmung: Urteilsfehler durch Erwartungen; Fehler von schlechten Schülern werden eher gesehen
Selbsterfüllende Prophezeiung: Die Annahmen des Lehrers über den Schüler bedingen seine künftige Leistung
Interaktionsfehler vermeiden
Zwischendrin Leistung messen und Noten schriftlich festhalten (nach jeder Stunde die besten Wortmeldungen in der Schülerliste ankreuzen)=> verringert Fehler Erstem- / letztem Eindruck; Klebeeffekt
Anonyme Korrektur der Klausuren => verringert: Fehler der sozialen Wahrnehmung
Schlechte Leistung als veränderbar ansehen => verringert Selbsterfüllende Prophezeiungen
Zurückstellung der Bedeutung eigener Meinungen => verringert: Einstellungsfehler
Objektivität von Lehrerurteilen
(schriftliche informelle Tests)
Forschungsbefunde:
traditionelle schriftliche Prüfungsarbeiten entsprechen nicht den Gütekriterien sozialwissenschaftlicher Forschung
geringe Durchführungsobjektivität
geringe Auswertungsobjektivität
geringe Interpretationsobjektivität
Die Durchführungsobjektivität
–> Alle Schüler bearbeiten die Klassenarbeit unter vergleichbaren Bedingungen
Mögliche Fehlerquellen:
Lehrer liest das Diktat bei Nachschreibern schneller vor als bei der offiziellen Klassenarbeit.
Lehrer gibt dem Schüler A nähere Erklärungen zur Aufgabe, nicht aber dem Schüler B.
In Deutsch dürfen die Schüler Aufsätze aus verschiedenen, (unterschiedlich schwierigen) Themen auswählen.
Bei mündlichen Prüfungen werden ganz unterschiedliche Lerngebiete erfragt (eigentlich auch ein Validitätsproblem)
Die Auswertungsobjektivität
–> Das Ergebnis der Klassenarbeit ist unabhängig davon, wer die Klassenarbeit benotet. (Intersubjektivität)
Vorinformationen (Leistung, sozialer Hintergrund)
Länge der Textproduktion
grammatikalische und orthografische Fehler (selbst, wenn nur Inhalt zu beurteilen war)
Handschrift
Beliebtheit der Schüler
Fazit:
Lehrer urteilen nach verschiedenen Strengeniveaus
Lehrer schöpfen die Notenskala unterschiedlich aus
Lehrer unterscheiden sich in der Differenziertheit der Notengebung. Manche beurteilen einen Schüler in allen Fächern ähnlich.
Lehrer benutzen unterschiedliche Kriterien bei der Notengebung
Maßnahmen zur Verbesserung der Objektivität
Erstellung von Kriterienkatalogen
Noten sollten auf viele Leistungsüberprüfungen aufbauen
Möglichst viele Lehrer sollten die Arbeit benoten
Ergänzung der Zensurengebung durch Schulleistungstests
Validität: Sympathie (schriftliche Prüfungsarbeiten)
–>Studie (Hadley, 1954; Ingenkamp, 1973)
Datenerhebung bei 620 Schülern: Schulleistungstests(Lesen, Sprache, Rechtschreibung, Arithmetik), Sympathie von Lehrer für Schüler, Schulnoten.
–> Ergebnisse:
Sympathie x Schulnoten: r = .08 – r = .92 (je nach Lehrer)
Testleistung x Schulnoten: r = .02 – r = .94
Gruppe beliebteste Schüler: 50% der Schüler = bessere Noten als Testleistung, 16% = der Schüler schlechtere Noten als Testleistung
Gruppe unbeliebteste Schüler: 50% der Schüler = schlechtere Noten als Testleistung, 19% der Schüler bessere Noten als Testleistung
Noten x Testleistung: Lehrer: r = .78 bei Schülern, r = .57 bei Schülerinnen Lehrerinnen: r = 59 bei Schülern, r = .48 bei Schülerinnen
Validität: Geschlechtseffekte (schriftliche Prüfungsarbeiten)
–>Einfluss von Geschlecht des Lehrers und des Schülers
Studie: Leistungsbewertung in Mathe (Punkte: 0-100)
–> Weitere Egebnisse (Teichmann, 1978)
Mädchen werden besser benotet (außer in Sport, Chemie, Physik)
Besonders deutlich in Klassen 5 – 8
Größte Unterschiede in Sprachlichen Fächern
Keine Unterschiede mehr in weiterführenden Examen
Validität: Prognostische Validität von Noten
–> 1971 waren 81% der Lehrer überzeugt gültige Prognosen machen zu können, heute: 20%
–> Versagerquote Gymnasium: 7-32% bei den unbedingt geeigneten
Erfolgsquote: 17 – 54% bei den sicher nicht geeigneten.
Zusammenhänge zw. Grundschulnoten und Erfolg am Gymnasium
–> Die Prognosefähigkeit der Abiturdurchschnittsnote für den Studienerfolg
schwankt für einzelne Studienfächer (z.B. Psychologie, Mathematik) nur geringfügig um den durchschnittlichen Wert von r=.46.
ist höher als die jedes einzelnen Schulfaches
gilt in gleichem Maße für Vorexamen wie Hauptexamen.
Hauptschul- bzw. Realschulabschluss beträgt r=.41
Maßnahmen & Konsequenzen: Güte schriftlicher Prüfungen
Verbesserung der Objektivität
Objektgemäßheit: Objektivität kann durch das Vermeiden von Willkür gewährleistet werden.
Außerdem: Beobachtertrainings, Kriterienkataloge, Durchführungsanweisungen.
Aber: Das Bemühen um Objektivität macht den Unterricht weniger flexibel und schränkt den pädagogischen Freiraum des Lehrers ein (z.B.gleiche Prüfungen in Parallelklassen).
Verbesserung der Reliabilität
Angemessenes Anzahl von Aufgaben, Prüfungen sind umso weniger reliabel, je weniger Aufgaben sie umfassen.
Besonders mündliche Prüfungen und Stegreifaufgaben (das Aufrufen an die Tafel oder Ausfragen) sind wenig reliabel und sollten für wichtige Entscheidungen nicht allzu zu stark gewichtet werden.
"Wenn Messfehler nicht zu vermeiden und nicht zu verringern sind, dann kommt es darauf an, sie wenigstens zu kennen, um von den Messergebnissen vernünftigen Gebrauch zu machen."
Verbesserung der Validität:
In nichtsprachlichen Fächern die Anforderungen an die Sprachkompetenz bewusst gering halten und sprachliche Leistung auf keinen Fall mitbewerten.
Prüfungs- und Aufgabenformen systematisch variieren mit engem Bezug auf den vorangegangenen und den nachfolgenden Unterricht prüfen.
Prüfungen möglichst angstfrei gestalten mindestens gelegentlich Schulleistungstests zur Kontrolle einsetzen.
Eine allein am Leistungsstand der jeweiligen Klasse orientierte Beurteilung vermeiden
Sich mögliche Störfaktoren und verzerrende Effekte immer wieder nachdrücklich vergegenwärtigen
Last changed2 years ago