Zwischen welchen 2 Formen der Leistungserhubung kann man grundlegend unterscheiden?
Formatives Lernen:
Beim formativen Testen verschafft sich die Lehrkraft regelmäßig einen Überblick über die Lernfortschritte der Klasse. Die Erkenntnisse haben einen wesentlichen Einfluss auf die weitere Unterrichtsplanung und -gestaltung.
Summatives Lernen:
Beim summativen Testen wird ein abschließendes Urteil über die Summe der erworbenen Kenntnisse und Fähigkeiten der Schüler gefällt. Es wird quasi Bilanz gezogen.
Was versteht man unter diagnostischer Kompetenz?
Als diagnostische Kompetenz wird die Fähigkeit von Lehrkräften bezeichnet, Diagnoseleistungen unter Berücksichtigung bestimmter Güte- und Qualitätskriterien zu erbringen.
Zur diagnostischen Kompetenz einer Lehrkraft zählt demnach zum einen, wie gut sie Schülermerkmale beurteilen oder vorhersagen kann, aber auch, wie gut sie in der Lage ist, Aufgaben bzw. Tests passend zum Unterricht und den Lernzielen zu konzipieren
Welche Beurteilungsfehler gibt es?
Fundamentaler Attributionsfehler
Das Verhalten und Erleben einer Person wird auf deren Persönlichkeitsmerkmale zurückgeführt, während mögliche situationsspezifische Ursachen vernachlässigt werden.
Ein Schüler, der wiederholt zu spät zum Unterricht erscheint, wird von der Lehrkraft als disziplinlos beurteilt. Andere Gründe (z. B. die Eltern sind unorganisiert und bringen ihr Kind zu spät zur Schule) werden in der Beurteilung nicht berücksichtigt.
Halo-Effekt
Ein zentrales (charakteristisches) Merkmal einer Person „überstrahlt“ die Gesamtbewertung dieser Person.
Eine hübsche Schülerin, die stets gut gekleidet ist, wird von der Lehrkraft als fleißig, diszipliniert und intelligent bewertet.
Konsistenz-Effekt
Ausgehend von bisherigen Erfahrungen mit einer Person werden konsistente Informationen (Informationen, die mit den bisherigen Erfahrungen übereinstimmen) stärker berücksichtigt als inkonsistente.
Ein Schüler, der den Unterricht bereits einige Male gestört hat, wird vom Lehrer als Störenfried bewertet. Dabei „übersieht“ die Lehrkraft, dass der Schüler oft auch schon unauffällig am Unterrichtsgeschehen teilgenommen hat.
Reihenfolgeneffekte
Im Gesamturteil über die Leistung einer Person wird sich vor allem an den zuerst beobachteten (Primacy-Effekt) oder den zuletzt beobachteten (Recency-Effekt) Eigenschaften orientiert.
Bei der Beurteilung, ob ein Kind das Gymnasium als weiterführende Schule besuchen soll, orientiert sich eine Lehrkraft an den positiven Eindrücken, die der Schüler in den ersten beiden Klassen hinterlassen hat. Dass dieser Schüler leistungsmäßig zuletzt deutlich abgebaut hat, wird im Gesamturteil nicht berücksichtigt (Primacy-Effekt).
Rosenthal-Effekt
Der Rosenthal-Effekt beschreibt das Phänomen, wonach die Erwartungen, die an eine Person gerichtet sind, nachhaltig deren Verhalten beeinflussen und sich diese Person entsprechend der Erwartungen verhält.
So konnte beispielsweise gezeigt werden, dass, wenn eine Lehrkraft die Information erhält, dass der Vater eines zu beurteilenden Schülers Redakteur einer großen Tageszeitung ist oder ein Schüler vermutlich über einen hohen Leistungsstand verfügt, ein geschriebener Aufsatz besser benotet wird als der eines durchschnittlichen Schülers
Welchen Gütekriterien sollte die Beurteilung von Schülern unterliegen?
Die Gütekriterien geben die Qualität eines wissenschaftlichen Instruments/Verfahrens an. Zu den Hauptgütekriterien zählen Objektivität, Reliabilität und Validität.
Objektivität: Unter Objektivität versteht man, dass die Durchführung, Auswertung und Interpretation einer schulischen Leistung oder eines Schülermerkmals unabhängig von der Person des Beurteilers ist. Beispiel für eine hohe Objektivität: Mehrere Lehrer beurteilen unabhängig voneinander einen Schüleraufsatz und kommen zu einem vergleichbaren Ergebnis (z. B. dieselbe Note).
Reliabilität: Die Reliabilität beschreibt die Zuverlässigkeit (oder Genauigkeit) eines Tests. Sehr häufig wird hierbei die Urteilskonstanz als Indikator herangezogen. Beispiel für eine hohe Reliabilität: Ein und derselbe Test wird bei einem Schüler erneut durchgeführt (ohne dass der Schüler zwischenzeitlich gelernt hat) und kommt zu einem vergleichbaren Ergebnis.
Validität: Die Validität beschreibt die Gültigkeit eines Tests (Misst der Test, was er zu messen vorgibt?). Während ein Thermometer ein valides Instrument zur Messung der Raumtemperatur darstellt, ist es gänzlich ungeeignet, die Raumlänge zu bestimmen. Beispiel für hohe Validität: Ein Mathetest beinhaltet lediglich Matheaufgaben, jedoch keine Fragen zum Allgemeinwissen der Schüler (z. B.: Wie viele Bundesländer hat Deutschland?). Vor allem die Gewährleistung der Validität stellt ein großes Problem im schulischen Kontext dar. So haben beispielsweise Schüler mit einer Lese-Rechtschreib-Störung auch mit Textaufgaben im Fach Mathematik Schwierigkeiten, sodass das Ergebnis des Mathetests keine eindeutigen Rückschlüsse auf die Rechenfähigkeiten des Schülers erlaubt und damit nicht valide ist.
Welche Mängel zeigen empirische Befunde bzgl der diagnostischen Kompetenz von Lehrkräften?
Die Urteilsübereinstimmung von Lehrkräften ist auch bei objektiv vergleichbaren Leistungen mitunter gering (Lintorf/Behrmann/Ophuysen 2016, S. 191). Befunde liegen u. a. bei der Beurteilung von Aufsätzen (in der Regel ohnehin schwer zu beurteilen) vor (bei ein und demselben Aufsatz ergaben sich Unterschiede um bis zu vier Noten). Ähnliche Ergebnisse zeigten sich erstaunlicherweise auch in Mathematik
Ein und derselbe Lehrer tendiert dazu, eine Arbeit bei wiederholter Durchsicht ungleich zu bewerten
Auch der Vergleich von Lehrereinschätzungen zu Schülermerkmalen mit (standardisierten) Leistungstests zeigte nur eine mäßige Urteilsgüte
Inwiefern unterscheiden sich standardisierte und unstandardisierte Tests voneinander?
Standardisierte Tests
Unstandardisierte Tests
… werden von Wissenschaftlern erstellt.
… werden von Lehrkräften erstellt.
… sind normiert, d. h., sie erlauben einen relativ objektiven Vergleich mit Gleichaltrigen.
… sind nicht normiert, können aber den individuellen Lernstand eines Schülers wiedergeben.
… erfüllen wissenschaftliche Gütekriterien.
… erfüllen in der Regel keine Gütekriterien.
… erfassen umfangreichen Lernstoff (Wissen, welches von Schülern einer bestimmten Altersklasse vorausgesetzt werden kann).
… erfassen direkt den Lernstoff, der im Unterricht vermittelt wurde.
Was sind Beispiele für standardisierte Schulleistungstests?
Beispiele für standardisierte Schulleistungstests sind
die Hamburger Schreibprobe (HSP 1-10),
der Lese- und Rechtschreibtest (SLRT-II),
der Deutsche Mathematiktest (DEMAT) sowie
das Screening zum Erfassen der Lernvoraussetzungen für Klasse 1 (Schulstarter)
Welche 2 Aufgabenformate lassen sich unterscheiden?
Gebundenes Aufgabenformat:
Zu Aufgaben mit gebundenem Antwortformat zählen Mehrfachwahlantworten (sogenannte Multiple-Choice-Aufgaben), die aus einer Frage sowie zwei oder mehreren Antwortalternativen bestehen, sowie Zuordnungsaufgaben, bei denen zusammengehörige Begriffe, Formeln oder Ähnliches gefunden werden müssen
Aufgaben mit gebundenem Antwortformat sind leicht zu bewerten, objektiv und ökonomisch und erfreuen sich deshalb großer Beliebtheit
Ungebundenes Aufgabenformat:
Beispiele für Aufgaben mit ungebundenem Antwortformat, bei denen die Antwortmöglichkeiten nicht eingegrenzt sind und die sich vor allem für komplexe Fragestellungen und Aufgaben eignen, sind Aufsätze und Lückentexte
Welche 3 Richtlinien sollte man beim Aufstellen ungebundener Aufzaben berücksichtigen?
klare und genaue Formulierung der Aufgabe (die Aufgabe enthält diejenigen Elemente, die in der Antwort behandelt werden sollen).Beispiel: „Nennen Sie vier Ziele der Pädagogischen Psychologie und leiten Sie für jedes Ziel einen konkreten Nutzen für Lehrkräfte ab“ anstatt „Warum ist die Pädagogische Psychologie für Lehrkräfte wichtig?“
Die Frage beinhaltet eine konkrete Aussage zur Ausführlichkeit der zu erwartenden Antwort (Anzahl Beispiele; gezielte Verwendung von Operatoren wie Nennen, Erklären, Erörtern …).Beispiel: „Nennen Sie vier Ziele der Pädagogischen Psychologie“ anstatt „Was sind die Ziele der Pädagogischen Psychologie?“
Für die Auswertung wird ein Erwartungshorizont (Musterantworten) erstellt, indem die Kriterien für die Punktevergabe eindeutig festlegt ist.Beispiel: Die vier Ziele lauten Beschreiben, Erklären, Vorhersagen und Verändern (für jeden genannten Begriff jeweils 1 Punkt) des Verhaltens und Erlebens (für jeden Begriff jeweils 1 Punkt) in pädagogischen Situationen (1 Punkt). Insgesamt 7 Punkte.
Was versteht man unter der alltagsnahen Verfassung?
Eine weitere Form der Leistungserhebung ist die alltagsnahe Leistungserfassung. Hierbei wird von Schülern die Umsetzung des erlernten Wissens bzw. der erlernten Fähigkeiten in konkreten Alltagssituationen (Herstellung oder Demonstration eines Produkts, Rollenspiele, Vorträge usw.) verlangt.
Welche 3 Funktionen erfüllt die Notengebung?
Selektionsfunktion: Sie ermöglicht die Auswahl von besonders guten oder schlechten Schülern mit dem Ziel der Zuordnung zu einer Schulform, zur Beurteilung der Schul- und Berufseignung, aber auch bezüglich der Zulassung für ein Studium.
Informationsfunktion: Sie gibt Rückmeldungen an Schüler, deren Eltern und auch an Lehrkräfte über die Lernergebnisse bzw. das Erreichen oder Nichterreichen von Lernzielen.
Anreiz- und Sanktionsfunktion: Sie soll Schüler motivieren, indem sie eine Belohnung für gute Leistungen und einen Ansporn für schlechte Leistungen darstellt.
Auf welche 2 Arten kann die Bewertung von Schülerleistungen erfolgen?
Normorientierte Bewertung:
Bei einer normorientierten Bewertung wird die Leistung eines Schülers mit der Leistung einer Normgruppe verglichen (z. B. Schulklasse, Schulbezirk, Bundesland, Land usw.)
Die Note entspricht folglich einem Rangplatz, den der Schüler im Vergleich zu den anderen einnimmt
Problematisch ist hierbei, dass ein Schüler trotz intensiver Lernbemühungen eine schlechte Note erhalten kann, nämlich dann, wenn alle anderen Schüler auch gut oder sogar besser gelernt haben
Eine normorientierte Bewertung erfolgt beispielsweise im Rahmen von Schulleistungsvergleichen (z. B.: Welches Bundesland erzielt die besten Ergebnisse? Welchen Platz belegt Deutschland in der PISA-Studie?)
Kriteriumsbasierte Bewertung:
Bei einer kriteriumsbezogenen Bewertung wird das Testergebnis mit einem zuvor festgelegten Kriterium verglichen und die Note entsprechend des Erreichens oder Nichterreichens eines vorgegebenen Lernziels vergeben
Beispiele finden sich u. a. in der theoretischen Führerscheinprüfung, in der man zum erfolgreichen Bestehen nicht mehr als zehn Fehlerpunkte sammeln darf oder in einer Klausur im Studium, bei der man mindestens 50 % der möglichen Punkte erreichen muss, um das Modul zu bestehen
Im deutschen Schulsystem wird in aller Regel kriteriumsbezogen benotet
Als problematisch zu betrachten ist jedoch, dass Standards mitunter willkürlich festgelegt werden
Wenn beispielsweise ein Chirurg während seines Studiums in einer wichtigen Prüfung exakt 50 % der möglichen Punkte erhalten hat, könnte dies als bestanden bewertet werden
Aber wer würde sich bei diesem Arzt ohne Sorgen unter das Messer legen?
Welche 3 Prinzipien sollten Lehrer bei der Nitengabe berücksichtigen?
die Bewertung „explizit“ machen: Die Schüler werden darüber informiert, wie bewertet und benotet wurde, nach welchem Maßstab und was von ihnen erwartet wurde.
Fairness und Gerechtigkeit: Die Bewertung sollte sich an dem orientieren, was im Unterricht gelehrt wurde. Weitere Variablen, wie bisherige Leistungen, der soziale Status oder das Geschlecht, sollten unberücksichtigt bleiben. Dies kann beispielsweise durch eine anonymisierte Bewertung sichergestellt werden.
Einfluss der Note auf den Schüler berücksichtigen: Welche Folgen hat die Bewertung für den Schüler bzw. für die Klasse? Demotiviert die Note den Schüler eventuell? Entsteht innerhalb der Klasse ein Wettstreit?
Zuletzt geändertvor einem Jahr