Betriebliche Praxis/ Aspekte der Leistungsbeurteilung
Betriebliche Praxis
individuelle Leistung von Mitarbeitern wird beurteilt
Beurteilung erfolgt systematisch/standardisiert (z.B. einmal jährlich)
auf der Basis von Beobachtungen im Berufsalltag (kein freier Eindruck; Vorgaben -> dadurch standardisiert)
in der Regel durch den Vorgesetzten
in vorgegebenen Zeitabständen (z.B. jährlich)
Ergebnis geht in die Personalakte ein
Leistungsbeurteilungsgespräch
zu unterscheiden von Mitarbeiterbeurteilung
-> erbrachte Leistung stellt dabei nur eine Facette der Mitarbeiterbeurteilung dar
-> Person mit ihren Qualifikationen, Fachwissen, berufliche Erafhrung, Zusammenarbeit ziwschen Mitarbeiter und vorgesetzten usw. steht im Vordergund
typische Leistung am Arbeitsplatz und nicht maximale wie bei Leistungstests sonst üblich
Funktionen von Leistungsbeurteilungen
Ziele die mit Leistungsbeurteilungen verfolgt werden:
Interpersonaler Vergleich = Vergleich zwischen Personen
Lohnbestimmung
Für Leistung gezahlt wird (dafür muss sie festgestellt werden, auch bei Beförderung)
Herausfinden z.B. wer zu den schlechtesten 5% der Firma gehört
Intrapersonaler Vergleich
innerhalb der Person Veränderungen (Leistungssteigerung/Entwicklung)
Leistungsbeurteilungen zur Motivierung und individuellen Leistungsverbesserung (Das Erkennen der eigenen Fortschritte kann dabei eine sehr motivierende Wirkung haben)
Führungskräfte Nachwuchs -> Leistungsbeurteilungen nutzen um zu sehen wie sich diejenigen mit Potential weiterentwickeln und was es noch braucht um Potential vollständig auszuschöpfen
Leistungsbeurteilungen sind immer eine Art Intervention
In der beurteilten Person bewirkt es etwas
Funktionen können sich widersprechen (roter Blitz)
-> Wirkungen können sich aufheben
-> Bsp.: möchte gutes Feedback und gelichzeitig Gehaltserhöhung
-> präsentiere mich im besten Licht um mehr Geld zu bekommen; kein ehrliches Feedback mehr (über Schwächen usw.)
Ebenen von Beurteilungen
Ebenen von Beurteilungen trennen um Widersprüche/ Probleme damit zu beheben
1. Tägliches Feedback:
Für intrapersonalen Vgl. tägliche Feedback relevant; sollte verhaltensnah und zeitlich kontingent gegeben werden (konkrete Situation/ aktueller Konflikt -> Gespräch nicht erst nach 6 Monate später nach Konflikt)
2. Regelbeurteilung:
mind. 1x/Jahr
sollte typische Leistung des Mitarbeiters verhaltens- und ergebnisorientiert erfassen
Regelbeurteilung -> Gehaltbestimmung, Beförderung
3. Potentialbeurteilung:
individuelle Eignung einer Person für die Anforderung zukünftiger Stellen/Laufbahnen ermitteln
zukunftsbezug -> Potentialbeurteilung muss in nachfolgenden Regelbeurteilungen kontinuierlich überprüft werden
Leistung - Definition
Buch:
Leistung im Sinne einer Bewertung der Arbeitsergebnisse (häufig auch als Effektivität bezeichnet) umfasst die Beiträge des Mitarbeiters zur Erreichung der Ziele der Organisation. Leistungsverhalten ist demnach das Mittel, um Leistung zu erzielen.
Beitrag offen (Umsatz, gewinn, Aufrechterhaltung von Ordnung usw.)
Leistungsergebnisse
= Gesamtheit der Ergebnisse des Tätigseins einer Person im Beurteilungszeitraum bewertet aus Sicht der Organisation (Maßstab)
Produktivität (Effektivität und Effizienz)
Zufriedenheit von Leistungsempfängern (interne und externe Kunden)
Rechtliche und leumundliche Beanstandungsfreiheit der Organisation
-> Einhalten von Gesetzen (z.B. Steuer-und Zollgesetze) und sozialen Erwartungen (z.B. Entsorgung von Müll)
Schäden (Kontraproduktivität)
-> Schädigung von Organisationsmitgliedern (z.B. Mobbing, sex. Belästigung -> Verhalten)
-> Schädigung der Organisation (z.B. Diebstahl, Sabotage, Unfälle, Störfälle -> Produktivität wird geringer)
Ergänzungen.
Leistungsergebnisse sind nicht direkt mit Verhalten verknüpft
-> Produktivität: wenn ich Umsatz betrachte, geht es darum wie viel Geld in Kasse liegt (Produktivitätskennzahlen: wie viele Fliesen an Wand sind z.B.)
Entstehungsbedingungen von Leistungsergebnissen
Leistungsverhalten führen zu den Ergebnissen und werden von 3 Faktoren beeinflusst
Grund für Trennung von Leistungsverhalten- und Ergebnissen:
Können V besser einer Person zuordnen als beim Ergebnis
Ergebnis = stärker von Situation bestimmt (Marktfaktoren relevant)
Sind in Team nicht allein verantwortlich für Leistungsergebnis
Drei Komponeten beruflicher Leistung
Kernleistung (task performance):
Kernaufgaben sind solche, die den fachlichen Teil ausmachen, die oftmals formal festgelegt sind und von Vorgesetzten beachtet, kommentiert und bewertet werden.
Kontextuelle Leistung (contextual performance):
Verhalten, das durch seine positiven Effekte auf das psychologische, soziale und organisationale Umfeld zur organisationalen Effektivität beiträgt.
Meist synonym: Organizational Citizienship Behavior( OCB)
Dimensionen u.a.: Hilfeverhalten, Sportlichkeit, Compliance, Loyalität
-> Sportlichkeit: tolerieren (Fehler von anderen z.B.)
-> Compliance: als Vorbild fungieren, Regeln einhalten (z.B. Corona Maske -> Produktivität kann aufrechterhalten werden)
Kontraproduktivität:
Verhaltensweisen, die der Organisation schaden, und entweder gegen einzelne Personen (z.B. Streitsüchtigkeit, Kollegen bestehlen) oder die Organisation insgesamt (z.B. Drogenmissbrauch, Fehlzeiten, Diebstahl von Eigentum des Unternehmens) gerichtet sind.
Solche Verhaltensweisen haben oft eine geringe Verbreitung, werden aber auch nicht immer entdeckt.
-> bildet negative Dimension von Leistung ab
Bsp.: Automechnaiker
Zu Kernleistung: Einbau von Ersatzteilen, Fehlerdiagnose usw.
Kontextuelle Leistung: Pflegliche Umgang mit ´Werkzeut/ Machinen, Sparsamer Umgang mit Ressourcen (z.B. Öl), Helfemn von Kollegin wenn diese nicht weiterkommen
Kontraproduktivität: zu spät, betrunken kommen, Ersatzteile klauen etc.
Weiteres Modell: Leistungsdimensionen
-> Gesamtleistung ergibt sich aus der Summe der Leistungen auf den einzelnen Dimensionen
Tätigkeitsspezifische Tüchtigkeit
Kompetente Verrichtung der Kerntätigkeit = der technsichen Abläufe und Erfüllung der Kernaufgaben einer spezifischen Tätigkeit in einer Organisation
Disziplin
verlässige Einhaltung organisationaler Regeln und Vorgaben, kein Drogenmissbrauch am Arbeitsplatz, kein unerlaubtes Fehlen
Leistungsmessung
Abbildung:
aktuelle Kriterium (1) = erfasst nur einen kleinen Ausschnitt des tatsächlichen Kriteriums
tatsächliche Kriterium (2) = Konzeptuelle Kriterium
-> Bsp.: Wenn Erfolg von Führungskräften nur durch Mitarbeiterzufriedenheit erfasst wird
-> nur ein Aspekt unter vielen anderen
Kriteriumsrelevanz
Gemeinsamkeit von aktuellem und konzeptuellem Kriterium
Kriteriumkontamination
Bereich des aktuellen Kriteriums, der sich nicht mit dem konzeptuellen Kriterium überschneidet
Kriteriumsdefiziens
Derjenige Bereich des konzeptuellen Kriteriums, der vom aktuellen Kriterium nicht erfasst wird
Kriterien die wir wählne überlappen teilweise mit Leistung (Abbildung: Kriterium wird Leistung nie zu 100% abbilden)
Defizienz = Kriterium nicht deckungsgleich mit Leistung
Deshlab leistug mit multiplen Kriterien erfassne
Bsp.: Pünktlichkeit Bäcker (wichtig rechtzeitig aufzumachen)
Defizient = Pünktlichkeit ist nicht alles, was Leistung ausmacht
Auch wichtig Kasse richtig zu zählen, Freundlich sein, Brötchen nicht fallen lassen
Wie können wir Leistung erfassen?
Herausfinden was gute Indikatoren für leistung sind
Leistungskriterien (Indikatoren)
Ergebnisbezogen
Ergebnisse = Outcomes die auch von Sit. Bestimmt werden
Zahlen die wir leicht erheben können, um auf Leistung zu schließen -> Objektiv erfassbar
möglich klare Leistungszeile zu setzen
-> so und so viel Umsatz wird nächstes Jahr wahrscheinlich von Person gemacht
Verhaltensbezogene Indikatoren
Fundamentaler Attributionsfehler: wird auf Person und nicht auf Situation attribuiert (Eigenschaftsbezogen; sie sind nicht teamfähig etc. -> kaschierte Eigenschaften)
wird als einengend erlebt -> Kleidung etc. -> Casual Friday bei Bank
Methode der Wahl weil weniger kontaminiert und nah an Definition von Leistung
Eigenschafts- und Personenbezogen
Ermöglicht Vergleichbarkeit (Sorgfalt) -> kann Personen miteinander vergleichen -> ob Person am Bank Schalter freundlich ist und ob Münzenpolierer sorgfältig arbeitet usw.
Eigenschaften stabil: kann Prognose daraus ableiten
Anfällig für Urteilstendenzen (schlechter für Feedback)
Erfordern Urteile von anderen -> Subjektive Komponente
Ob jemand hilfsbereit ist wird von anderen Kollegen usw. beurteilt -> Brauche deshalb Urteilsverfahren
Beurteilungs- und Einstufungsverfahren
Einstufungsskalen (Rating)
Grafisch:
Verhaltensverankert
Verhaltensbeobachtungsskala:
Rangordnungsverfahren
Zu beurteilende Personen werden entsprechend ihrer Leistung in eine Rangreihe gebracht.
(Auswahl-und Kennzeichnungsverfahren)
(objektive Maße)
(freie Eindrucksschilderung)
-> Beurteilende Person sammelt und ordnet die Eindrücke, die sie aus der direkten Zusammenarbeit und der Beobachtung der Arbeit der zu beurteilenden Person gewonnen hat
Entspricht Notensystem
Rangordnung: Stelle in Vergleich zu Gruppe
Urteilstendenzen verringern durch Verhaltensverankerungen
weil sich urteilenden sicherer sind und vorgegeben bekommen was unter sehr guten Leistung etc. zu verstehen ist
Entwicklung von Verhaltensankern
Identifikation & Definition von Leistungsdimensionen
z.B. durch Critical IncidentsTechnique (CIT)
-> wird Projektteam gebildet, dass zu beurteilende Arbeitstätigkeiten gut kennt (Vorgesetzte, Mitarbeiter, Vertreter der Personalabteilung/ des Betriebsrates)
Projektteam entwickelt umfangreiche Liste mit konkreten Verhaltensweisen, die bei der zu beurteilenden Tätigkeit zu Erfolg oder Misserfolg führen
Entwicklung von Verhaltensbeispielen
Kontrolle: Zuordnung von Verhaltensbeispielen zu Dimensionen (Inhaltsvalidität)
zweite Gruppe kennt nur Dimensionen und Verhaltensweisen, aber nicht deren Zuordnung
müssen Verhaltensweisen den Dimensionen erneut zuordnen -> alle Verhaltensweisen, die von mind. 75% der Gruppenmitglieder einer bestimmten Dimension zugeordnet wurden, werden weiterhin berücksichtigt -> alle anderen entfallen
Skalierung: Beurteilung des Leistungsniveaus d. Beispiele
Welcher Leistung entspricht Verhaltensbeispiel
Mit großer SP: Mittelwert für V Beispiel -> Items nehmen, die vom Mittelwert da liegen wo sie sein sollen und kleine Standardabweichung
Auswahl nach empirischen Kriterien
Mittelwert und Standardabweichung d. Urteile
Werden spezifische erhaltenswiesen vorgegeben (weg von Eigenschaften)
Als Urteiler gefordert zu sagen wie häufig Person V zeigt
Auch schlechtesten 10% müssen zugewiesen werden
-> Kategorien besetzen (nicht nur gute Noten verteilen)
-> wird durch diese Methode vermieden
Kann motivieren, hat aber auch Nachteile: für Klausur sagen das Note sich nicht das Punktzahl richtete sondern nach Rangordnung (Rangordnungsverfahren fördern Wettbewerb aber nicht Kooperation)
->Klausurbeispiel: lasse niemanden mehr abschreiben
relatives und kein absolutes Maß
können alle sehr gut sein, aber müssen trotzdem noch gucken wer schlechteste unter guten Personen ist
Bewertung von Verfahren
Reliabilität
Bei Rangordnungsverfahren noch stärker als ei Einstufungsverfahren -> gezwungen ganze breite der Skala auszunutzen
Objektivität wird höher
Unabhängig wer das Ganze durchführt
Anfälligkeit Urteilstendenzen
Gering bei Rangordnungsverfahren
Verankern der Skalen kann dies entgegenwirken
Rangordnung
Akzeptanz gering
Qualität von Leistungsbeurteilungen
- Testtheoretische Gütekriterien
- Urteilstendenzen
- Akkuratheit
- Drei Ebenen der Urteilsbildung
- Maßnahmen zur Reduktion von „Fehlern“
Testtheoretische Betrachtung
Objektivität
Formalisierung in Anweisungen, Urteilsskalen etc.
Übereinstimmung versch. Quellen („Interrater-Reliabilität“):
Selbst-und Vorgesetztenurteil: ρ= .34
Vorgesetzten-und Kolleg*innenurteil : ρ= .62
Warum ist das so? Noch Offen: Selbstwertdienliche Verzerrung oder mangelnde Einsicht anderer?
-> Moderator: Komplexität der Tätigkeit, Dauer der Zusammenarbeit
-> Mildetendenz in Selbsturteilen (Mittelwert in Selbstbeurteilunen i.d.R. höher als bei Fremdbeurteilungen)
Abhängig von Verfahren und Praktikabilitätsüberlegungen, i.d.R. gegeben
Kann mehrere Items vorgeben für 1 Dimension
i.d.R. dann Reliabilität gegeben
Validität
Inhaltsvalidität durch Anforderungsanalyse gewährleisten.
Kiteriumsvalidität: z.B. Korrelation zw. obj. Leistungsergebnissen und subj. Urteil: ρ= .57 -> Korrelation hoch
Urteilstendenzen
Mittelwertstendenzen:
darunter werden Milde- und Stengetendenzen zusammengefasst, weil dadurch der Mittelwert der Beurteilung einer Gruppe/Person nach oben oder unten verschoben wird
Mildetendenz
Neigung des Urteilers, die Leistung einer Person/ Gruppe besser zu bewerten als andere Urteiler
Streuungstendenzen
liegt dann vor, wenn ein Urteiler entweder stärker oder geringer mit seinen Urteilen differenziert als andere
zu starke DIfferenzierung: zu starke Streuung der Urteile
Korrelationstendenzen
Halo Effekt
Überstarhlungseffekt
wenn Personen, die als höflich beurteilt
werden, auch als hilfsbereit, zuverlässig und belastbar
unter Stress beurteilt werden
Tendenzen und nicht mehr Fehler
Denn wir wissen nicht was wahre Verteilung ist
Reduktion von Urteilstendenzen
eindeutige und verhaltensbezogene Kriterien
repräsentative Beobachtungen
Kenntnis der Tätigkeitsanforderungen
Einsatz mehrerer Beurteiler
mehrere Urteilsquellen (Kollegen, Mitarbeiter, Kunden, Selbst)
Beurteilertrainings (Information zu Urteilsfehlern, Beobachten lernen, Entwicklung eines gemeinsamen Maßstabs)
Akkuratheit
Schätzung d. „wahren Werts“ durch Experten (geht um einzelne Urteile)
i.d.R. auf Basis von Texten oder Videos
Relevanz v. a. in Forschung
Die Akkuratheit der Urteile der Beurteiler aus der Praxis wird an der Übereinstimmung mit den Expertenurteilen gemessen.
Akurratheit als (euklidische) Distanz zw. Urteilen
Zusammenhang zw. Akkuratheit und Urteilstendenzen gering
Problem: kennen den wahren Wert nicht
in Forschung: Urteile von Menschen mit Expertise werden übernommen
-> Urteilstendenzen und Akkuratheit stehen eigentlich nicht miteinander in Beziehung
Drei Ebenen der Urteilsbildung
3 Ebenen bilden den Prozess ab und umfassen mehrere Aspekte die Urteile beeinflussen können
Private Sorgen
wenn ich diese kenne beurteile ich ggf. anders
Spielt Rolle ob Person die beurteilt diese kennt oder nicht
Urteiler: Registrieren, bewerten und in Urteil zusammenfügen
Hierbei können Fehler auftreten
Eindrucksebene
Eigenen Werte (Selbstbild) beeinflussen -> ich lege Wert auf Pünktlichkeit: 5 min zu Spät dann viel (abhängig welches Gewicht es erhält)
Stereotype: Wer unpünktlich ist ist auch unzuverlässig usw.
In Person liegen Möglichkeiten der Fehler
Kommunikation des Urteils nach außen:
Standardisiert wenn ich ankreuze, offener beim freuen Eindruck
Sprachliche Kompetenz, Gewohnheiten spielen Rolle
Einstellung zum Beurteilungssystem
Strategische Ziele: wegloben -> Mitarbeiter den ich los werdn möchte; Kann diese Person so stark loben das sie woanders eine Stelle bekommt
Urteilstrainings
Traditionelle Komponenten insb. v. „Fehlertrainings“ sind:
Vertrautmachen mit den Beurteilungsformularen
Erläuterung der Konsequenzen der Beurteilung
Erläuterung von Urteilsfehlern („Beurteilerfehlertraining“)
Üben d. Beurteilungsprozesses und d. Gesprächsführung
Fehlertrainings verbessern allerdings kaum die Akkuratheit der Urteile, deshalb werden Bezugsrahmentrainings empfohlen.
Material: Videos zu beurteilender Personen (wird Rückmeldung gegeben über den wahren Wert -> Expertenurteil)
Feedback hins. Akkuratheit (Diskussion von Urteil und Abweichung)
Ziel: Gemeinsamen Bezugsrahmen schaffen. (selben Maßstab lernen -> was auf welcher Urteilsstufe entsprechend an Verhalten zu erwarten ist)
-> Urteilstendenzen reduzieren
->gescheitert (Akkuratheit kann nicht gesteigert werden)
Urteilsquellen
Vorgesetzte
Signalisiert auch Macht
Selbst
Sind mit uns selbst milder
Umstritten: Wissen über unsere Leistung selbst am meisten; evtl. verzerrt
Peers
Kann kollegiales Verhalten verschlechtern
Exkurs: 360° Feedback
Teil durch Leistung erklärbar (aber eher grob), Nicht welche Person mit welcher Persönlichkeitseigenschaft, sondern welche P. mit welcher Rolle
Urteilsrolle wichtig
Akzeptanz von Leitungsbeurteilungen
kurze Beurteilungsintervalle
Existenz eines formalen, verständlichen, gut geregeltem Beurteilungssystem
Partizipation an Entwicklung und Einführung
Beurteilungsdimensionen werden als relevant angesehen
hohe Sach-und Gesprächsführungskompetenz der Beurteiler
-> Partizipiation und prozedurale Gerechtigkeit im Gesprächa
Gelegenheit für die Beurteilten, Einwände zu äußern
Trennung inkompatibler Funktionen
auf empfundene Schwächen des Beurteilungssystems wird mit Veränderungen reagiert
(Gute Beziehung zum Beurteilenden)
-> politisch (könnte versuchen eigene Interessen durchzusetzen)
-> häufigere Beurteilungen werden eher akzeptiert (Wenn in System gut implementiert)
Schritte in der Konzeption von Leistungsbeurteilungsverfahren
1. Bestandsaufnahme: Analyse von Rahmenbedingungen und existierenden Verfahren
2.Zielformulierung: partizipative Festlegung d. Funktionen
3.Kosten-Nutzen-Rechnung: Investitionsrechnung, Abschätzung sozialer Wirkungen
4.Zielgruppen festlegen (Beurteilende und Beurteilte)
5.Arbeits-und Anforderungsanalyse (z.B. CIT, FAA)
6.Bestimmung d. Beurteilungskriterien
7.Wahl eines Skalierungsverfahrens
8.Skalenkonstruktion
9.Probeverwendung, Evaluation, Überarbeitung
10.Beurteiler*innen trainieren (auch hins. Rückmeldung d. Beurteilung)
Empfehlung:
5-20 Leistungsdimensionen mit eindeutiger Dimensionsbeschreibung
5-9 Antwortstufen mit (Verhaltens-) Ankern
Last changed10 months ago