Grundlagen SQS & SPC & Shewhart Karte

by OneMoreCoookie

1_ Was versteht man unter statistischer Qualitätssicherung und welche Teilgebiete gehören dazu?

Qualitätsbegriff (DIN 55350-11) = Beschaffenheit einer Einheit bezüglich der Erfüllung festgelegter Erfordernisse (Kunde fällt Urteil)

Stastistische Qualitätssicherung = Sicherstellung der Qualität unter Nutzung statistischer Verfahren

Teilgebiete:

statistische Prozesskontrolle (Kontrollkarte, Prozessüberwachung/-änderung)
Prozessfähigkeitsanalyse (Bewertung wie Vorgaben aus Planung bei Produktion eingehalten werden)
Prüfpläne (Annahme/Ablehnung von Chargen z.B. durch Versuchsplanung, Messunsicherheitsanalyse)

2_ Was ist statistische Prozesskontrolle (SPC)?

Definition = Gebiet der statistischen Qualitätskontrolle, das sich mit dem online-Monitoring (“zeitnahe” Überwachung) eines interessierenden (stochastischen) Prozesses beschäftigt.

Untergebiete:

-> Monitoring = Prozessüberwachung

-> Prozessänderung = change point

-> Kontrollkarten = Methoden

Beispiel Brötchengewicht (V1, S.22)

Zwei Typen von Variation:

-> Common cause - allgemeine Ursache:

fix, inhärent, beschreibbar mittels Wahrscheinlichkeitsrechnung

-> Special cause - zurechenbare Ursache:

hoffentlich behebbar, Zeitpunkt des Auftretens nicht vorhersehbar, sollte so schnell wie möglich entdeckt werden => “auffällig” genug dass Änderung entdeckt wird

3_ Erläutern Sie Begriffe wie statistische Kontrolle und ARL!

statistische Kontrolle (nach Shewhart)

= man bezeichnet einen Prozess als unter statistischer Kontrolle, wenn er nur Variation des ersten Typs (also allgemeine Ursache) aufweist.

-> besser und angemessener klingt stabil

Average Run Length (ARL) - mittlere Lauflänge:

Erwartete (mittlere) Zahl von Losen (Zeitpunkten, Beobachtung) bis die Kontrollkarte Alarm gibt (unter Annahme, dass die Änderung zum Start der Karte oder nie stattfindet)

4_ Was fällt ihnen zum Change-Point-Modell ein?

= Folge von Zufallsvariablen X1,X2, … mit zugehörigen Verteilungsfunktionen F:

4b. Anschauliches Brötchenbeispiel Change-Point

Die Grundidee ist simpel: Das Change-Point-Modell sagt, dass es einen unbekannten Zeitpunkt τ gibt, ab dem sich „irgendwas ändert". Vorher ist alles normal, danach nicht mehr.

Vorher (i < τ): Die Maschine läuft sauber. Jedes Brötchen wiegt ungefähr 100 g, mit der üblichen kleinen Schwankung (mal 99 g, mal 101 g — das ist normales Rauschen). Der Parameter θ bleibt bei seinem Sollwert θ₀.

Ab dem Change Point (i ≥ τ): Irgendetwas geht schief — vielleicht lockert sich eine Düse, das Mehl wechselt, die Temperatur driftet. Jetzt wiegen die Brötchen systematisch anders, z.B. im Schnitt nur noch 95 g. Der Parameter springt auf einen neuen Wert θ₁.

Das Problem: Niemand weiß, wann τ eintritt. Es könnte bei Brötchen Nr. 50 passieren oder bei Nr. 500 oder nie. Und die Maschine hängt kein Schild raus „Achtung, ich bin jetzt kaputt". Die Schwankungen sind ja auch vorher schon da — ein einzelnes Brötchen mit 97 g könnte normales Rauschen sein oder schon der Anfang vom Problem.

Genau deshalb braucht man Kontrollkarten: Die beobachten die Brötchen laufend und versuchen, den Moment τ so schnell wie möglich zu erkennen — ohne ständig falschen Alarm zu geben, wenn eigentlich alles in Ordnung ist.

Das θ im Modell kann übrigens verschiedene Dinge sein: der Mittelwert (Brötchen werden leichter), die Streuung (Brötchen werden mal viel zu schwer, mal viel zu leicht), oder beides gleichzeitig.

5_ Was ist ein Kontrollkarte?

Erklärung:

Transformation: Man nimmt die rohen Messwerte X₁, X₂, ... und rechnet sie in eine einzige Prüfgröße Zₙ um. Bei Shewhart ist das einfach der Mittelwert X̄ₙ, bei EWMA ein gewichteter Durchschnitt, bei CUSUM eine kumulierte Summe. Aber das Prinzip ist immer gleich: viele Einzelwerte rein, eine Zahl raus.

Stoppzeit L: L = inf{n ∈ ℕ : Zₙ ∉ O} heißt auf Deutsch: „L ist der früheste Zeitpunkt, an dem Zₙ das Kontrollintervall verlässt." Das inf bedeutet hier einfach „der kleinste Wert, für den gilt...". Sobald Zₙ zum ersten Mal außerhalb von O landet, stoppt die Karte und gibt Alarm. Das ist Zeitpunkt L.

Das Kontrollintervall O: Das ist der Bereich, in dem sich Zₙ aufhalten „darf", solange alles in Ordnung ist. Die drei Varianten auf der Folie sind einfach verschiedene Formen davon — O = (−∞, ucl] heißt: nur eine obere Grenze, nach unten offen (einseitig). O = [lcl, ucl] heißt: obere und untere Grenze (zweiseitig, der Normalfall). O = [lcl, ∞) heißt: nur eine untere Grenze. Solange Zₙ innerhalb von O liegt, passiert nichts.

6_ Ideen zur Gütemessung von Kontrollkarten? (Performancemessung)

Stoppzeit L ist eine Zufallsvariable → braucht ein Gütemaß.

Zentral: ARL = E(L) — mittlere Anzahl Lose bis Alarm.

Unter Kontrolle (τ = ∞): ARL₀ soll groß sein (wenig Fehlalarme)
Außer Kontrolle (τ = 1): ARL₁ soll klein sein (schnelle Erkennung)

Mittlere Verspätung: D_τ = E_τ(L − τ + 1 | L ≥ τ)

Vier Ansätze zur Formalisierung (V2, S. 15):

Lorden (1971): Worst-Case sup über alle τ
Roberts/Taylor (1966/68): Steady-State, lim τ→∞
Pollak/Siegmund (1975): sup der bedingten Verspätung
Frisén (2003): Bayesianisch, T ~ Geom(p)

Alle unter Nebenbedingung E_∞(L) ≥ A (ARL₀ fixiert).

(Erklärung):

Die Grundfrage ist: Wie gut ist meine Kontrollkarte?

Du hast eine Karte laufen, die irgendwann Alarm gibt. Aber „irgendwann" ist unpräzise — manchmal nach 5 Losen, manchmal nach 500. Also brauchst du eine Zahl, die beschreibt, wie gut die Karte im Schnitt funktioniert. Das ist die ARL — der Durchschnitt, nach wie vielen Losen der Alarm kommt.

Jetzt gibt es zwei Situationen:

Alles läuft normal (unter Kontrolle): Hier willst du keinen Alarm. Trotzdem wird die Karte irgendwann rein zufällig Alarm geben — ein Fehlalarm. Je später das passiert, desto besser. Also: ARL₀ soll groß sein, z.B. 500. Das heißt: im Schnitt 500 Lose, bevor ein Fehlalarm kommt.

Es ist was schiefgegangen (außer Kontrolle): Hier willst du sofort Alarm. Je schneller, desto besser. Also: ARL₁ soll klein sein, z.B. 5. Das heißt: im Schnitt nach 5 Losen erkennt die Karte das Problem.

Das Dilemma: Beides gleichzeitig geht nicht. Machst du die Grenzen eng, reagiert die Karte schnell auf echte Probleme (ARL₁ klein) — aber sie gibt auch öfter falschen Alarm (ARL₀ wird auch klein). Machst du die Grenzen weit, hast du wenig Fehlalarme (ARL₀ groß) — aber echte Probleme werden spät erkannt (ARL₁ auch groß).

Lösung in der Praxis: Man legt ARL₀ fest (z.B. auf 500) und sucht dann die Karte, die unter dieser Bedingung ARL₁ am kleinsten macht.

Die vier Namen auf Folie 15 (Lorden, Roberts, Pollak, Frisén) sind einfach vier verschiedene Wege, die „Verspätung" D_τ mathematisch zu definieren — also wie man genau misst, wie lange die Karte nach dem Change Point τ noch braucht, bis sie Alarm gibt. Die unterscheiden sich darin, ob man den schlimmsten Fall betrachtet (Lorden), den Gleichgewichtszustand (Roberts), das Supremum (Pollak) oder einen Bayesianischen Ansatz (Frisén). Aber die Grundidee ist bei allen dieselbe: Alarm soll schnell nach τ kommen.

7_ Erläutern Sie die Shewhart-X-Karte (auch Mittelwert-Karte)

Kontrolle der Lage (Erwartungswert), Streuung σ bleibt konstant und ist bekannt.

Gedächtnislos — nur der aktuelle Stichprobenmittelwert X̄ₙ wird betrachtet, keine vergangenen Werte.

(Voraussetzung: Xᵢⱼ ~ N(μ, σ²), unabhängig.)

(Transformation: Tₙ = (X̄ₙ − μ₀) / (σ/√N) → unter Kontrolle ist Tₙ ~ N(0,1).)

Stoppzeit: L = inf{n ∈ ℕ : |Tₙ| > c} — Alarm, sobald Tₙ die Grenzen ±c überschreitet.

Stärke: schneller Alarm bei großen Shifts (a > 2σ).

Schwäche: bei kleinen Shifts späte oder gar keine Reaktion.

Besondere Eigenschaft: Die mittlere Verspätung E_τ(L−τ+1 | L≥τ) = E₁(L) hängt nicht von τ ab. Das gilt nur für die Shewhart-Karte (wegen Gedächtnislosigkeit).

L ist geometrisch verteilt mit Alarmwahrscheinlichkeit pc = 2Φ(−c).

8_ ARL und kritischer Wert der Shewhart-X-Karte?

Bei jedem Los wird geprüft: liegt Tₙ außerhalb ±c?

Die Wahrscheinlichkeit dafür ist pc = 2Φ(−c).

Weil die Shewhart-Karte gedächtnislos ist, ist jedes Los ein neuer unabhängiger Münzwurf mit Trefferwahrscheinlichkeit pc. Also ist L geometrisch verteilt, und die ARL ist einfach ARL = 1/pc.

Klassisch: c = 3 → pc = 2Φ(−3) = 0,0027 → ARL₀ = 1/0,0027 ≈ 370,4. Das heißt: im Schnitt alle 370 Lose ein Fehlalarm.

Wenn man eine andere ARL₀ will, z.B. A = 500, rechnet man rückwärts: pc = 1/A, also c = Φ⁻¹(1 − 1/(2A)).

Außer Kontrolle (Shift um a Standardabweichungen): pc(a) = Φ(−c + a) + Φ(−c − a). Der zweite Term ist bei a > 0 winzig, also praktisch pc(a) ≈ Φ(−c + a).

Was heißt das konkret?

a = 1 (kleiner Shift): ARL₁ ≈ 44 → braucht ewig
a = 2: ARL₁ ≈ 6 → akzeptabel
a = 3: ARL₁ ≈ 2 → sofort
a = 4: ARL₁ ≈ 1,2 → beim nächsten Los

Fazit: Shewhart reagiert erst ab ca. a ≥ 2 brauchbar schnell. Für kleinere Shifts braucht man EWMA oder CUSUM.

Merksatz: Shewhart ist wie ein Türsteher, der nur den gerade Ankommenden anschaut. Große Auffälligkeiten erkennt er sofort — aber wenn sich jemand nur ein bisschen verdächtig benimmt, fällt das nicht auf. Dafür bräuchte man EWMA oder CUSUM, die sich die letzten Gäste merken.

8b Graphen zu ARL und kritischer Wert Shewhart

9_ Skizzieren Sie die Ideen der Laufregeln und Kontrollkarten?

Problem: Shewhart-Karte ist gedächtnislos

Lösung: Idee der Laufregeln - man gibt der Karte ein kurzes Gedächtnis, indem man muster der letzten paar Werte auswertet

Klassische Regeln (WECO Regeln)
I) 2 von 3 außerhalb ±2σ → unwahrscheinlich bei normalem Prozess, deutet auf Shift hin
II) 4 von 5 außerhalb ±1σ → die Werte „kleben" auffällig an einer Seite
III) 8 von 8 mit gleichem Vorzeichen → der Prozess driftet, obwohl kein einzelner Wert auffällig ist

Alarm wird gegeben, wenn mindestens eine dieser Regeln ODER die klassische 3σ-Regel anschlägt.

Brötchen-Beispiel: Montag 98 g, Dienstag 97 g, Mittwoch 99 g, Donnerstag 97 g, Freitag 98 g — kein einziger Wert bricht die 3σ-Grenze. Aber 4 von 5 liegen unter −1σ → Laufregel schlägt Alarm.

Preis dafür: Mehr Regeln = mehr Fehlalarme. Die ARL₀ sinkt unter 370. Um wieder auf ARL₀ = 370 zu kommen, muss man die Grenzen etwas weiter machen.

10_ ARL und Laufregeln - was wird schwieriger & Lösung?

Mehr Fehlalarme möglich. ARL-Berechnung aufwändiger bei Laufregeln, da vergangene Werte mitbetrachtet.

Um wieder auf 370 zu kommen -> Grenzen durch Faktor erweitern
Laufregeln populärer als EWMA oder CUSUM
bei großem Fehler Shewhart schneller -> bei kleinen Fehler CUSUM oder EWMA

11_ Was unternimmt man für die Shewhart-X-Karte bei unbekannter Varianz?

In der Praxis kennt man σ fast nie -> 2 Auswege

1—Weg: Ersetzen durch Losstandardabweichung

und T ist nicht mehr normal sondern t-verteilt mit N-1 Freiheitsgraden (auch kontrollgrenze ergibt sich dann aus t-Verteilung). Sn korrigieren mit c4

2—Weg: Vorlaufschätzung

-> man sammelt unter Kontrolle in Phase I. m ≥ 20 Stichproben, σ einmalig schätzen
-> einfrieren in Phase II.
(Je kleiner m desto größer Unsicherheit)

12_ Berühmte SPC-Konstanten c₄, d₂, d₃ und ihre Bedeutung.

Alle 3 lösen dasselbe Problem: Wenn σ unbekannt ist muss man es aus den Daten schätzen. ABER naheliegende Schätzer sind nicht erwartungstreu. Die Konstanten korregieren das:

c₄ - Korrekturfaktor für die Standardabweichung

E(Sₙ) = c₄ · σ, also ist Sₙ/c₄ ein erwartungstreuer Schätzer für σ. (Wichtig kleine Lose)

d₂ - Korrekturfaktor für die Spannweite R

Statt Sₙ kann man auch Rₙ = max − min als Streuungsmaß nehmen. E(Rₙ) = d₂ · σ, also ist Rₙ/d₂ ein erwartungstreuer Schätzer für σ. (Beliebt weil leicht zu berechnen, nur min/max Werte)

d₃ - Streuung der Spannweite R

Var(Rₙ) = d₃² · σ². Braucht man, um die Kontrollgrenzen der R-Karte zu berechnen: UCL/LCL = R̄ ± 3·d₃·R̄/d₂.

Brötchen-Bild: Man wiegt 5 Brötchen pro Los. Sₙ sagt im Schnitt „die streuen um 4,7 g" obwohl es eigentlich 5 g sind. c₄ korrigiert das auf die ehrlichen 5 g. Rₙ sagt „zwischen schwerstem und leichtestem liegen 11,7 g" — d₂ rechnet das zurück auf σ = 5 g.

Alle drei Konstanten hängen nur von der Losgröße N ab und stehen in Tabellen.