Wilfried Rohm, HTBL Saalfelden
 
Stichprobensysteme

Mathematische Inhalte:

Diskrete Wahrscheinlichkeitsverteilungen (Binomial-, Poissonverteilung);

Differentialrechnung (Berechnung von Extremwerten);

Algebraische Gleichungen hohen Grades

Anwendung: Stichprobensysteme in der besprochenen Form werden in der Praxis in vielen Betrieben z.B. in der Eingangsprüfung angewendet. Kurzzusammenfassung: Nach einer kurzen Einführung in die Theorie der Stichprobensysteme an Hand eines praxisnahen Beispieles wird der Begriff der Operationscharakteristik einer n-c-Einfach-stichprobenanweisung erklärt und schließlich rechnerisch und graphisch umgesetzt. Ferner wird demonstriert, wie verschiedene kennzeichnende Größen (die man ansonsten Tabellen entnehmen muß), berechnet werden können. Dabei treten im allgemeinem algebraische Gleichungen sehr hohen Grades auf. Lehrplanbezug: Statistische Methoden in der Qualitätssicherung (3. bzw. 4.Jahrgang) Zeitaufwand: Bei vorhandenen Kentnissen der Binomialverteilung (eventuell auch der Poissonverteilung) kann der Inhalt dieses Artikels im Schulunterricht in etwa 2 Unterrichtsstunden behandelt werden. Es empfiehlt sich jedoch, nach einer kurzen Einführung in Sinn und Prinzip einer n-c-Stichprobenanweisung die Schüler selbsttätig werden zu lassen. Dies könnte im Rahmen einer kleinen Projektarbeit oder auch in Form von Hausarbeiten geschehen. Mediales Umfeld Die Aufgabenstellungen dieses Artikels wurden mit DERIVE 3.0 gelöst. Der Artikel wurde aber so geschrieben, daß eine Übertragung auf andere CAS-Systeme (erst recht auf den TI92) leicht durchführbar ist. Anmerkungen: Diese Fragestellung und ihre Lösung war eines der Themen, die ich Schülern im Rahmen von kleinen Projektarbeiten bereits gestellt habe (siehe der Artikel "Neue Wege in der Leistungsbeurteilung ?" in AMMU-7.) Die hier dargelegte Vorgangsweise habe ich daher teilweise den Arbeiten der Schüler Thomas EBERHARTH und Andreas UNTERRAINER entnommen. 1. Stichprobensysteme in der Praxis

Bei Stichprobensystemen handelt es sich um eine leicht verständliche Methode der statistischen Qualitätssicherung. Stichproben ersetzen in vielen Fällen 100-%-Prüfungen, insbesondere bei zerstörenden Prüfungen oder Prüfungen an nicht allzu kritischen Teilen (d.h. ein gewisser durchschlüpfender Fehleranteil kann verkraftet werden.) bzw. Prüfungen, die sonst nicht wirtschaftlich durchführbar sind.

In der Praxis wird eine Vielzahl unterschiedlicher Stichprobensysteme verwendet. Wir wollen uns auf den einfachsten und bekanntesten Fall einer sogenannten Einfachstichprobenanweisung für qualitative Merkmale beschränken. "Qualitativ" soll heißen, daß die Prüfung eines Teiles nur auf der Basis gut oder schlecht (bzw. fehlerfrei oder fehlerhaft) erfolgt.

Beispiel :

Monatlich werden 20.000 Spritzgußteile bestimmter Spezifikation an eine Firma geliefert. Der Lieferant hat zugesichert, daß höchstens 1% dieser Spritzgußteile unbrauchbar sind. Damit erklärt sich die Firma einverstanden, jedoch soll diese Angabe des Lieferanten im Wareneingang stichprobenartig überprüft werden. Aus der Norm DIN ISO 2859-1 (AQL-Stichprobensystem) wurde folgende Stichprobenanweisung herausgelesen:
 


n - c = 315 - 7


 


Was bedeutet diese Stichprobenanweisung ?

Aus dem Losumfang N=20.000 soll eine Stichprobe von n=315 Spritzgußteilen entnommen und geprüft werden. Die Zahl c wird Annahmezahl genannt, das bedeutet: Sind bis zu 7 fehlerhafte Teile unter den 315 geprüften Teilen, so gilt das Los im obigen Sinne als "o.k." und wird angenommen. Werden mehr als 7 fehlerhafte Teile gefunden, so wird das Los abgelehnt bzw. rückgewiesen. Was dann zu tun ist, muß vertraglich geregelt sein (z.B.: Reklamation / Rücksendung an den Lieferanten).

2. Fragestellungen

Offensichtlich ist eine Stichprobenentnahme mit einem bestimmten Risiko verbunden.

Zur Abschätzuung dieser Risiken müssen etwa folgende Fragen beantwortet werden können: Umgekehrt: Bei welchem Fehlerprozentsatz beträgt die Annahmewahrscheinlichkeit genau 90% ?

 b) Wie groß ist die Anzahl der durchschlüpfenden fehlerhaften Teile für einen bestimmten vorgegebenen Ausschußprozentsatz p ?

 c) Bei welchem Ausschußprozentsatz p ist dieser Durchschlupf maximal ?

Bei der Beantwortung dieser Fragen stößt man sehr schnell auf Grenzen, was die praktische Berechenbarkeit ohne Computerprogramm oder CAS-Programm bzw. CAS-fähigen Taschenrechner betrifft. Daher gibt es auch umfangreiche Tabellen (siehe [1] oder [2] und ANHANG), denen man die Lösungen entnehmen kann. Gerade deshalb ist es aber sehr reizvoll, diese (rein gedanklich) nicht allzu schweren Fragen mittels CAS zu lösen.

3. Die Operationscharakteristik einer n-c-Stichprobenanweisung

Die Operationscharakteristik soll die obige Frage 2a) beantworten. Wir wollen in einem Diagramm darstellen, bei welchem Ausschußprozentsatz p welche Annahmewahrscheinlichkeit Pa gemäß der n-c-Stichprobenanweisung gegeben ist. Damit erhält man auch Einblick in die möglichen Risiken einer Stichprobenanweisung im Vergleich zu einer wirklich "sicheren" 100%-Prüfung (die es in der Praxis bestenfalls nur bei Automateneinsatz geben kann)
 
Durchaus reizvoll ist es, zunächst eine Vermutung aufzustellen, wie dieses Operationscharakteristik im Vergleich zur 100%-Prüfung aussieht. 

Bei der 100%-Prüfung gibt es einen vereinbarten Schlechtanteil p1, bis zu dem die Lieferung mit Wahrscheinlichkeit 1 angenommen wird. (p1 wäre im Beispiel aus dem 1.Abschnitt 1%)

Die strichlierte Linie stellt eine mögliche Vermutung für den Verlauf der Operationscharakteristik einer Stichprobenanweisung (etwa 315-7) dar, die allerdings nicht dem tatsächlichen Ergebnis entspricht.

Wie berechnet man diese Annahmewahrscheinlichkeiten Pa ?

Prinzipiell liegt hier eine Situation vor, auf die das Modell der Hypergeometrischen Verteilung zutreffen würde. Im vorliegenden Beispiel und in den meisten Fällen der Praxis ist jedoch die Losgröße N recht groß im Vergleich zu n, sodaß die Näherung durch die Binomialverteilung möglich und sinnvoll ist. Recht häufig wird (gerade im Bereich der Stichprobensysteme) die Näherung durch die Poissonverteilung (Parameter m = n× p ) verwendet, die ja typischerweise für kleines p und relativ großes n Anwendung findet. Außerdem findet die Poissonverteilung bekanntlich dann Verwendung, wenn nicht fehlerhafte Einheiten (® Binomialverteilung) sondern Fehler pro Einheit gezählt werden (z.B. Lackfehler je m2, Isolationsfehler je km Draht, ...).

Das Los wird angenommen, wenn höchstens c fehlerhafte Einheiten (bzw. Fehler/Einheit) gefunden wurden. Unabhängig von der verwendeten Verteilung gilt daher:

G(x) ist dabei die Verteilungsfunktion der gewählten Verteilung.

g(x) ist die Wahrscheinlichkeitsfunktion der gewählten Verteilung

Zur Umsetzung auf ein CAS-System definieren wir uns zunächst die benötigten Verteilungen :

Mit Hilfe der obigen Funktionen werden nun die Annahmewahrscheinlichkeiten in Abhängigkeit von p definiert - das ist dann die Operationscharakteristik (kurz "OC").

Binomialverteilung
Poissonverteilung
Pa_BI(n,c,p):=G_BI(c,n,p)×

× CHI(0,p,1)

 

 Pa_PO(n,c,p):=G_PO(c,n,p)×

× CHI(0,p,1)

 Damit können nun die nachfolgenden Kurven gezeichnet und mit den Ergebnissen zur Vertiefung des Verständnisses der Operationscharakteristik herumexperimentiert werden. Die Abbildungen sollen hierzu nur als mögliche Beispiele bzw. Anregungen dienen.
 
Abb.1: OC der Anweisung 315-7 Abb.2 : OC der Anweisung 50-2

 
 
Abb.3 : Vergleich verschiedener OC´s : 

Einfluß der Annahmezahl c

Abb.4 : Vergleich verschiedener OC´s: 

Einfluß des Stichprobenumfanges n

Interpretation von Abb.1 - Abb.4 :

Mit Hilfe der Funktionen für die Annahmewahrscheinlichkeiten sind nun folgende Berechnungen möglich:

Wie groß ist die Annahmewahrscheinlichkeit für ein bestimmtes p ?

 Pa_BI(315,7,0.01) ® 0.9850

Pa_BI(315,7,0.02) ® 0.7028

Pa_BI(315,7,0.04) ® 0.0626

einzelne Punkte der OC. (Die Berechnung mit Pa_PO liefert hier nahezu dieselben Werte)

 Wie groß ist der Ausschußprozentsatz bei vorgegebener Annahmewahrscheinlichkeit ? 2 spezielle Punkte der OC (meist [p90 | 90%] und [p10 | 10%] (eventuell auch das Verhältnis ) werden in der Praxis gerne für die Charakterisierung einer Stichprobenanweisung herangezogen.

 Aus diesem Grund gibt es entsprechende Tabellen, die auszugsweise im Anhang wiedergegeben werden. Beispielsweise liefern die Gleichungen

 Pa_BI(315,7,p)=0.9

PO_PO(315,7,p)=0.9

nach SOLVE den Wert für p90 : p = 0.0148366 (mit der Binomialverteilung)

p = 0.0147813 (mit der Poissonverteilung)

Allerdings gelingt die Berechnung hier nur numerisch (d.h. man muß vorher OPTIONS | PRECISION auf APPROXIMATE stellen). Außerdem benötigt die Berechnung über die Binomialverteilung deutlich mehr Zeit.

Dies wäre eine Möglichkeit, auf die Lösbarkeit algebraischer Gleichungen einzugehen bzw. dies an dieser Stelle zu wiederholen. Bei der Berechnung über die Binomialverteilung ist für dieses Beispiel folgende Gleichung 315.Grades zu lösen:

(p-1)308× (5.58× 1013× p7+1.24× 1012× p6+2.39× 1010× p5+3.82× 108× p4+4.92× 106× p3+47586× p2+308× p+1) = 0.9

Außerdem ist für die Berechnung der numerischen Lösung die Angabe des Suchintervalls erforderlich. Bei ungünstiger Wahl können "falsche" Ergebnisse herauskommen !

Es ist daher hier auch die direkte Anwendung des SOLVE-Befehles sinnvoll. Zum Beispiel bedeutet die Anweisung

SOLVE(Pa_PO(315,7,p)=0.9 , p , 0 , 0.10)

die Suche nach einer Lösung im Intervall [0,0.10].

 4. Durchschlupf:

Wir wollen uns nun an die Beantwortung der Fragen aus 2b) und 2c) machen. Unter Durchschlupf versteht man den mittleren Anteil der fehlerhaften Teile des Loses, der die Prüfung passiert ohne aussortiert worden zu sein. (In der Fachliteratur wird der Durchschlupf auch AOQ-Wert genannt = "Average Outgoing Quality")

In einer ersten NÄHERUNG können wir uns daher überlegen: Der Anteil der fehlerhaften Teile (p) muß mit der Wahrscheinlichkeit multipliziert werden, daß das Los angenommen wird (Pa). Das Ergebnis muß schließlich noch mit dem Anteil der nicht geprüften Teile im Los () multipliziert werden (da ja selbstverständlich fehlerhafte Teile, die in der Stichprobe gefunden wurden, aussortiert werden). Wir erhalten also:

 Gedanklich einfach ist es nun auch, jenes p zu bestimmen, bei dem der Durchschlupf maximal wird, um schließlich diesen maximalen Durchschlupf zu bestimmen. (Dieser wird in der Fachliteratur AOQL-Wert genannt, der dazugehörende Fehleranteil pAOQL ; AOQL steht für "Average Outgoing Quality Limit" )

Die Gleichung  liefert als Lösung pAOQL und daher ist: Dmax = AOQL = D(pAOQL)

Ähnlich wie bei der Berechnung von pß ist aber auch hier im allgemeinen eine algebraische Gleichung höheren Grades zu lösen, die meist nur numerisch zu lösen ist.
 
Graphische Darstellung: 

Nebenstehend sind einige Durchschlupfkurven für die Anweisung

 n-c = 315-7

dargestellt. Man erkennt, daß für große N die Kurve gegen die Grenzfunktion

D » Pa× p

wandert. Ferner ist ersichtlich, daß

als konstanter Faktor die Lage des Maximums (also pAOQL) nicht beeinflußt.


 
 
Zurück zum eingangs formulierten Beispiel: 

Nebenstehende Abbildung zeigt in der Gegenüberstellung die OC und Durchschlupfkurve der n-c-Anweisung 

315-7

Bei Berechnung mit Hilfe der Poissonverteilung erhält man :

 pAOQL = 1,84 %
 
 

pmax = AOQL = 1,397 %
 
 

Die Binomialverteilung liefert:

fast das gleiche Ergebnis.

 5. Ausblick:

Die hier vorgeführten Berechungen und Funktionsdarstellungen lassen sich relativ leicht auf andere Stichprobensysteme ausweiten (Doppelstichprobensysteme, Mehrfachstichprobenpläne, messende Prüfung). Für den Mathematikunterricht scheint mir aber die hier gezeigte Besprechung der qualitativen Einfachstichprobenanwesiungen (n-c) ausreichend zu sein.

ANHANG:

A. Literaturverzeichnis:

[1] TIMISCHL, Qualitätssicherung, 2.Auflage, Carl Hanser Verlag München Wien 1995.

[2] FRANZKOWSKI, Stichprobensysteme, Lehrgang der Deutschen Gesellschaft für Qualität (DGQ), Frankfurt 1986.

[3] SCHÄRF, Mathematik 4 für HTL, 5.Auflage (Neubearbeitung), Oldenbourg Verlag Wien 1995.

B. Ausschnitt aus Tabellen für genormte Stichprobenanweisungen (nach [2])

In den Tabellen bedeuten:

p0,90 ... Fehleranteil, für den die angeführte n-c-Anweisung 90% Annahmewahrscheinlcihkeit aufweist

p0,10 ... Fehleranteil, für den die angeführte n-c-Anweisung 10% Annahmewahrscheinlcihkeit aufweist

pAOQL Jener Fehleranteil, für den der Durchschlupf D maximal wird.

Berechnungen mit Hilfe der Binomialverteilung:
 
 
 
n-c
p0,90 (%)
p0,10 (%)
pAOQL (%)
50-0 0,210 4,50 2,0
50-1 1,07 7,56 3,2
50-2 2,23 10,30 4,5
50-3 3,54 12,9 5,8
50-5 6,42 17,8 8,6
80-0 0,132 2,84 1,2
80-1 0,666 4,78 2,0
80-2 1,38 6,52 2,8
80-3 2,20 8,16 3,7
80-5 3,98 11,3 5,4

 Berechnet mit Hilfe der Poissonverteilung:
 
 
 
n-c
p0,90 (%)
p0,10 (%)
pAOQL (%)
50-0 0,21 4,61 2,0
50-1 1,06 7,78 3,2
50-2 2,20 10,6 4,5
50-3 3,49 13,4 5,9
50-5 6,30 18,6 8,7
80-0 0,131 2,88 1,2
80-1 0,665 4,86 2,0
80-2 1,38 6,65 2,8
80-3 2,18 8,35 3,7
80-5 3,94 11,6 5,4
125-0 0,084 1,84 0,80
125-1 0,426 3,11 1,30
125-2 0,882 4,26 1,82
125-3 1,40 5,35 2,36
125-5 2,52 7,42 3,48
200-0 0,053 1,15 0,50
200-1 0,266 1,95 0,81
200-2 0,551 2,66 1,14
200-3 0,873 3,34 1,48
200-5 1,58 4,64 2,18
200-7 2,33 5,89 2,90
315-0 0,0333 0,731 0,317
315-1 0,168 1,23 0,52
315-2 0,349 1,69 0,72
315-3 0,553 2,12 0,94
315-5 1,00 2,94 1,38
315-7 1,48 3,74 1,84
315-8 1,72 4,13 2,08

C. Berechnungsprotokoll (DERIVE Version 3.0) - Datei RO-STICH.MTH auf der Diskette