Statistik mit realem Zahlenmaterial |
Mathematische Inhalte:
Mancher Lehrer (und vielleicht auch Schüler) wird sich schon gefragt haben, ob die Schulbuchbeispiele wie das folgende einen Realitätsbezug haben:
Beim Eichamt bekam ich dann weitere Auskünfte zu diesem Messprotokoll:
Bei der nicht-zerstörenden Prüfung wurden 25 Verpackungen gewogen, aus diesen der Mittelwert bestimmt und eine Zusatztara von 0,5 g dazugerechnet, um ja keiner Firma Unrecht zu tun, denn eine negativ verlaufene Messung hat zur Folge, dass das ganze Los nicht in den Verkauf gehen darf!
Dann wurden 80 Bruttomessungen durchgeführt. Die Nettowerte entstanden aus Bruttowert minus Taramittelwert.
Aus dem Nettomittelwert wird der korrigierte Mittelwert der Stichprobe berechnet, indem die Standardabweichung mit einem Korrekturfaktor (hier 0,295*s , abhängig von der Stichprobengröße) multipliziert und zum Mittelwert addiert wird.
Dieser korrigierte Mittelwert muss ³ Nennfüllmenge sein, außerdem müssen noch die Toleranzuntergrenzen TU1 und TU2 – abhängig von der Losgröße - erfüllt sein, damit keine Beanstandung erfolgt.
Aus solchen Daten kann sich jeder seine eigenen (Matura-)Aufgaben basteln, wie folgendes Beispiel zeigt.
Aus einem Messprotokoll des BEV (Bundesamt für Eich- und Vermessungswesen) bei der Firma Rauch-Mühle in Innsbruck. Die Daten sind auf der Diskette! (s. auch Anhang)
Gewogen wurden zuerst 25 Verpackungen, daraus das arithmetische Mittel berechnet und dann 0,5 Gramm Zusatztara dazugegeben. Anschließend wurde das Bruttogewicht gemessen. Da es sich um eine nicht-zerstörende Prüfung gehandelt hat, entstanden die Nettowerte aus Bruttowert minus Taramittelwert.
a) Mit der Matrix-Funktion HÄUFIGKEIT kann eine Klasseneinteilung erstellt werden. Dazu benötigen wir eine Spalte mit den Klassenobergrenzen (Bereich E6:E12). Nun markieren Sie den Bereich für die absoluten Häufigkeiten G6:G12. Rufen Sie nun über den Funktionsassistenten die Funktion HÄUFIGKEIT auf und geben Sie die Bereiche für die Daten und die Klassenobergrenzen ein:
WICHTIG: Klicken Sie nicht auf ENDE! Schließen Sie unbedingt mit STRG+UMSCH+ENTER ab! Nur dann interpretiert EXCEL die Eingabe als Matrixfunktion!
Für die Annäherung der Normalverteilung berechnen wir in den Zellen E15 den Mittelwert mit =MITTELWERT(B3:B82) und in E16 die Standardabweichung mit =STABWN(B3:B82). Nun können Sie in H6 die Funktion =NORMVERT(F6;$E$15;$E$16;FALSCH) eingeben und mit der Maus runterziehen.
Um das Diagramm zu erstellen, markieren Sie die Spalten mit abs. Häuf. und Normalvert. G5:H12 und rufen den Diagrammassistenten auf. Wählen Sie in Schritt 1 bei Diagrammtyp unter "benutzerdefinierte Typen" "Linie - Säule auf zwei Achsen". Geben Sie in Schritt 2 bei Diagramm-Quelldaten im Registerblatt "Reihe" als "Beschriftung der Rubrikenachse (X)" die Klassenmitten F6:F12 ein.
Formatieren Sie nun die Datenreihen: Klicken Sie im Diagramm auf die Reihe "Normalverteilung" (Linie) und rufen Sie mit der rechten Maustaste das Kontextmenü auf. Im Menü "Datenreihe formatieren" können Sie nun im Register "Muster" die "Linie glätten", die "Stärke" verändern und "ohne Markierung" wählen.
Klicken Sie nun im Diagramm auf die Reihe "abs. Häufigkeit" (Säulendiagramm) und rufen Sie mit der rechten Maustaste das Kontextmenü auf. Im Menü "Datenreihe formatieren" können Sie nun im Register "Optionen" den "Abstand" vermindern auf 50.
Klicken Sie nun auf eine der drei Achsen und rufen Sie mit der rechten Maustaste das Kontextmenü auf. Mit "Achse formatieren" können Sie die Schrift verkleinern und den Hintergrund verändern:
b) Die statistischen Maßzahlen aus den Nettowerten erhalten Sie mit MITTELWERT(C3:C82) in der Zelle E35 m = 1001,6 bzw. mit STABWN(C3:C82) in der Zelle E36 s = 2,8187.
c) Die Wahrscheinlichkeit P(X<1000) erhalten Sie mit NORMVERT(1000;E35;E36;WAHR): 0,285. Antwort: 28,5 % der Pakete sind untergewichtig! Tatsächlich sind es 24 von 80 = 30 %, d.h. recht gute Übereinstimmung.
d) P(X < 985) liefert mit NORMVERT(985;E35;E36;WAHR) 1,95512E-09. Die Wahrscheinlichkeit beträgt praktisch 0 %.
e) Für die kritische Grenze c für g = 99,9% P(X < c) = 0,999 erhalten Sie c = 992,89 mit NORMINV(0,001;E35;E36). Die Grenze für g = 99,9 % bzw. 0,1 % darunter liegt bei 992,9 g. Der tatsächliche Wert 970 g liegt also weit darunter. Wenn man beweisen will, dass 99,9 % über 970 g liegen, muss man vom Gegenteil ausgehen, dass 0,1 % darunter liegen. Nachdem diese Hypothese abgelehnt ist, gilt das Gegenteil als bewiesen!
Mein Tip:
Weitere reale Daten bekommen Sie entweder bei einer Firma, die Ihnen ein Messprotokoll zur Verfügung stellt, oder Sie finden so wie ich hilfsbreite Beamte im Bundesamt für Eich- und Vermessungswesen!
2. c 2-Anpassungstest
Auch wenn es über den Stoff der Handelsakademie hinausgeht:
Man kann nicht nur optisch feststellen, dass die Häufigkeitsverteilung gut unter die Normalverteilungskurve passt, sondern auch mittels c 2-Anpassungstest überprüfen, ob unter der Berücksichtigung einer Irrtumswahrscheinlichkeit von z.B. 5 % die Messwerte einer Normalverteilung entsprechen.
Man stellt die Hypothese Ho auf, dass
es so sei und beurteilt die Hypothese durch einen Vergleich der beobachteten
absoluten Häufigkeiten hi und der
aus der Hypothese theoretisch berechneten ( = erwarteten) Häufigkeiten
hi'. Man schätzt m
und s aus der Stichprobe und berechnet die hi'.
Zeile | Klassen-
mitte |
abs. Häuf.
hi |
¨ | ber.
Häuf. hi' |
¨ | Y |
1 | 1004 | 4 | .2 | |||
2 | 1006 | 8 | 12 | .8 | 10 | 0,4000 |
3 | 1008 | 16 | 16 | 17 | 17 | 0,0588 |
4 | 1010 | 20 | 20 | 23 | 23 | 0,3913 |
5 | 1012 | 18 | 18 | 18 | 18 | 0,0000 |
6 | 1014 | 10 | 14 | .9 | 12 | 0,3333 |
7 | 1016 | 4 | .3 | |||
S | 1,1835 |
¨ Die beobachteten Häufigkeiten hi jeder Klasse sollen mindestens 5 sein.
Freiheitsgrad: f = n – 1 – m (n = Anz. der Summanden in Y, m = Anz. der zu schätzenden Parameter)
f = 5 – 1 – 2 = 2 Freiheitsgrade
Hier ist Y = 1,1835 £ c (0,05;2) = 5,99 (=CHIINV(0,05;2) oder Tabelle).
Die Hypothese, die Messdaten seien normalverteilt, kann mit 5 % Irrtumswahrscheinlich-keit nicht verworfen werden.
3. Weitere Daten
Weitere Daten, die ich beim BEV bekam:
a) EXCEL-Tabelle "Tirol-Milch": Fruchtbuttermilch der Tirol-Milch.
b) EXCEL-Tabelle "11er":Prüfung bei der Firma 11er in Frastanz.
c) EXCEL-Tabelle "unbek": Nicht jede Prüfung des BEV geht gut aus. Aus Datenschutzgründen wurden Firma und Erzeugnis gelöscht. Das ganze Los von 6000 Stück durfte nicht in den Verkauf gehen!
4. Anhang: Daten RAUCH-MÜHLE
( EXCEL-Datei zum Herunterladen: eichamt.xls )
Prüfung
von Fertigpackungen gleicher Nennfüllmenge
Eichamt: Innsbruck Prüfer: Moser geprüft bei: Fa. Rauchmühle erstellt am: 30.06.97 Erzeugnis: Rauchgrieß Losgröße: 5000 geprüft: 80 Nennfüllmenge: 1000 g Zusatztara: 0,5 g TU1: 985,0 g TU2: 970,0 g |
Taramittelwert
aus 25 Messungen:
Mittelwert: 8,97 g Standardabweichung: 0,06 g Einhaltung des Mittelwertes: Mittelwert der Stichprobe: 1001,60 g Standardabweichung: 2,84 g korrigierter Mittelwert der Stichprobe: 1002,44 (= 1001,60 + .295*s = 1001,60 + 0,84) Einhaltung der Minusabweichung: Anzahl der Packungen unter TU1: 0 (zulässig: 3) Anzahl der Packungen unter TU2: 0 (zulässig: 0) |
Stichprobe:
Netto = Brutto
-Taramittelwert (8,97) + Zusatztara (0,5)
|
|
|
|
|
|
|
|
|
|
||
1
|
8,89
|
1012,32
|
1003,85
|
26
|
1008,86
|
1000,39
|
51
|
1005,72
|
997,25
|
||
2
|
8,98
|
1009,93
|
1001,46
|
27
|
1015,88
|
1007,41
|
52
|
1012,30
|
1003,83
|
||
3
|
8,94
|
1013,17
|
1004,70
|
28
|
1015,20
|
1006,73
|
53
|
1006,88
|
998,41
|
||
4
|
8,89
|
1011,44
|
1002,97
|
29
|
1013,28
|
1004,81
|
54
|
1005,71
|
997,24
|
||
5
|
9,01
|
1011,41
|
1002,94
|
30
|
1012,27
|
1003,80
|
55
|
1009,12
|
1000,65
|
||
6
|
8,88
|
1005,22
|
996,75
|
31
|
1010,41
|
1001,94
|
56
|
1008,44
|
999,97
|
||
7
|
9,04
|
1007,24
|
998,77
|
32
|
1013,34
|
1004,87
|
57
|
1009,25
|
1000,78
|
||
8
|
9,01
|
1012,13
|
1003,66
|
33
|
1008,99
|
1000,52
|
58
|
1010,37
|
1001,90
|
||
9
|
8,92
|
1009,28
|
1000,81
|
34
|
1015,79
|
1007,32
|
59
|
1013,03
|
1004,56
|
||
10
|
8,92
|
1010,17
|
1001,70
|
35
|
1004,45
|
995,98
|
60
|
1006,76
|
998,29
|
||
11
|
8,96
|
1008,12
|
999,65
|
36
|
1012,95
|
1004,48
|
61
|
1013,04
|
1004,57
|
||
12
|
8,90
|
1008,94
|
1000,47
|
37
|
1007,26
|
998,79
|
62
|
1009,08
|
1000,61
|
||
13
|
8,99
|
1013,24
|
1004,77
|
38
|
1011,59
|
1003,12
|
63
|
1005,82
|
997,35
|
||
14
|
8,93
|
1012,92
|
1004,45
|
39
|
1006,70
|
998,23
|
64
|
1007,95
|
999,48
|
||
15
|
8,95
|
1009,93
|
1001,46
|
40
|
1007,33
|
998,86
|
65
|
1013,22
|
1004,75
|
||
16
|
8,92
|
1012,97
|
1004,50
|
41
|
1007,60
|
999,13
|
66
|
1012,08
|
1003,61
|
||
17
|
8,93
|
1009,10
|
1000,63
|
42
|
1009,16
|
1000,69
|
67
|
1010,10
|
1001,63
|
||
18
|
9,07
|
1012,70
|
1004,23
|
43
|
1008,77
|
1000,30
|
68
|
1009,30
|
1000,83
|
||
19
|
9,09
|
1010,34
|
1001,87
|
44
|
1004,93
|
996,46
|
69
|
1007,86
|
999,39
|
||
20
|
9,02
|
1015,18
|
1006,71
|
45
|
1011,15
|
1002,68
|
70
|
1008,04
|
999,57
|
||
21
|
9,04
|
1010,88
|
1002,41
|
46
|
1010,99
|
1002,52
|
71
|
1011,93
|
1003,46
|
||
22
|
9,01
|
1009,67
|
1001,20
|
47
|
1009,94
|
1001,47
|
72
|
1007,80
|
999,33
|
||
23
|
8,96
|
1013,36
|
1004,89
|
48
|
1004,16
|
995,69
|
73
|
1009,67
|
1001,20
|
||
24
|
8,98
|
1009,80
|
1001,33
|
49
|
1011,97
|
1003,50
|
74
|
1004,89
|
996,42
|
||
25
|
8,98
|
1007,27
|
998,80
|
50
|
1005,64
|
997,17
|
75
|
1012,67
|
1004,20
|
||
76
|
1011,43
|
1002,96
|
|||||||||
77
|
1008,24
|
999,77
|
|||||||||
78
|
1013,25
|
1004,78
|
|||||||||
79
|
1012,29
|
1003,82
|
|||||||||
80
|
1013,86
|
1005,39
|