Herbert Hackspiel, BHAK Innsbruck
 
Statistik mit realem Zahlenmaterial

Mathematische Inhalte:

Deskriptive Statistik, Normalverteilung Kurzzusammenfassung: Mit Daten des Bundesamts für Eich- und Vermessungswesen in Innsbruck können Statistikaufgaben mit direktem Praxisbezug gebastelt werden, die sich auch bestens für Matura-Aufgaben eignen. Lehrplanbezug: V. Jg. HAK Zeitaufwand: 2 bis 4 Stunden, je nach EXCEL-Kenntnissen Mediales Umfeld: EXCEL; Datei: Eichamt.xls 1. Reale Daten des BEV (Bundesamt für Eich- und Vermessungswesen)

Mancher Lehrer (und vielleicht auch Schüler) wird sich schon gefragt haben, ob die Schulbuchbeispiele wie das folgende einen Realitätsbezug haben:

"Waschmittel werden in 2 kg Packungen abgefüllt usw..." Um meine diesbezüglichen Zweifel auszuräumen, fragte ich bei der Firma Rauch-Mühle in Innsbruck nach und bekam das beiliegende Messprotokoll des BEV (Bundesamt für Eich- und Vermessungswesen in Innsbruck). Daten in EXCEL, Tabelle "Rauch-Mühle", siehe auch Anhang.

Beim Eichamt bekam ich dann weitere Auskünfte zu diesem Messprotokoll:

Bei der nicht-zerstörenden Prüfung wurden 25 Verpackungen gewogen, aus diesen der Mittelwert bestimmt und eine Zusatztara von 0,5 g dazugerechnet, um ja keiner Firma Unrecht zu tun, denn eine negativ verlaufene Messung hat zur Folge, dass das ganze Los nicht in den Verkauf gehen darf!

Dann wurden 80 Bruttomessungen durchgeführt. Die Nettowerte entstanden aus Bruttowert minus Taramittelwert.

Aus dem Nettomittelwert wird der korrigierte Mittelwert der Stichprobe berechnet, indem die Standardabweichung mit einem Korrekturfaktor (hier 0,295*s , abhängig von der Stichprobengröße) multipliziert und zum Mittelwert addiert wird.

Dieser korrigierte Mittelwert muss ³ Nennfüllmenge sein, außerdem müssen noch die Toleranzuntergrenzen TU1 und TU2 – abhängig von der Losgröße - erfüllt sein, damit keine Beanstandung erfolgt.

TU1 : 3 Packungen wären hier zulässig, würden aber von der betriebsinternen Kontrolle der Rauch-Mühle automatisch ausgeworfen.
TU2 : absolut – darf keinesfalls unterschritten werden.
Die gesetzlichen Grundlagen stehen in der Fertigverpackungsverordnung FVPO 1993, Bundesgesetzblatt Jahrgang 1993, ausgegeben am 21. Dezember 1993 , 867. Verordnung.

Aus solchen Daten kann sich jeder seine eigenen (Matura-)Aufgaben basteln, wie folgendes Beispiel zeigt.

Aus einem Messprotokoll des BEV (Bundesamt für Eich- und Vermessungswesen) bei der Firma Rauch-Mühle in Innsbruck. Die Daten sind auf der Diskette! (s. auch Anhang)

Gewogen wurden zuerst 25 Verpackungen, daraus das arithmetische Mittel berechnet und dann 0,5 Gramm Zusatztara dazugegeben. Anschließend wurde das Bruttogewicht gemessen. Da es sich um eine nicht-zerstörende Prüfung gehandelt hat, entstanden die Nettowerte aus Bruttowert minus Taramittelwert.

  1. Erstelle für die Bruttowerte eine Klasseneinteilung

  2. 1003 bis unter 1005,
    1005 bis unter 1007 etc.
    bis unter 1017
    berechne daraus die (absoluten) Häufigkeiten und die Dichtefunktion der Normalverteilung und stelle beide in einem Diagramm dar. Achte auf die richtige Darstellung der Einheiten auf der x-Achse! Die Graphik soll zeigen, dass die Approximation durch die Normalverteilung sehr gut ist!

  3. Berechne aus den Nettowerten m und s

  4. [m vermehrt um einen Korrekturfaktor laut einer bestimmten Vorschrift mit 0,295*s = 0,84 g muss mindestens die Nennfüllmenge 1000 g ergeben, sonst darf das ganze Los nicht in den Verkauf kommen!]
  5. Berechne die Wahrscheinlichkeit, dass ein Paket untergewichtig ist (Füllmenge unter 1000 g) Stimmt das Ergebnis mit den tatsächlichen Werten überein? Nachzählen, Antwort!

  6. [Anleitung: Stelle die Nettowerte in eine neue Spalte und lass diese automatisch der Größe nach ordnen]
  7. Es gibt 2 Grenzwerte:

  8. TU 1 (Toleranzuntergrenze 1) : 985 g. Laut Vorschrift wären 3 solche Pakete zulässig.
    Wie groß ist bei dieser Abfüllanlage die Wahrscheinlichkeit, dass solche Pakete vorkommen? (Würden übrigens von der Maschine automatisch ausgeworfen!)
  9. TU 2 (Toleranzuntergrenze 2) : 970 g. Dieser Wert darf laut Vorschrift keinesfalls unterschritten werden.

  10. Die Firmenleitung behauptet (stellt die Hypothese auf), dass dieser Wert bei der Abfüllanlage, aus der die obigen Daten stammen zu 99,9 % nicht unterschritten wird.
    Wo liegt die Grenze für eine Sicherheit von g = 99,9 %?
    Ist die Hypothese beweisbar oder widerlegbar. Wie muss die Fragestellung lauten, wenn man etwas beweisen will? Interpretiere das Ergebnis!
Lösung:

a) Mit der Matrix-Funktion HÄUFIGKEIT kann eine Klasseneinteilung erstellt werden. Dazu benötigen wir eine Spalte mit den Klassenobergrenzen (Bereich E6:E12). Nun markieren Sie den Bereich für die absoluten Häufigkeiten G6:G12. Rufen Sie nun über den Funktionsassistenten die Funktion HÄUFIGKEIT auf und geben Sie die Bereiche für die Daten und die Klassenobergrenzen ein:

WICHTIG: Klicken Sie nicht auf ENDE! Schließen Sie unbedingt mit STRG+UMSCH+ENTER ab! Nur dann interpretiert EXCEL die Eingabe als Matrixfunktion!

Für die Annäherung der Normalverteilung berechnen wir in den Zellen E15 den Mittelwert mit =MITTELWERT(B3:B82) und in E16 die Standardabweichung mit =STABWN(B3:B82). Nun können Sie in H6 die Funktion =NORMVERT(F6;$E$15;$E$16;FALSCH) eingeben und mit der Maus runterziehen.

Um das Diagramm zu erstellen, markieren Sie die Spalten mit abs. Häuf. und Normalvert. G5:H12 und rufen den Diagrammassistenten auf. Wählen Sie in Schritt 1 bei Diagrammtyp unter "benutzerdefinierte Typen" "Linie - Säule auf zwei Achsen". Geben Sie in Schritt 2 bei Diagramm-Quelldaten im Registerblatt "Reihe" als "Beschriftung der Rubrikenachse (X)" die Klassenmitten F6:F12 ein.

Formatieren Sie nun die Datenreihen: Klicken Sie im Diagramm auf die Reihe "Normalverteilung" (Linie) und rufen Sie mit der rechten Maustaste das Kontextmenü auf. Im Menü "Datenreihe formatieren" können Sie nun im Register "Muster" die "Linie glätten", die "Stärke" verändern und "ohne Markierung" wählen.

Klicken Sie nun im Diagramm auf die Reihe "abs. Häufigkeit" (Säulendiagramm) und rufen Sie mit der rechten Maustaste das Kontextmenü auf. Im Menü "Datenreihe formatieren" können Sie nun im Register "Optionen" den "Abstand" vermindern auf 50.

Klicken Sie nun auf eine der drei Achsen und rufen Sie mit der rechten Maustaste das Kontextmenü auf. Mit "Achse formatieren" können Sie die Schrift verkleinern und den Hintergrund verändern:

b) Die statistischen Maßzahlen aus den Nettowerten erhalten Sie mit MITTELWERT(C3:C82) in der Zelle E35 m = 1001,6 bzw. mit STABWN(C3:C82) in der Zelle E36 s = 2,8187.

c) Die Wahrscheinlichkeit P(X<1000) erhalten Sie mit NORMVERT(1000;E35;E36;WAHR): 0,285. Antwort: 28,5 % der Pakete sind untergewichtig! Tatsächlich sind es 24 von 80 = 30 %, d.h. recht gute Übereinstimmung.

d) P(X < 985) liefert mit NORMVERT(985;E35;E36;WAHR) 1,95512E-09. Die Wahrscheinlichkeit beträgt praktisch 0 %.

e) Für die kritische Grenze c für g = 99,9% P(X < c) = 0,999 erhalten Sie c = 992,89 mit NORMINV(0,001;E35;E36). Die Grenze für g = 99,9 % bzw. 0,1 % darunter liegt bei 992,9 g. Der tatsächliche Wert 970 g liegt also weit darunter. Wenn man beweisen will, dass 99,9 % über 970 g liegen, muss man vom Gegenteil ausgehen, dass 0,1 % darunter liegen. Nachdem diese Hypothese abgelehnt ist, gilt das Gegenteil als bewiesen!

Mein Tip:

Weitere reale Daten bekommen Sie entweder bei einer Firma, die Ihnen ein Messprotokoll zur Verfügung stellt, oder Sie finden so wie ich hilfsbreite Beamte im Bundesamt für Eich- und Vermessungswesen!

2. c 2-Anpassungstest

Auch wenn es über den Stoff der Handelsakademie hinausgeht:

Man kann nicht nur optisch feststellen, dass die Häufigkeitsverteilung gut unter die Normalverteilungskurve passt, sondern auch mittels c 2-Anpassungstest überprüfen, ob unter der Berücksichtigung einer Irrtumswahrscheinlichkeit von z.B. 5 % die Messwerte einer Normalverteilung entsprechen.

Man stellt die Hypothese Ho auf, dass es so sei und beurteilt die Hypothese durch einen Vergleich der beobachteten absoluten Häufigkeiten hi und der aus der Hypothese theoretisch berechneten ( = erwarteten) Häufigkeiten hi'. Man schätzt m und s aus der Stichprobe und berechnet die hi'.
 
Zeile Klassen-
mitte
abs. Häuf.
hi
¨ ber.
Häuf.
hi'
¨ Y
1 1004 4   .2    
2 1006 8 12 .8 10 0,4000
3 1008 16 16 17 17 0,0588
4 1010 20 20 23 23 0,3913
5 1012 18 18 18 18 0,0000
6 1014 10 14 .9 12 0,3333
7 1016 4   .3    
S           1,1835

¨ Die beobachteten Häufigkeiten hi jeder Klasse sollen mindestens 5 sein.

Freiheitsgrad: f = n – 1 – m (n = Anz. der Summanden in Y, m = Anz. der zu schätzenden Parameter)

f = 5 – 1 – 2 = 2 Freiheitsgrade

Hier ist Y = 1,1835 £ c (0,05;2) = 5,99 (=CHIINV(0,05;2) oder Tabelle).

Die Hypothese, die Messdaten seien normalverteilt, kann mit 5 % Irrtumswahrscheinlich-keit nicht verworfen werden.

3. Weitere Daten

Weitere Daten, die ich beim BEV bekam:

a) EXCEL-Tabelle "Tirol-Milch": Fruchtbuttermilch der Tirol-Milch.

b) EXCEL-Tabelle "11er":Prüfung bei der Firma 11er in Frastanz.

c) EXCEL-Tabelle "unbek": Nicht jede Prüfung des BEV geht gut aus. Aus Datenschutzgründen wurden Firma und Erzeugnis gelöscht. Das ganze Los von 6000 Stück durfte nicht in den Verkauf gehen!

4. Anhang: Daten RAUCH-MÜHLE

( EXCEL-Datei zum Herunterladen: eichamt.xls )
 
Prüfung von Fertigpackungen gleicher Nennfüllmenge

Eichamt: Innsbruck

Prüfer: Moser

geprüft bei: Fa. Rauchmühle

erstellt am: 30.06.97

Erzeugnis: Rauchgrieß

Losgröße: 5000

geprüft: 80

Nennfüllmenge: 1000 g

Zusatztara: 0,5 g

TU1: 985,0 g

TU2: 970,0 g

Taramittelwert aus 25 Messungen: 

Mittelwert: 8,97 g

Standardabweichung: 0,06 g

Einhaltung des Mittelwertes:

Mittelwert der Stichprobe: 1001,60 g

Standardabweichung: 2,84 g

korrigierter Mittelwert der Stichprobe: 1002,44

(= 1001,60 + .295*s = 1001,60 + 0,84)

Einhaltung der Minusabweichung:

Anzahl der Packungen unter TU1: 0 (zulässig: 3)

Anzahl der Packungen unter TU2: 0 (zulässig: 0)

Stichprobe:

Netto = Brutto -Taramittelwert (8,97) + Zusatztara (0,5)
 
Nr
Tara
Brutto
Netto
Nr
Brutto
Netto
Nr
Brutto
Netto
1
8,89
1012,32
1003,85
26
1008,86
1000,39
51
1005,72
997,25
2
8,98
1009,93
1001,46
27
1015,88
1007,41
52
1012,30
1003,83
3
8,94
1013,17
1004,70
28
1015,20
1006,73
53
1006,88
998,41
4
8,89
1011,44
1002,97
29
1013,28
1004,81
54
1005,71
997,24
5
9,01
1011,41
1002,94
30
1012,27
1003,80
55
1009,12
1000,65
6
8,88
1005,22
996,75
31
1010,41
1001,94
56
1008,44
999,97
7
9,04
1007,24
998,77
32
1013,34
1004,87
57
1009,25
1000,78
8
9,01
1012,13
1003,66
33
1008,99
1000,52
58
1010,37
1001,90
9
8,92
1009,28
1000,81
34
1015,79
1007,32
59
1013,03
1004,56
10
8,92
1010,17
1001,70
35
1004,45
995,98
60
1006,76
998,29
11
8,96
1008,12
999,65
36
1012,95
1004,48
61
1013,04
1004,57
12
8,90
1008,94
1000,47
37
1007,26
998,79
62
1009,08
1000,61
13
8,99
1013,24
1004,77
38
1011,59
1003,12
63
1005,82
997,35
14
8,93
1012,92
1004,45
39
1006,70
998,23
64
1007,95
999,48
15
8,95
1009,93
1001,46
40
1007,33
998,86
65
1013,22
1004,75
16
8,92
1012,97
1004,50
41
1007,60
999,13
66
1012,08
1003,61
17
8,93
1009,10
1000,63
42
1009,16
1000,69
67
1010,10
1001,63
18
9,07
1012,70
1004,23
43
1008,77
1000,30
68
1009,30
1000,83
19
9,09
1010,34
1001,87
44
1004,93
996,46
69
1007,86
999,39
20
9,02
1015,18
1006,71
45
1011,15
1002,68
70
1008,04
999,57
21
9,04
1010,88
1002,41
46
1010,99
1002,52
71
1011,93
1003,46
22
9,01
1009,67
1001,20
47
1009,94
1001,47
72
1007,80
999,33
23
8,96
1013,36
1004,89
48
1004,16
995,69
73
1009,67
1001,20
24
8,98
1009,80
1001,33
49
1011,97
1003,50
74
1004,89
996,42
25
8,98
1007,27
998,80
50
1005,64
997,17
75
1012,67
1004,20
76
1011,43
1002,96
77
1008,24
999,77
78
1013,25
1004,78
79
1012,29
1003,82
80
1013,86
1005,39