Prof. Dr. Ludwig Paditz, HTW Dresden (FH), FB Informatik/Mathematik, 01069 Dresden
(Workshop, Pfingsttagung 2002 in Münster)
 
 

Der "gezinkte" Würfel mit dem TI-92Plus (Betriebssystem 2.05)
 

Enttarnung des "gezinkten" Würfels  -  Datensimulation / Auswertung / Fehlentscheidung
(oder: Warum die Statistik nicht zur absoluten Wahrheit führt, jedoch die Kritikfähigkeit fördert.)
 

Internet: http://www.informatik.htw-dresden.de/~paditz/images/wurf2002.htm










Programmidee:
C.C.Edwards: Does a TI-8x Cast a Fair Die? in: Eightysomething!, Vol. 6, No.3, 1997, p. 9-10.
siehe Internet:
http://www.comcal.net/www.ti.com/calc/docs/80xthing.htm und http://www.comcal.net/www.ti.com/calc/docs/act83stat.htm
oder als pdf-file
http://www.comcal.net/www.ti.com/calc/docs/act/pdf/s9780so3.pdf oder http://www.ti.com/calc/pdf/s9780som.pdf.
 
 

Mithilfe des GTR werden ideale und "gezinkte" Würfel simuliert. Die simulierten Daten werden statistisch ausgewertet und dienen als Grundlage zur Überprüfung von statistischen Hypothesen. Schließlich wird über mögliche Fehlentscheidungen diskutiert.
 

Anhang 1: Programmtexte (ASCII-Code)
Anhang 2: Datentabellen
Anhang 3: Formeln
 
 

Entsteht beim Würfelexperiment (mit einem idealen Würfel) und Auswertung der vermuteten Gleichverteilung im Chi^2-Anpassungstest tatsächlich eine Chi^2-verteilte Testgröße?

Welche (Prüf-)Verteilung hat die Testgröße, wenn der Würfel in Wirklichkeit "gezinkt" war?

Wie sind die Wahrscheinlichkeiten für den Fehler 1. und 2. Art zu interpretieren?
 
 

Der Workshop erfordert interaktives Arbeiten, d.h. es wird mit einzelnen Teilprogrammen gearbeitet. Damit haben die Schüler oder Studenten den Ablauf einzelner Arbeitsschritte selbst in der Hand und verstehen so die Inhalte der einzelnen Arbeitsschritte besser. Die benötigten Teilprogramme werden am Anfang in einen neu angelegten Ordner (hier: PADITZ) per Link-Kabel überspielt. Später wird die Statistik-Flash-Software TISTATLE vorteilhaft ausgenutzt.

Bild A1 zeigt die Teilprogramme im VAR-LINK-Menü, hingegen Bild A2 auf den Zugriff zu den Teilprogrammen über den CATALOG, F4-Taste, einschließlich einer Hilfe-Information über die F1-Taste hinweist:

Bild A1  Bild A2
 

Der Start der Datensimulation erfolgt unter der deutschen Bedienoberfläche mit dem Teilprogramm fairdiep( ) ohne Parametereingabe, denn es wird sofort ein Dialogfenster zur Eingabe der Startwerte geöffnet:

Bild 1  Bild 2

Die Bilder 1 und 2 zeigen die Auswahlmöglichkeiten. Der Neustart der Zufallszahlengenerators erlaubt es, bereits simulierte Daten erneut zu erzeugen, damit z.B. alle Workshopteilnehmer auf ihren persönlichen Taschenrechnern mit den gleichen Daten arbeiten können. Im ersten Durchlauf werden M=300 Würfelexperimente mit je N=100 Würfen eines idealen Würfels simuliert (Startwert des ZZ-Generators: 2001):

Bild 3  Bild 4

Bild 5  Bild 6

Zeitdauer dieser Simulation ca. 30min (ein Speed-Modul im TI-92Plus ist vorteilhaft, um die Zeitdauer für die Simulation zu verkürzen). Während die Simulation läuft, können weitere Erläuterungen gegeben werden:

Ein Experiment mit N=100 Würfen erzeugt die Augenzahlen X1 , X2 , ..., XN , aus denen sofort die Häufigkeiten H1 , H2 , ..., H6 ermittelt und mit den theoretischen Häufigkeiten N/6 für jede Augenzahl (idealer Würfel) verglichen werden:
CHI^2 = 6 / N   *  Summe ( ( Hk - N/6 )2  , k , 1 , 6 )
Der CHI^2-Wert beschreibt die quadratischen Abweichungen zwischen den empirischen (Ist-Zustand) und theoretisch erwarteten (Soll-Zustand) Häufigkeiten. Der Faktor 6/N normiert die die CHI^2-Werte, so dass sich (näherungsweise) CHI^2-verteilte Zufallszahlen ergeben, sofern der Ist-Zustand dem Soll-Zustand entspricht. Die mathematische Statistik sagt hierzu aus, dass sich im sogenannten CHI^2-Anpassungstest eine (näherungsweise) CHI^2-verteilte Prüfgröße (mit 5 Freiheitsgraden als Parameter der CHI^2-Verteilung) ergibt, sofern der Ist-Zustand dem (hypothetischen) Soll-Zustand entspricht.
Liste list1 mit den M=300 simulierten Chi^2-Werten muß dann in Liste laltur (alte Urdatenliste des ersten Simulationslaufes) gesichert werden.
 

Nun kann die Simulation mit dem gezinkten Würfel erfolgen:

Bild 7  Bild 8

Bild 9  Bild 10

Während des Simulationslaufes erscheint eine Anzeige zum Stand der Simulation. Hier der 9. Chi^2-Wert:

Bild 11  Bild 12

Zeitdauer dieser erneuten Simulation ca. 30min. Während die Simulation läuft, können weitere Erläuterungen gegeben werden:

Ein Experiment mit N=100 Würfen erzeugt die "gezinkten" Augenzahlen X1 , X2 , ..., XN , aus denen sofort die Häufigkeiten H1 , H2 , ..., H6 ermittelt und erneut mit den theoretischen Häufigkeiten N/6 für jede Augenzahl (idealer Würfel) verglichen werden:
CHI^2 = 6 / N   *  Summe ( ( Hk - N/6 )2  , k , 1 , 6 )
Der "gezinkte" Würfel soll dabei die Augenzahl 6 etwas seltener erscheinen lassen gemäß folgender Wahrscheinlichkeitsverteilung: P( X = k  ) = 2/11  für k = 1, 2, ..., 5 und  P( X = k  ) = 1/11  für k = 6.
In der praktischen Datenerfassung kennt man die Wahrscheinlichkeitsverteilung der gewürfelten Daten nicht, so dass stets ein Vergleich mit den im Idealfall zu erwartenden Häufigkeiten N/6  ( Nullhypothese zur vermuteten Wahrscheinlichkeitsverteilung:
P( X = k  ) = 1/6  für k = 1, 2, ..., 6 ) erfolgt.
Die nunmehr simulierte Zufallsgröße CHI^2 für "gezinkte" Würfeldaten ist jedoch unter der nichtzutreffenden Nullhyothese der Gleichverteilung dann auch nicht mehr (auch nicht näherungsweise) CHI^2-verteilt (mit 5 Freiheitsgraden). Das erkennt man z.B. in der Rechtsverschiebung des Histogramms für die simulierten CHI^2-Quadrat-Prüfgrößen der einzelnen Experimente.
Liste list1 mit den M=300 simulierten Chi^2-Werten muß dann in Liste lneuur (neue Urdatenliste des zweiten Simulationslaufes) gesichert werden.

Diese zwei Urdatenlisten könnten auch vorher von jedem Schüler individuell erzeugt bzw. vom Lehrer überspielt werden, um die Simulationszeit einzusparen.

Bild 13  Bild 14
 

Nun beginnt der nächste Arbeitsschritt:

Erzeugung der Variationsreihen zu laltur und lneuur mit dem SortAufw-Befehl. Die in aufsteigender Reihenfolge sortierten Listen sind wieder unter den bisherigen Listennamen abgespeichert, vgl. Bild 14. Man erkennt bereits die unterschiedlichen Größenordnungen der Einzelwerte in den sortierten Urlisten. Nun werden die primären und sekundären Häufigkeitsverteilungen mit den Teilprogrammen primfreq( ) und secufreq( ) erzeugt und unter folgenden Namen abgespeichert:

Bild 15  Bild 16

list2 --> laltpx (ältere erste Simulation mit den primären x-Werten)

list3 --> laltpf (ältere erste Simulation mit den primären f-Werten: zugeordnete Häufigkeiten)

list4 --> laltsx (ältere erste Simulation mit den sekundären x-Werten bei Klasseneinteilung: Klassenbreite 1)

list5 --> laltsf (ältere erste Simulation mit den sekundären f-Werten: zugeordnete Klassenhäufigkeiten)

und

list2 --> lneupx (neuere zweite Simulation mit den primären x-Werten)

list3 --> lneupf (neuere zweite Simulation mit den primären f-Werten: zugeordnete Häufigkeiten)

list4 --> lneusx (neuere zweite Simulation mit den sekundären x-Werten bei Klasseneinteilung: Klassenbreite 1)

list5 --> lneusf (neuere zweite Simulation mit den sekundären f-Werten: zugeordnete Klassenhäufigkeiten)

Bild 17  Bild 18

Bild 19  Bild 20

Nun werden die Häufigkeitsverteilungen für die "gezinkten" Daten bereitgestellt:

Bild 21  Bild 22

Bild 23  Bild 24

In Bild 24 wurden die Summenhäufigkeiten (Absolutwerte in Liste laltps bzw. laltss) zur Bereitstellung der empirischen Verteilungsfunktion bzw. Treppenfunktion der relativen Summenhäufigkeiten erzeugt. Nun werden außerdem die Chi^2-Dichtefunktion, deren Verteilungsfunktion, die empirische Verteilungsfunktion und die Treppenfunktion der relativen Summenhäufigkeiten definiert und im Y= - Menü abgespeichert, jeweils für den idealen Würfel: defchidf( ) erzeugt y3, defchivf( ) erzeugt y2, defempvf( ) erzeugt y1, deftrels( ) erzeugt y4.

Bild 25  Bild 26

Bild 27  Bild 28

Das Betrachtungsfenster muß per Hand eingestellt werden. Das Teilprogramm plot1234( ) erzeugt nun einige statistische Grafiken, die teilweise mit der Chi^2-Dichtefunktion überlagert werden:

Bild 29  Bild 30

Bild 29 und 30: Histogramm und Häufigkeitspolygon für den idealen Würfel

Bild 31 Bild 32

Bild 31 und 32: Häufigkeitspolygon und Chi^2-Dichtefunktion für den idealen Würfel, sowie ein Boxplot.

Konzentration der Chi^2-Werte unter der Nullhypothese H0 "nahe bei Null" - also: kein Einwand gegen H0 .

Bild 33  Bild 34

Bild 33 und 34: Histogramm und Häufigkeitspolygon für den "gezinkten" Würfel - Eine Chi^2-Dichtefunktion ist nicht mehr erkennbar (Rechtsverschiebung des Histogramms deutet auf zu große Chi^2-Werte unter H0 hin).

Bild 35: Histogramm und Boxplot für den gezinkten Würfel.

Es folgen nun Bilder, die per Hand im Y= - Menü eingestellt werden:

Bild 37 und 39: empirische Verteilungsfunktion (der Chi^2-Testwerte unter H0 und idealem Würfel)

Bild 41: Verteilungsfunktion der Prüfverteilung (Chi^2-Verteilung mit 5 Freiheitsgraden)

Wegen der langen Rechenzeit zur Darstellung der Chi^2-Verteilungsfunktion über ein Integral mit variabler oberer Grenze nutzt man vorteilhaft die Bereitstellung der Funktion über die Statistik-Flash-Software:

y5 = tistat.chi2iwkt(-oo, x, 5) (iwkt = Intervallwahrscheinlichkeit)

Bild 36  Bild 37

Bild 38  Bild 39

Bild 40  Bild 41

Bild 42  Bild 43

Bild 42 und 43: Treppenfunktion der relativen Summenhäufigkeiten (nach der Klassenbildung) und Chi^2-Verteilungsfunktion. Die Treppenfunktion wurde im "Dot"-Modus gezeichnet, um senkrechte Kurvenstücke zu vermeiden und die Unstetigkeitsstellen deutlich sichtbar zu machen.

Eine bessere Bildqualität erhält man über die Parameterdarstellung (ebenfalls im "Dot"-Modus):

xt1(t) = t und yt1(t) = y4(t) , wenn die Schrittweite hinreichend klein gewählt wird (vgl. auch Bild 38 und 39):

Bild 44  Bild 45

Bild 46  Bild 47

Bild 48  Bild 49

Bild 46 zeigt den Statistik-Listen-Editor und die Auswahlmenüs: F5: Wahrscheinlichkeitsverteilungen/Quantile

Zur Wahrscheinlichkeit alpha = 0,05 für den Fehler erster Art: Im Würfelexperiment können auch für den idealen Würfel Chi^2-Testwerte über 11,0705 entstehen und zwar in 5% der Fälle. Dort würde man auf einem Signifikanz-niveau von alpha = 5% die Nullhypothese ablehnen, obwohl mit einem idealen Würfel gewürfelt wurde.

Bild 50  Bild 51

Bild 52  Bild 53

Für die hier betrachteten Hypothesen H0 und HA konnte durch Simulation gezeigt werden, dass in der Tat unter H0 eine Chi^2-verteilte Prüfgröße (5 Freiheitsgrade) entsteht, vgl. Bilder 37, 41 und 43. Hingegen beim "gezinkten" Würfel (unter HA ) zeigten sich deutliche Abweichungen von der ursprünglichen Prüfverteilung, wenn die Prüfgröße weiterhin mit der theoretischen Annahme einer Gleichverteilung berechnet wurde, vgl. Bild 51 mit der Verteilungsfunktion der Prüfverteilung (Chi^2-Verteilung) und der empirischen Verteilungsfunktion der Testwerte für den "gezinkten" Würfel.

In den letzten zwei Bildern wird derjenige Testwert xA = 6,135 berechnet, für den die Wahrscheinlichkeiten alpha = 0,293 und beta = 0,293 der Fehler 1. und 2. Art übereinstimmen. Dazu wurden die Chi^2-Verteilungsfunktion und die (empirische) Differenzfunktion y7(x) = 1 - y6(x) = 1 - P( XA< x ) = P( XA > x ) zum Schnitt gebracht.

Damit gilt für die untersuchten Simulationen:

Fällt die Prüfgröße X kleiner als xA = 6,135 aus, dann ist die Wahrscheinlichkeit für den Fehler 1. Art größer als die Wahrscheinlichkeit für den Fehler 2. Art und man sollte die Nullhypothese nicht ablehnen.

Ergibt sich jedoch mit den Würfeldaten (ein Würfelexperiment mit N Würfen) eine Prüfgröße X größer als xA = 6,135, dann ist die Wahrscheinlichkeit für den Fehler 2. Art größer als die Wahrscheinlichkeit für den Fehler 1. Art und man sollte die Nullhypothese besser ablehnen und davon ausgehen, dass der Würfel "gezinkt" ist.
 

Zur Erinnerung:

Fehler 1. Art: Ablehnung der Nullhypothese, obwohl sie richtig ist.

Fehler 2. Art: Nichtablehnung der Nullhypothese, obwohl die Alternativhypothese richtig ist.

Wegen der langen Rechenzeiten zur Erstellung der Graphen im Parameter-Modus können die Bilder vorzeitig beendet werden (Abbruch der Erstellung der Graphik mit der ON-Taste). Der Schnittpunkt der beiden Graphen wird im Funktions-Modus ermittelt.
 



Beantworten Sie abschließend die Frage:
Ist ein Würfel zu beanstanden, wenn er in 100 Würfen die Augenzahlen 1 bis 6 mit den Häufigkeiten 15, 16, 18, 17, 16, 18 zeigt?

Literaturhinweis:
Aulenbacher, Paditz, Wabel-Frenk:Lehr- und Übungsbuch Mathematik Bd.3
(Teil Stochastik: Beispiel 6.1 und Aufgabe 19.1),
Fachbuchverlag Leipzig 2001 (2.Aufl.) ( ISBN 3-446-21682-0 )
 



 

Die oben angeführten Programme sind aus dem Internet abrufbar,
http://www.informatik.htw-dresden.de/~paditz/images/ ,  indem der entsprechende Dateiname angefügt wird:
 
fairdiep() 

primfreq() 

secufreq() 

defempvf() 

defempfk() 

defchivf() 

defchidf() 

deftrels() 

plot1234() 
unter 

unter 

unter 

unter 

unter 

unter 

unter 

unter 

unter 
fairdiep.9xp (Simulation der Urdatenlisten)

primfreq.9xp (Primäre Häufigkeitsverteilung)

secufreq.9xp (Sekundäre Häufigkeitsverteilung)

defempvf.9xp (Empirische Vert.-fkt. - 1. Simulation)

defempfk.9xp (Empirische Vert.-fkt. - 2. Simulation)

defchivf.9xp (Chi^2-Verteilungsfunktion)

defchidf.9xp (Chi^2-Dichtefunktion)

deftrels.9xp (Treppenfkt. der rel. Summenhäufigkeiten)

plot1234.9xp (Definition und Darstellung von Plots)
bzw. 

bzw. 

bzw. 

bzw. 

bzw. 

bzw. 

bzw. 

bzw. 

bzw. 
FAIRDIEP.TXT 

PRIMFREQ.TXT 

SECUFREQ.TXT 

DEFEMPVF.TXT 

DEFEMPFK.TXT 

DEFCHIVF.TXT 

DEFCHIDF.TXT 

DEFTRELS.TXT 

PLOT1234.TXT 

 

Ludwig Paditz, 18. Mai 2002,

Kontakt per e-mail:  paditz@informatik.htw-dresden.de
 
 

Anhang 1:

Die Teilprogramme als ASCII-Texte:

\START92\
\COMMENT=
\NAME=fairdiep
\FILE=FAIRDIEP.9XP
()
Prgm
\(C)\ keine Parameterliste, Dialogfenster!          Hilfezeile
Lokal a,b,n,e,i,k,d,c,z,seed
Dialog                                     Dialogfenster
 Titel "Wuerfelexperiment"
 DropDown "Fairer W\u..\rfel:",{"Ja (Code=1)","Nein (Code=0)"},a
 Abfrage "Anzahl Experimente ",m
 Abfrage "Wurfanzahl pro Exp.",n
 DropDown "Neustart ZZ-Generator:",{"Ja","Nein"},b
 Abfrage "ggf. Startwert ZZ-G.",seed
EndDlog
2-a\->\a
If b=1 Then
ZufStart Ausdr(seed)
EndIf
Ausdr(m)\->\m                          Anzahl der Experimente
Ausdr(n)\->\n                          Wurfanzahl pro Exp.
n/6\->\e                               theoret. Häufigk. N/6
{a,m,n}\->\fairparm
L\o..\EA
FktAus
defGraph("Labels","Off")
L\o..\Haupt
L\o..\Bild
PlotsAus
Dialog                                     Dialogfenster
Titel "Fairer Wuerfel: Ja oder Nein?"
Text "Code 1 f\u..\r Ja oder Code 0 f\u..\r Nein"
Text "Ihre Auswahl ist"
Text String(a)
Text "Ihre Anzahl der Experimente ist"
Text String(m)
Text "Ihre Wurfanzahl pro Experiment ist"
Text String(n)
EndDlog
If b=1 Then
Dialog                                     Dialogfenster
Titel "Info zum ZZ-Generator"
Text "Neustart des ZZ-Generators mit seed1 ="
Text String(seed1)
Text "Neustart des ZZ-Generators mit seed2 ="
Text String(seed2)
EndDlog
Else
Dialog
Titel "Info zum ZZ-Generator"
Text "Fortsetzung des ZZ-Gen. mit seed2 ="
Text String(seed2)
Text "Fortsetzung des ZZ-Gen. mit seed2 ="
Text String(seed2)
EndDlog
EndIf
EntfVar list1,list2,list3,list4,list5,list6 Löschbefehle

For k,1,m,1
Folge(0,i,1,6,1)\->\list2

For i,1,n,1
If a=1 Then
ZufallZ(6)\->\d                  Simulation einer Augenzahl d
                                 (idealer Würfel)
Else
GanzZahl((ZufallZ(11)+1)/2)\->\d Simulation einer Augenzahl d
                                 (gezinkter Würfel)
EndIf
list2[d]+1\->\list2[d]           Häufigkeitsliste erstellen

EndFor
Summe((list2-e)^2/e)\->\c        einen CHI^2-Wert berechnen

L\o..\EA
Zeige "====================================="
Zeige "Aktuelle Exp.-Nr. =",k
Zeige "Aktueller Chi^2-Wert =",approx(c)          Anzeige aktueller Stand
Zeige "====================================="
runde(c,3)\->\list1[k]

EndFor
L\o..\EA
Zeige "====================================="
Zeige "Ende der Simulation der Chi^2-Werte:"         Anzeige Ende der Simulation
Zeige "Ihre Anzahl der Experimente betrug ",m
Zeige "Ihre Wurfanzahl pro Experiment betrug ",n
Zeige "Ihr Auswahl-Code war",a
Zeige "======================================"
EntfVar list2
EndPrgm
\STOP92\


\START92\          primäre Häufigkeitsverteilung erzeugen
\COMMENT=
\NAME=primfreq
\FILE=PRIMFREQ.9XP
()
Prgm
\(C)\ keine Parametervorgabe, Dialogfenster!
Lokal i,k,kk,list
Dialog                                     Dialogfenster
Titel "primaere Haeufigkeitsverteilung"
Text "Urdatenliste sortiert? Ja!"
Abfrage "Name Variationsreihe",list
EndDlog
Ausdr(list)\->\list1
1\->\i

1\->\k

L\o..\EA
Zeige "======================================"
Zeige "Einen Moment bitte,  ... in Arbeit ..."
Zeige "======================================"
EntfVar list2,list3
list1[1]\->\list2[1]

1\->\list3[1]

While k<Dim(list1)
k+1\->\k

If list1[k]=list1[k-1] Then
list3[i]+1\->\list3[i]

Else
i+1\->\i

list1[k]\->\list2[i]

1\->\list3[i]

EndIf
EndWhile
Zeige "Primfreq ist beendet."
EndPrgm
\STOP92\


\START92\          sekundäre Häufigkeitsverteilung erzeugen
\COMMENT=
\NAME=secufreq
\FILE=SECUFREQ.9XP
()
Prgm
\(C)\ keine  Parameterliste!
Lokal k,l,x
EntfVar list4,list5
Folge(\(-)\.5+x,x,0,GanzZahl(list2[Dim(list2)])+1,1)\->\list4

0\->\list4[1]

Folge(0,x,0,GanzZahl(list2[Dim(list2)])+1,1)\->\list5

For k,1,Dim(list1),1
GanzZahl(list1[k])+2\->\l

list5[l]+1\->\list5[l]

EndFor
list5[2]\->\list5[1]

L\o..\EA
Zeige "======================================"
Zeige "Secufreq ist beendet."
Zeige "======================================"
EndPrgm
\STOP92\


\START92\                 CHI^2-Dichtefunktion bereitstellen
\COMMENT=
\NAME=defchidf
\FILE=DEFCHIDF.9XP
()
Prgm
\(C)\ keine Parametervorgabe, def. y3(x)
EntfVar y3
Definier y3(x)=when(x>0,m*x^(1.5)*\e\^(\(-)\x/2)/(3*\root\(2*\pi\)),0)
ZeiStil 3,"Line"
EndPrgm
\STOP92\


\START92\  CHI^2-Verteilungsfunktion als Integral bereitstellen
\COMMENT=
\NAME=defchivf
\FILE=DEFCHIVF.9XP
()
Prgm
\(C)\ keine Parametervorgabe, def. y2(x)
EntfVar y2
Definier y2(x)=when(x>0,numInt(z^(1.5)*\e\^(\(-)\z/2)/(3*\root\(2*\pi\)),z,0,x),0)
ZeiStil 2,"Line"
EndPrgm
\STOP92\


\START92\  empirische Verteilungsfunktion aus laltpx, laltps erzeugen
\COMMENT=
\NAME=defempvf
\FILE=DEFEMPVF.9XP
()
Prgm
\(C)\ keine Parametervorgabe, def. y1(x)
EntfVar y1
Definier y1(x)=Summe(Folge(when(x\>=\laltpx[k-1] and x<laltpx[k],laltps[k-1],0),k,2,Dim(laltpx),1))/m+when(x\>=\laltpx[Dim(laltpx)],1,0)
ZeiStil 1,"Dot"
EndPrgm
\STOP92\


\START92\  empirische Verteilungsfunktion aus lneupx, lneups erzeugen
\COMMENT=
\NAME=defempfk
\FILE=DEFEMPFK.9XP
()
Prgm
\(C)\ keine Parametervorgabe, def. y6(x)
EntfVar y6
Definier y6(x)=Summe(Folge(when(x\>=\lneupx[k-1] and x<lneupx[k],lneups[k-1],0),k,2,Dim(lneupx),1))/m+when(x\>=\lneupx[Dim(lneupx)],1,0)
ZeiStil 1,"Dot"
EndPrgm
\STOP92\


\START92\  Treppenfunktion der relativen Summenhäufigkeiten für laltsx, laltss
\COMMENT=
\NAME=deftrels
\FILE=DEFTRELS.9XP
()
Prgm
\(C)\ keine Parametervorgabe, def. y4(x)
EntfVar y4
Definier y4(x)=Summe(Folge(when(x\>=\k-1 and x<k,laltss[k],0),k,2,Dim(laltsx)-1,1))/m+when(x\>=\Dim(laltsx)-1,1,0)
ZeiStil 4,"Dot"
EndPrgm
\STOP92\


\START92\             Definition einiger Statistik-Plots
\COMMENT=
\NAME=plot1234
\FILE=PLOT1234.9XP
()
Prgm
\(C)\ Definition der Statistik-Plots
Dialog
Titel "Definition der Statistik-Plots"
Text "Chi^2-Dichtefunkt. definiert? Ja!"
EndDlog
PlotsAus
L\o..\Bild
L\o..\Graph
L\o..\EA
FktAus
NeuPlot 1,4,laltpx,,laltpf,,,1
PlotsEin 1
ZeigGraf
Pause
NeuPlot 2,2,laltsx,laltsf,,,,4,1
PlotsAus 1
PlotsEin 2
ZeigGraf
Pause
ZchFkt y3(x)
Pause
NeuPlot 3,4,lneupx,,lneupf,,,1
PlotsAus
PlotsEin 3
ZeigGraf
Pause
NeuPlot 4,2,lneusx,lneusf,,,,4,1
PlotsAus 3
PlotsEin 4
ZeigGraf
Pause
NeuPlot 5,5,laltpx,,laltpf,,,4,1
PlotsAus 4
PlotsEin 5,1
ZeigGraf
Pause
NeuPlot 6,5,lneupx,,lneupf,,,4,1
PlotsAus 5,1
PlotsEin 6,3
ZeigGraf
Pause
EndPrgm
\STOP92\



 

Anhang 2: Datenlisten

Die erzeugten Datenlisten sind laltur bzw. lneuur und werden hier in bereits sortierter Form als Variationsreihen angegeben:

laltur:  300 CHI^2-Daten aus Experimenten mit einem simulierten idealen Würfel in aufsteigender Reihenfolge sortiert
0.32
0.44
0.44
0.44
0.44
0.56
0.80
0.92
0.92
0.92
0.92
0.92
1.04
1.04
1.16
1.16
1.16
1.16
1.16
1.28
1.28
1.40
1.40
1.40
1.52
1.52
1.52
1.64
1.64
1.64
1.76
1.76
1.76
1.76
1.76
1.76
1.76
1.88
1.88
1.88
1.88
1.88
1.88
1.88
2.00
2.00
2.00
2.00
2.12
2.24
2.24
2.24
2.36
2.36
2.36
2.36
2.36
2.36
2.36
2.36
2.48
2.48
2.48
2.48
2.48
2.6
2.6
2.6
2.6
2.6
2.6
2.6
2.6
2.72
2.72
2.72
2.72
2.72
2.72
2.72
2.84
2.84
2.84
2.84
2.84
2.84
2.96
2.96
2.96
2.96
2.96
2.96
3.08
3.08
3.20
3.20
3.20
3.20
3.32
3.32
3.32
3.32
3.32
3.32
3.32
3.32
3.44
3.44
3.44
3.44
3.44
3.44
3.44
3.44
3.56
3.56
3.56
3.56
3.56
3.56
3.68
3.68
3.68
3.68
3.68
3.80
3.80
3.80
3.80
3.80
3.80
3.80
3.80
3.80
3.92
3.92
3.92
4.04
4.04
4.04
4.04
4.04
4.04
4.04
4.04
4.04
4.04
4.04
4.04
4.16
4.16
4.16
4.16
4.16
4.28
4.28
4.28
4.28
4.28
4.28
4.40
4.40
4.40
4.40
4.40
4.40
4.52
4.52
4.52
4.64
4.64
4.64
4.64
4.64
4.64
4.64
4.64
4.64
4.76
4.76
4.88
4.88
4.88
4.88
4.88
4.88
5.00
5.00
5.00
5.00
5.00
5.00
5.00
5.00
5.00
5.00
5.12
5.12
5.12
5.12
5.12
5.12
5.12
5.24
5.36
5.48
5.48
5.48
5.48
5.48
5.60
5.60
5.60
5.60
5.60
5.72
5.72
5.84
5.96
5.96
5.96
6.08
6.08
6.08
6.20
6.20
6.20
6.20
6.32
6.44
6.44
6.44
6.56
6.80
6.80
6.80
6.80
6.92
6.92
6.92
6.92
7.04
7.04
7.04
7.04
7.16
7.16
7.28
7.28
7.40
7.40
7.52
7.52
7.64
7.64
7.76
7.88
8.00
8.12
8.24
8.24
8.48
8.48
8.60
8.60
8.72
8.84
8.84
8.84
8.84
8.96
8.96
8.96
9.20
9.20
9.44
9.44
9.44
9.56
9.68
9.80
9.92
9.92
10.28
10.28
11.12
11.36
11.84
11.96
12.32
12.44
13.04
13.28
13.40
13.40
13.88
15.20
17.60
19.52
19.64

lneuur:   300 CHI^2-Daten aus Experimenten mit einem simulierten "gezinkten" Würfel in aufsteigender Reihenfolge sortiert
0.68
0.92
0.92
2.12
2.12
2.12
2.24
2.24
2.60
2.60
2.60
2.84
2.96
3.08
3.20
3.20
3.20
3.20
3.32
3.32
3.44
3.44
3.44
3.44
3.56
3.56
3.68
3.68
3.80
4.04
4.04
4.04
4.04
4.04
4.16
4.16
4.16
4.16
4.28
4.28
4.28
4.40
4.40
4.40
4.52
4.52
4.64
4.64
4.64
4.76
4.76
4.76
5.00
5.00
5.00
5.00
5.00
5.12
5.24
5.36
5.36
5.36
5.36
5.48
5.48
5.48
5.48
5.48
5.48
5.48
5.60
5.60
5.60
5.72
5.84
5.84
5.96
5.96
5.96
5.96
6.08
6.08
6.08
6.08
6.08
6.08
6.08
6.08
6.20
6.32
6.32
6.44
6.56
6.56
6.56
6.56
6.68
6.68
6.68
6.68
6.80
6.80
6.80
6.92
6.92
6.92
7.04
7.04
7.04
7.04
7.16
7.16
7.16
7.28
7.28
7.28
7.28
7.40
7.40
7.40
7.40
7.52
7.52
7.52
7.64
7.64
7.76
7.76
7.76
7.76
7.88
7.88
7.88
7.88
7.88
8.12
8.12
8.12
8.12
8.24
8.24
8.24
8.36
8.36
8.36
8.36
8.36
8.36
8.48
8.48
8.48
8.48
8.60
8.60
8.60
8.72
8.72
8.72
8.84
8.84
8.84
8.84
8.96
8.96
8.96
8.96
9.08
9.08
9.08
9.20
9.32
9.32
9.44
9.44
9.44
9.56
9.56
9.56
9.56
9.56
9.56
9.68
9.68
9.68
9.68
9.80
9.92
9.92
9.92
10.04
10.16
10.16
10.28
10.28
10.28
10.28
10.40
10.40
10.40
10.52
10.52
10.52
10.64
10.64
10.76
10.76
10.76
10.88
10.88
10.88
10.88
11.00
11.00
11.12
11.12
11.12
11.12
11.12
11.12
11.24
11.24
11.36
11.48
11.48
11.48
11.48
11.60
11.60
11.72
11.84
11.84
11.84
11.96
11.96
11.96
12.08
12.20
12.32
12.32
12.44
12.44
12.44
12.56
12.56
12.56
12.56
12.56
12.68
12.68
12.68
12.80
12.80
12.80
12.92
12.92
13.04
13.04
13.04
13.28
13.28
13.28
13.40
13.40
13.40
13.64
13.64
13.76
13.76
13.88
14.00
14.12
14.24
14.48
14.48
14.48
14.48
14.72
14.72
14.84
14.84
15.20
15.20
15.20
15.56
15.56
16.04
16.16
16.16
16.52
16.64
16.76
17.00
17.24
17.48
18.08
18.68
18.92
19.16
20.60
20.72


primäre Häufigkeitsverteilung mit den Listen laltpx, laltpf und laltps (verbundene Datenlisten mit jeweils 91 Einzeldaten):
laltpx
 

CHI^2-Wert

 laltpf

Einzel-
häufigkeit

laltps

Summen-
häufigkeit

laltpx
 

CHI^2-Wert

 laltpf

Einzel-
häufigkeit

laltps

Summen-
häufigkeit

laltpx
 

CHI^2-Wert

 laltpf

Einzel-
häufigkeit

laltps

Summen-
häufigkeit

0.32
0.44
0.56
0.80
0.92
1.04
1.16
1.28
1.40
1.52
1.64
1.76
1.88
2.00
2.12
2.24
2.36
2.48
2.60
2.72
2.84
2.96
3.08
3.20
3.32
3.44
3.56
3.68
3.80
3.92
1.
4.
1.
1.
5.
2.
5.
2.
3.
3.
3.
7.
7.
4.
1.
3.
8.
5.
8.
7.
6.
6.
2.
4.
8.
8.
6.
5.
9.
3.
1.
5.
6.
7.
12.
14.
19.
21.
24.
27.
30.
37.
44.
48.
49.
52.
60.
65.
73.
80.
86.
92.
94.
98.
106.
114.
120.
125.
134.
137.
4.04
4.16
4.28
4.40
4.52
4.64
4.76
4.88
5.00
5.12
5.24
5.36
5.48
5.60
5.72
5.84
5.96
6.08
6.20
6.32
6.44
6.56
6.80
6.92
7.04
7.16
7.28
7.40
7.52
7.64
12.
5.
6.
6.
3.
9.
2.
6.
10.
7.
1.
1.
5.
5.
2.
1.
3.
3.
4.
1.
3.
1.
4.
4.
4.
2.
2.
2.
2.
2.
149.
154.
160.
166.
169.
178.
180.
186.
196.
203.
204.
205.
210.
215.
217.
218.
221.
224.
228.
229.
232.
233.
237.
241.
245.
247.
249.
251.
253.
255.
7.76
7.88
8.00
8.12
8.24
8.48
8.60
8.72
8.84
8.96
9.20
9.44
9.56
9.68
9.80
9.92
10.28
11.12
11.36
11.84
11.96
12.32
12.44
13.04
13.28
13.40
13.88
15.20
17.60
19.52
19.64
1.
1.
1.
1.
2.
2.
2.
1.
4.
3.
2.
3.
1.
1.
1.
2.
2.
1.
1.
1.
1.
1.
1.
1.
1.
2.
1.
1.
1.
1.
1.
256.
257.
258.
259.
261.
263.
265.
266.
270.
273.
275.
278.
279.
280.
281.
283.
285.
286.
287.
288.
289.
290.
291.
292.
293.
295.
296.
297.
298.
299.
300.

Hinweis:
Immerhin 221 von 300 Daten (73,7%) aus idealen Würfelexperimenten fallen kleiner als 6 aus!
Also in nur 79/300 * 100% = 26,3% der Experimente versagt der ideale Würfel und erweckt den Eindruck, dass er nicht ideal sei, wenn das CHI^2-Quantil 6,00 das Entscheidungskriterium wäre (führt zum Fehler 1. Art).
 

primäre Häufigkeitsverteilung mit den Listen lneupx,lneupf und lneups (verbundene Datenlisten mit jeweils 115 Einzeldaten):
lneupx
 

CHI^2-Wert

 lneupf

Einzel-
häufigkeit

lneups

Summen-
häufigkeit

lneupx
 

CHI^2-Wert

 lneupf

Einzel-
häufigkeit

lneups

Summen-
häufigkeit

lneupx
 

CHI^2-Wert

 lneupf

Einzel-
häufigkeit

lneups

Summen-
häufigkeit

0.68
0.92
2.12
2.24
2.60
2.84
2.96
3.08
3.20
3.32
3.44
3.56
3.68
3.80
4.04
4.16
4.28
4.40
4.52
4.64
4.76
5.00
5.12
5.24
5.36
5.48
5.60
5.72
5.84
5.96
6.08
6.20
6.32
6.44
6.56
6.68
6.80
6.92
7.04
1.
2.
3.
2.
3.
1.
1.
1.
4.
2.
4.
2.
2.
1.
5.
4.
3.
3.
2.
3.
3.
5.
1.
1.
4.
7.
3.
1.
2.
4.
8.
1.
2.
1.
4.
4.
3.
3.
4.
1.
3.
6.
8.
11.
12.
13.
14.
18.
20.
24.
26.
28.
29.
34.
38.
41.
44.
46.
49.
52.
57.
58.
59.
63.
70.
73.
74.
76.
80.
88.
89.
91.
92.
96.
100.
103.
106.
110.
7.16
7.28
7.40
7.52
7.64
7.76
7.88
8.12
8.24
8.36
8.48
8.60
8.72
8.84
8.96
9.08
9.20
9.32
9.44
9.56
9.68
9.80
9.92
10.04
10.16
10.28
10.40
10.52
10.64
10.76
10.88
11.00
11.12
11.24
11.36
11.48
11.60
11.72
11.84
3.
4.
4.
3.
2.
4.
5.
4.
3.
6.
4.
3.
3.
4.
4.
3.
1.
2.
3.
6.
4.
1.
3.
1.
2.
4.
3.
3.
2.
3.
4.
2.
6.
2.
1.
4.
2.
1.
3.
113.
117.
121.
124.
126.
130.
135.
139.
142.
148.
152.
155.
158.
162.
166.
169.
170.
172.
175.
181.
185.
186.
189.
190.
192.
196.
199.
202.
204.
207.
211.
213.
219.
221.
222.
226.
228.
229.
232.
11.96
12.08
12.20
12.32
12.44
12.56
12.68
12.80
12.92
13.04
13.28
13.40
13.64
13.76
13.88
14.00
14.12
14.24
14.48
14.72
14.84
15.20
15.56
16.04
16.16
16.52
16.64
16.76
17.00
17.24
17.48
18.08
18.68
18.92
19.16
20.60
20.72

 

3.
1.
1.
2.
3.
5.
3.
3.
2.
3.
3.
3.
2.
2.
1.
1.
1.
1.
4.
2.
2.
3.
2.
1.
2.
1.
1.
1.
1.
1.
1.
1.
1.
1.
1.
1.
1.

 

235.
236.
237.
239.
242.
247.
250.
253.
255.
258.
261.
264.
266.
268.
269.
270.
271.
272.
276.
278.
280.
283.
285.
286.
288.
289.
290.
291.
292.
293.
294.
295.
296.
297.
298.
299.
300.

 

Hinweis zur Simulation:
Nur 80 von 300 "gezinkten" Daten fallen kleiner als 6 aus!
Also in 80/300 * 100% = 26,7% der Experimente hinterläßt der "gezinkte" Würfel den Eindruck, dass er ideal sei, wenn das CHI^2-Quantil 6,00 das Entscheidungskriterium wäre (führt zum Fehler 2. Art).
In 220 von 300 Fällen  (73,3%) überschreitet der CHI^2-Wert für ein "gezinktes" Würfelexperiment den kritischen Wert 6,00.


sekundäre Häufigkeitsverteilung mit den Listen laltsx, laltsf und laltss (verbundene Datenlisten mit jeweils 21 Einzeldaten, kumSum(laltsf)-laltsf[1] = laltss ) sowie
sekundäre Häufigkeitsverteilung mit den Listen lneusx, lneusf und lneuss (verbundene Datenlisten mit jeweils 22 Einzeldaten,  kumSum(lneusf)-lneusf[1] = lneuss ),
wobei der Anfangswert 0 in laltsx bzw. lneusx die Reduktionslage zur Klasseneinteilung (Klassenbreite = 1) angibt und die verbundenen Datenlisten (laltsx, laltsf) bzw. (lneusx, lneusf) zur Darstellung des Häufigkeitspolygons (= geglättetes Histogramm) ausgenutzt werden (vgl. Programm plot1234):
laltsx

CHI^2-Wert
(Klassenmitte)

 laltsf

Einzel-
häufigkeit

laltss

Summen-
häufigkeit

 
lneusx

CHI^2-Wert
(Klassenmitte)

 lneusf

Einzel-
häufigkeit

lneuss

Summen-
häufigkeit

( 0. )
0.5
1.5
2.5
3.5
4.5
5.5
6.5
7.5
8.5
9.5
10.5
11.5
12.5
13.5
14.5
15.5
16.5
17.5
18.5
19.5
( 12. )
12.
32.
48.
45.
49.
35.
20.
16.
16.
10.
2.
4.
2.
5.
0.
1.
0.
1.
0.
2.
( 0. )
12.
44.
92.
137.
186.
221.
241.
257.
273.
283.
285.
289.
291.
296.
296.
297.
297.
298.
298.
300.
 
( 0. )
0.5
1.5
2.5
3.5
4.5
5.5
6.5
7.5
8.5
9.5
10.5
11.5
12.5
13.5
14.5
15.5
16.5
17.5
18.5
19.5
20.5
( 3. )
3.
0.
10.
16.
23.
28.
26.
29.
31.
23.
22.
24.
20.
14.
11.
5.
6.
3.
3.
1.
2.
(0. )
3.
3.
13.
29.
52.
80.
106.
135.
166.
189.
211.
235.
255.
269.
280.
285.
291.
294.
297.
298.
300.

Einige statistische Grafiken, die teilweise mit der Chi^2-Dichtefunktion überlagert werden:

Bild 29  Bild 30

Bild 29 und 30: Histogramm und Häufigkeitspolygon für den idealen Würfel

Bild 31  Bild 32

Bild 31 und 32: Häufigkeitspolygon und Chi^2-Dichtefunktion für den idealen Würfel, sowie ein Boxplot.
 

Bild 33  Bild 34

Bild 33 und 34: Histogramm und Häufigkeitspolygon für den "gezinkten" Würfel - Eine Chi^2-Dichtefunktion ist nicht mehr erkennbar (Rechtsverschiebung des Histogramms deutet auf zu große Chi^2-Werte unter H0 (Nullhypothese: idealer Würfel) hin).

Bild 35: Histogramm und Boxplot für den gezinkten Würfel.



 

Anhang 3: Formeln

Die Dichtefunktion y3 der Prüfverteilung ist eine CHI^2-Dichtefunktion mit 5 Freiheitsgraden

Bild B1  Bild B2

Die Dichtefunktion wurde im Equation Writer (eine neue Flash-Software des TI-92Plus) vergrößert dargestellt.
Der Flächeninhalt unter der Dichtefunktion beträgt 1 (Gesamtwahrscheinlichkeit) bzw. m ( = 300, Gesamthäufigkeit):

Bild B3  Bild B4



 

Die CHI^2-Verteilungsfunktion y2 (mit 5 Freiheitsgraden) zur Dichtefunktion y3 (mit m = 1) als numerisches Integral:

Bild B5  Bild B6

Einfacher ist die Definition der CHI^2-Dichte- (y8) und CHI^2-Verteilungsfunktion (y5) mithilfe der Statistik-Flash-Software:

Bild B7  Bild B8



 

Die empirische Verteilungsfunktion (eine rechtsseitig stetige Treppenfunktion) y1 wird über die primäre Häufigkeitsverteilung mithilfe der Listen laltpx und laltpf (bzw. laltps) wie folgt definiert:

Bild B9  Bild B10 (vergrößert)

Bild 37  Bild 39 (vergrößert)



 

Die Treppenkurve y4 der relativen Summenhäufigkeiten (eine rechtsseitig stetige Treppenfunktion) für die Daten des idealen Würfels wird über die sekundäre Häufigkeitsverteilung mithilfe der Listen laltsx und laltsf (bzw. laltss) wie folgt definiert:

Bild B11  Bild B12 (vergrößert)

Bild 42  Bild 45 (mit Parameterdarst.)

Die Treppenkurve der relativen Summenhäufigkeiten (Bild 42) wurde im "Dot"-Modus gezeichnet, um senkrechte Kurvenstücke zu vermeiden und die Unstetigkeitsstellen deutlich sichtbar zu machen. Das verbesserte Bild 45 ist zeitaufwendig in der Darstellung.



 

Die empirische Verteilungsfunktion y6 (eine rechtsseitig stetige Treppenfunktion) für die Daten des "gezinkten" Würfels wird über die primäre Häufigkeitsverteilung mithilfe der Listen lneupx und lneupf (bzw. lneups) wie folgt definiert:

Bild B13 Bild B14 (vergrößert)

Bild B15 (Treppenkurve für die "gezinkten" Würfeldaten, vgl. auch Bild 37)

Wegen der im allgemeinen größeren CHI^2-Werte ("gezinkter" Würfel) verschiebt sich die Treppenkurve nach rechts.



 

Zur Betrachtung der Fehlerwahrscheinlichkeiten zum Fehler 1.Art bzw. Fehler 2.Art wird statt y6 die monoton fallende empirische Funktion y7 = 1 - y6 betrachtet und mit der monoton wachsenden (theoretisch korrekten) Verteilungsfunktion der CHI^2-Daten eines idealen Würfels zum Schnitt gebracht:

Bild 52  Bild 53 (Ausschnitt)
 

Für den Schnittpunkt (xA, yA) gilt

y1( xA ) = P( CHI^2ideal  <  xA ) = yA = 0,707       und  1 - y6( xA ) = P( CHI^2gezinkt  >  xA ) = yA = 0,707  ,

d.h.

1 - y1( xA ) = 1 - P( CHI^2ideal  <  xA) P( CHI^2ideal  >  xA = 6,135 ) = alpha = 0,293

(Wahrscheinlichkeit für den Fehler 1. Art)
und

y6( xA ) = P( CHI^2gezinkt  <  xA = 6,135 ) 1 - P( CHI^2gezinkt  >  xA = 6,135 ) = beta = 0,293

(Wahrscheinlichkeit für den Fehler 2. Art)


 

Damit lautet das Entscheidungskriterium für einen im Experiment festgestellten CHI^2-Wert (wenn man den Würfel nicht genauer kennt und nur die oben betrachteten Wahrscheinlichkeitsverteilungen in Betracht kommen):

Fällt die Prüfgröße X kleiner als xA = 6,135 aus, dann ist die Wahrscheinlichkeit für den Fehler 1. Art größer als die Wahrscheinlichkeit für den Fehler 2. Art und man sollte die Nullhypothese (idealer Würfel, Augenzahlen haben gleiche Chancen) nicht ablehnen.

Ergibt sich jedoch mit den Würfeldaten (ein Würfelexperiment mit N Würfen) eine Prüfgröße X größer als xA = 6,135, dann ist die Wahrscheinlichkeit für den Fehler 2. Art größer als die Wahrscheinlichkeit für den Fehler 1. Art und man sollte die Nullhypothese besser ablehnen und davon ausgehen, dass der Würfel im oben dargestellten Sinn (Augenzahl 6 benachteiligt, die anderen Augenzahlen haben jeweils die doppelte Chance gewürfelt zu werden) "gezinkt" ist.


Zur Erinnerung:

Fehler 1. Art: Ablehnung der Nullhypothese, obwohl sie richtig ist.

Fehler 2. Art: Nichtablehnung der Nullhypothese, obwohl die Alternativhypothese richtig ist.