HTW Dresden (FH)                                                                                                                                                                           24.11.2001
FB Informatik/Mathematik
Prof. Dr. L. Paditz

Arbeitsblatt zur Statistik - 18.HA im Fernstudium (Kommunikationstechnik, Jahrgang 2000)
Warum die Statistik nicht zur absoluten Wahrheit führt, jedoch die Kritikfähigkeit fördert:

Quelle/Programmidee:
Edwards, C.C.: Does a TI-8x Cast a Fair Die? in: Eightysomething!, Vol. 6, No.3, 1997, p. 9-10.

siehe Internet: http://www.ti.com/calc/docs/act83stat.htm oder als PDF-File.

Aulenbacher, Paditz, Wabel-Frenk: Lehr- und Übungsbuch Mathematik Bd.3 (Teil Stochastik: Beispiel 6.1 und Aufgabe 19.1),
Fachbuchverlag Leipzig, 2. Aufl. 2001 ( ISBN 3-446-21682-0)

Übung:
Interaktives Arbeiten mit dem TI-89 unter Nutzung von Programmen für gewisse Teilschritte und Ausführung von Zwischenschritten durch
Direkteingabe von TR-Befehlen. Alle Rechnerergebnisse/Grafiken sind schriftl. zu protokollieren.

Inhalt:
Auf der Grundlage von M (z.B. M=300) Würfelexperimenten, wobei in jedem Experiment N (z.B. N=100) Augenzahlen simuliert werden
sollen, errechnet man gemäß dem Chi-Quadrat-Anpassungstest M Chi-Quadrat-verteilte Testgrößen. Die Auswertung dieser Testgrößen im
Histogramm wird mit der Chi-Quadrat-Dichte-Funktion als statistische Prüfverteilung des Chi-Quadrat-Anpassungstests verglichen.

Schließlich werden weitere statistische Untersuchungen mit dem simulierten Datenmaterial durchgeführt.

Aufgaben:
1a) Erstellen Sie ein TR-Programm zur Erzeugung von M=300 Chi-Quadrat-verteilten Zufallszahlen (Parameter der Chi-Quadrat-Ver-
      teilung: 5 Freiheitsgrade) auf der Grundlage von jeweils N=100 Würfen eines Würfels (vgl. Bsp. 6.1 u. Statistik-Aufg. 19.10 im LÜB
      Bd. 3). Benutzen Sie dazu das unter angegebene TI-89-Programm fairdie9(code,m,n) für Ihren TR. Am Ende der Datensimulation mö-
      gen die M simulierten Daten in der Urliste list1 abgespeichert sein.
      Hinweis: Rechenzeit ca. 15 min. (TI-89: 10MHz Prozessor-Chip), mit dem RandSeed-Befehl kann der Zufallszahlengenerator an einer
      festen Stelle gestartet werden, womit eine bestimmte Simulation reproduziert werden kann.
  b) Erzeugen Sie aus der Urliste list1 die zugehörige Variationsreihe und speichern Sie diese wieder in list1 ab!
      Hinweis: Sortierungsbefehl für die aufsteigende Reihenfolge: SortA list1 )

2a) Erzeugen Sie nun die primäre Häufigkeitstabelle, wobei list2 die geordneten Meßwerte und list3 die zugehörigen absoluten Häufig-
      keiten enthalten soll. Nutzen Sie dazu das unten angegeben Programm primfreq(list1). Sichern Sie list2 und list3 in loldpx und loldpf.
  b) Speichern Sie nun die (absoluten) Summenhäufigkeiten in die Datenliste loldps ab!
      Hinweis: CumSum(list3) /STO/ loldps .
  c) Stellen Sie die empirische Verteilungsfunktion y1 als rechtsseitig stetige Treppenfunktion und die theoretische c25 -Verteilungsfunk-
      tion (y2) im TR-Display grafisch dar. Nutzen Sie zur Definition dieser Funktionen die Hilfsprogramme defempvf( ) und defchivf( ).

      die1_0_1.gif Bild 1: defempvf( )  die1_0_2.gif Bild 2: defchivf( )

      Für die unstetige Treppenfunktion muß der Grafik-Modus "Dot" vereinbart werden, um im Graphen senkrechte Linien zu vermeiden.
      Die c25 -Verteilungsfunktion wird numerisch über ein unbestimmtes Integral definiert. Die angekündigte Applikationssoftware zur
      Statistik mit dem TI-89 wird hier vorteilhaft einen Befehl für diese Verteilungsfunktion enthalten (seit Dezember 1999 im TI-Internet)!
      Genauere grafische Darstellungen im Dot-Modus erhält man über die Parameterdarstellung von y1(x) als xt1(t)=t und yt1(t)=y1(t) :
      (Mit der Schrittweitensteuerung für t wird die gewünschte Zeichengenauigkeit erreicht, übereinanderliegende Pixel treten dabei wegen
      der zu geringen Bildschirmauflösung auf. Da jeder Bildpunkt des Graphen ausgerechnet wird, sind die Rechenzeiten sehr hoch.)
 

      die1_3_6.gif     die1_3_2.gif     die1_1_1.gif
      Bild 3: WINDOW                                            Bild 4: c25 -Verteilungsfunktion                  Bild 5: empir. Verteilungsfunktion

      Eine Überlagerung von Bild 4 und Bild 5 läßt erkennen, daß die simulierten Zufallszahlen annähernd einer c25 -Verteilung genügen.
      Dies ist dann der Fall, wenn der simulierte Würfel unverfälschte gleichverteilte Augenzahlen realisiert hat, andernfalls würde sich die
      c25 -Verteilung als sogenannte statistische Prüfverteilung nicht einstellen.
      Im folgenden Bildausschnitt wird durch Vergrößerung die Treppengestalt der empirischen Verteilungsfunktion deutlich:

      die1_1_5.gif     die1_1_2.gif     die1_1_3.gif
      Bild 6: empir. Verteilungsfunktion                Bild 7: Bildausschnitt                                    Bild 8: WINDOW zu Bild 7

3a) Erzeugen Sie nun eine sekundäre Häufigkeitstabelle (Klassenbreite 1, Reduktionslage 0) mit dem Programm secufreq( ). Die Klas-
      senmitten sollen in Liste list4 und die zugehörigen Klassenhäufigkeiten in Liste list 5 abgespeichert werden. Anschließend werden
      diese Datenlisten in loldsx und loldsf gesichert.
      Hinweis: list4 enthält gemäß dem Programm secufreq( ) als erstes Element zusätzlich die Koordinate 0 für den Anfangspunkt des Häu-
      figkeitspolygons, dessen ,Knickpunkte" dann in list4, list5 stehen, wobei list5[1] = list5[2] festgelegt wird.
  b) Stellen Sie das Histogramm zu loldpx und loldpf (Plot1) und das zugehörige Häufigkeitspolygon (Plot2 mittels loldsx und loldsf)
      grafisch dar, einschließlich der c25 -Dichtefunktion (y3), wobei die c25 -Dichtefunktion über das Programm defchidf( ) definiert werden
      kann.

      die1_0_5.gif     die1_2_1.gif     die1_2_2.gif
      Bild 9: c 25 -Dichtefunktion                          Bild 10: WINDOW für Plots                           Bild 11: Plot-Einstellungen

      die1_2_3.gif     die1_2_4.gif     die1_2_5.gif
      Bild 12: Histogramm (F3: Trace)                   Bild 13: Häufigkeitspolygon (mit F3)            Bild 14: defchidf ( )

      die1_2_8.gif     die1_2_6.gif     die1_2_7.gif
      Bild 15: WINDOW                                          Bild 16: Überlagerung Bild 12 und 13           Bild 17: Überlagerung Bild 12 und 14

4)   Stellen Sie die Treppenkurve der relativen Summenhäufigkeiten (y4) (Grafikmodus "Dot") und erneut die theoretische Verteilungs-
      funktion (y2) graphisch dar. Die (absoluten) Summenhäufigkeiten sollen in der Liste loldss abgespeichert sein.
      Hinweis: CumSum(list5) - list5[1] /STO/ loldss
      Die Treppenkurve der rel. Summenhäufigkeiten wird durch das Programm deftrels( ) definiert (dann Parameter-Modus, s.o.):
      die1_0_6.gif     die1_3_1.gif     die1_3_3.gif
      Bild 18: deftrels( )                                            Bild 19: Treppenkurve der rel. Sum.-h.       Bild 20: Überlagerung mit der c25 -VF

5)   Simulation des "gezinkten" Würfels mit pk = 2/11 , k=1(1)5, p6 = 1/11 (Die "6" ist gegenüber den anderen Augenzahlen benachteiligt!)
      Nutzen Sie dazu das bereits oben erwähnte Programm faidie9(code,m,n) mit dem code=0 .
      Im Programm fairdie9(code,m,n) wird lediglich die Zeile rand(6) /STO/ d ersetzt durch int((rand(11)+1)/2) /STO/ d ersetzt.

      Die Aufgabenschritte 1) bis 4) sind zu wiederholen, wobei vorher die Listen list2 bis list5 in den Listen loldpx, loldpf bzw. loldsx, loldsf
      gerettet werden. Entsprechend werden die Listen jetzt in lnewpx, lnewpf, lnewps bzw. lnewsx, lnewsf, lnewss abgespeichert.

      die1_4_1.gif     die1_4_2.gif     die1_4_3.gif
      Bild 21: Start "gezinkter" Würfel                   Bild 22: Sicherung in neuen Listen              Bild 23: Sicherung in neuen Listen

      y5 (empir. VF bei "gezinktem" Würfel) und y6 (Treppenkurve der rel. Summenhäufigkeiten bei "gezinktem" Würfel) entstehen aus y1 bzw.
      y4, wobei hier stets "lold.." durch "lnew.." zu ersetzen ist.
      Die statistischen Grafiken Plot3 (Histogramm) und Plot4 (Häufigkeitspolygon) entstehen analog zu den Grafiken Plot1 und Plot2, indem
      wieder stets "lold.." durch "lnew.." zu ersetzen ist. Die Definition der statistischen Grafiken kann mit dem Programm plot1234( ) erfolgen,
      sofern alle benötigten Listen erzeugt worden sind. Die darzustellenden Plots können dann auch über das Y= - Menü beliebig ein- oder aus-
      geschaltet werden (F4-Taste), ebenso die statistischen Funktionen y1 bis y6.

6)   Untersuchen Sie die Wahrscheinlichkeit ß für den Fehler 2. Art im Experiment fairdie9(code,m,n), code=1, (Irrtumswahrscheinlichkeit
      a =5%, dann 10%), wenn die Alternative im Würfel (code=0), vgl. 5) besteht. Für welches a gilt hier a = ß ? Zugehöriges Quantil c 25,1-a
      angeben. Ermitteln Sie dazu grafisch den Schnittpunkt von y2 und y7 = 1-y5 . Sichern Sie alle Funktionen in der Datenbasis GDB1.

      die1_5_1.gif     die1_5_2.gif     die1_5_3.gif
      Bild 24: Schnittpunkt von y2 und y7           Bild 25: Schnittpunkt (Ausschnitt)              Bild 26: Ausschnitt (vergrößert)

7)   Schätzen Sie aus den Daten (lold..) empir. Mittelwert und empir. Streuung und vergleichen Sie mit den entsprechenden statistischen Kenn-
      zahlen einer theoretischen c25 -Verteilung. Stellen Sie schließlich Histogramm (Plot1) und Boxplot (Plot5) für die alte Simulation (loldpx,
      loldpf) bzw. für die neue Simulation (Histogramm Plot3 und Boxplot Plot6 mit lnewpx, lnewpf) jeweils in einer Grafik dar.

      die1_4_7.gif     die1_4_8.gif     die1_4_9.gif
      Bild 27: statistische Kennzahlen                  Bild 28: Anzeige der Kennzahlen                  Bild 29: Anzeige der Kennzahlen

      die1_4_6.gif     die1_4_4.gif     die1_4_5.gif
      Bild 30: WINDOW                                         Bild 31: modif. Boxplot/Histogramm (old)   Bild 32: modif. Boxplot/Histogramm (new)

8)  Beantworten Sie abschließend die Frage: Ist ein Würfel zu beanstanden, wenn er in 100 Würfen die Augenzahlen 1 bis 6 mit den Häufig-
     keiten 15, 16, 18, 17, 16, 18 (vgl. LÜB Bd.3, Beisp. 6.1 bzw. Aufg. 19.10) zeigt?

 Die oben angeführten Programme sind aus dem Internet abrufbar:

fairdie9(code,m,n)
primfreq(list1)
secufreq( )
defempvf( )
defchivf( )
defchidf( )
deftrels( )
plot1234( )

unter
unter
unter
unter
unter
unter
unter
unter

fairdie9.89p
primfreq.89p
secufreq.89p
defempvf.89p
defchivf.89p
defchidf.89p
deftrels.89p
plot1234.89p

bzw.
bzw.
bzw.
bzw.
bzw.
bzw.
bzw.
bzw.

fairdie9.txt
primfreq.txt
secufreq.txt
defempvf.txt
defchivf.txt
defchidf.txt
deftrels.txt
plot1234.txt

 Ein Programmvariante zum TI-83 mit weiteren Hinweisen (z.B. PC-Variante unter Windows 3.1 bzw. Windows 95) findet man unter der
 Internetadresse: http://www.informatik.htw-dresden.de/~paditz/fairdti2.html

 (Hinweis zum engl. Text: NCTM bedeutet: National Council of Teachers of Mathematics )