Sharp-Taschenrechner EL-9600


Normalverteilungs-Quantil-Quantil-Plot
(statistische Grafik vom Typ "N.P.")


Das Normalverteilungs-Quantil-Quantil-Plot wird im deutschen Bedienhandbuch zum EL-9600 auf S. 167 abweichend von den in der Statistik üblichen Begriffen etwas unzutreffend als "Normalwahrscheinlichkeits-Diagramm" bezeichnet. Damit bleibt zunächst unklar, welche statistische Grafik sich hinter dem "Normalwahrscheinlichkeits-Diagramm" einer konkreten Stichprobe L1 = { x1, x2, ..., xn } verbirgt.

Im Bedienhandbuch findet man dazu die wenig hilfreichen Erläuterungen:

Im ANHANG des Bedienhandbuches auf S. 331 wird die statistische Grafik-Funktion des EL-9600 vom Typ N.P. wie folgt beschrieben
(z.B. hinsichtlich des Untermenüs Norm * - X ):
Damit ist das Bedienhandbuch für den Nutzer des hochwertigen Grafik-Taschenrechners EL-9600 keine Hilfe. Im Gegenteil, der Leser wird verunsichert und zweifelt an seinen eigenen Statistik-Kenntnissen, da er den Ausführungen des Handbuches nicht folgen kann. Einen anderen Internetbeitrag zum Thema "Ärger mit dem deutschen Bedienhandbuch - Ärger mit der Statistik" (auch aus pädagogisch-didaktischer Sicht) finden Sie hier.


Zunächst wird eine Interpretation der oben zitierten Erläuterungen aus dem Bedienhandbuch gegeben:
Die im Anhang gegebene Erläuterung bezieht sich darauf, ob die x-Werte auf der x-Achse oder der y-Achse und entsprechend die zugeordneten Quantile der Standard-Normalverteilung dann auf der y-Achse bzw. x-Achse angegeben werden. Außerdem kann zwischen drei verschiedenen Punktsymbolen ausgewählt werden, die zur Darstellung dienen (Punkt, Kreuz oder Box), z.B.:




Es wird nun eine konkrete Stichprobe L1 = { x1, x2, ..., x60 } untersucht. Die Festlegungen zur oben betrachteten statistischen Grafik vom Typ N.P. erfolgen im STAT PLOT - Menü des EL-9600:

qqp1el96.gif

Bild 1:

Aufruf des STAT PLOT - Menüs zur Definition des PLOT1

qqp2el96.gif

Bild 2:

Festlegungen im PLOT1 - Untermenü
Für Freq: ist an dieser Stelle keine Eingabe möglich, d.h. ListX: muß eine Urliste (mit allen Datenwiederholungen) sein.


qqp3el96.gif

Bild 3:

Aufruf eines weiteren Untermenüs zur Aktivierung der statistischen Grafik N.P. durch erneutes Betätigen der STAT PLOT - Taste


qqp4el96.gif

Bild 4:

Nutzung des Zoom Stat im ZOOM-Menü zur Anpassung des Grafik-Fensters an die darzustellende Punktwolke ergibt das im Bild 5 folgende ungeeignete Koordinaten-Fenster (Die Urliste war bereits in den EL-9600 eingegeben!)


qqp5el96.gif

Bild 5:

Ansicht des über ZOOM Stat im "Auto scaling" festgelegten ungeeigneten WINDOW.
Die y-Achse variiert erfahrungsgemäß um 0 , etwa von -3 bis +3 und gibt Quantile der Standard-Normalverteilung an!


qqp6el96.gif

Bild 6:

Ansicht des per Hand festgelegten optimalen WINDOW

Die Darstellung der statistischen Grafik N.P. wird durch Betätigen der GRAPH- und anschließend der TRACE-Taste erhalten und weiter unten abgebildet.




Wir betrachten dazu den Datensatz (Urliste mit n = 60) aus Beispiel 17.1 im Lehr- und Übungsbuch Mathematik, Band 3: Lineare Algebra - Stochastik, S. 232, (von Aulenbacher,G., Paditz,L., Wabel-Frenk,U. (Hrg. v. Prof. Dr .W.Preuß, HTW Dresden(FH), u. Prof. Dr. G.Wenisch, FH Darmstadt), 1. Aufl., Fachbuchverlag Leipzig im Hanser Verl. München 1996):

16

15

17

16

19

17

16

16

16

18

15

14

14

14

15

11

7

8

10

9

11

11

13

12

12

12

14

13

13

15

11

9

12

10

12

11

12

14

13

11

12

14

15

13

14

15

18

16

17

16

15

14

13

14

14

12

14

12

13

12



Die primäre Häufigkeitstabelle hat folgende Gestalt:

Index

1

2

3

4

5

6

7

8

9

10

11

12

13

xi

7

8

9

10

11

12

13

14

15

16

17

18

19

hi

1

1

2

2

6

10

7

11

7

7

3

2

1

hi / n

1/60

1/60

2/60

2/60

6/60

10/60

7/60

11/60

7/60

7/60

3/60

2/60

1/60

sum hi / n

1/60

2/60

4/60

6/60

12/60

22/60

29/60

40/60

47/60

54/60

57/60

59/60

60/60

sum [%]

1,67

3,33

6,67

10,0

20,0

36,67

48,33

66,67

78,33

90,0

95,0

98,33

100,0



Die empirische Verteilungsfunktion y = wn(x) wird dem Lehr- und Übungsbuch Mathematik, Band 3: Lineare Algebra - Stochastik entnommen, vgl. S. 238, Formel (17.15) und Bild 17.2,
bild1715.gif



bild17_2.gif



Es folgen nun zwei Darstellungen der empirischen Verteilungsfunktion im Wahrscheinlichkeitspapier:



bild172a.gif
bild1720.gif



bild172b.gif
bild172c.gif

Durch den Übergang vom Wahrscheinlichkeitsniveau gamma zu den entsprechenden Quantilen y = zgamma = Phi-1( gamma) einer Normalverteilung wird die verzerrte Skalierung der y-Achse aufgehoben:

Die x- und y-Achse sind beide ohne Verzerrung skaliert. Die x-Achse enthält die "Quantile" der Urdaten (Variationsreihe) - also die Urdaten selbst. Die y-Achse enthält die "Quantile" einer Normalverteilung. Besitzt die so dargestellte Punktwolke ( x*k , yk ) , k = 1, 2, ..., n-1 , mit x*k = k-te Wert in der Variationsreihe und yk = Phi-1( k / n ) einen linearen Trend, so kann man vermuten, daß die Datenerhebung aus einer normalverteilten Grundgesamtheit herrührte.



Verschiedene statistische Grafiken vom Typ N.P. mit Anzeige einzelner Koordinaten zu Punkten in der Punktwolke im Vergleich zur Darstellung im Wahrscheinlichkeitspapier:


qqp7el96.gif
Bild 7:

Der größte Wert der Stichprobe x = 19 ( n-te Wert in der Variationsreihe, s. Pfeil!) erhält nicht wie üblich das Wahrscheinlichkeitsniveau 100%
(dann wäre dieser Punkt genau wie im Wahrscheinlichkeitspapier nicht mehr darstellbar),

sondern das um ( 1 / 2n ) * 100% reduzierte Wahrscheinlichkeitsniveau

(( 2n - 1) / 2n ) * 100% = 98,33% und damit den y-Wert

InvNorm(119/120) = Phi-1(0,9833) = 2.3939...



usw.


qqp8el96.gif
Bild 8:

Der vierte Wert x = 9 in der Variationsreihe der Stichprobe (s. Pfeil!) erhält nicht wie üblich das Wahrscheinlichkeitsniveau ( 4 / n ) * 100% = 6,667% ,

sondern das um ( 1 / 2n ) * 100% reduzierte Wahrscheinlichkeitsniveau

( 7 / 2n ) * 100% = 5,833% und damit den y-Wert

InvNorm(7/120) = Phi-1(0,05833) = -1,5689...


qqp9el96.gif
Bild 9:

Der dritte Wert x = 9 in der Variationsreihe der Stichprobe (s. Pfeil!) erhält nicht wie üblich das Wahrscheinlichkeitsniveau ( 3 / n ) * 100% = 5,000% ,

sondern das um ( 1 / 2n ) * 100% reduzierte Wahrscheinlichkeitsniveau

( 5 / 2n ) * 100% = 4,167% und damit den y-Wert

InvNorm(5/120) = Phi-1(0,04167) = -1,7316...


qqp0el96.gif
Bild 10:

Der kleinste Wert der Stichprobe x = 7 (s. Pfeil!) erhält nicht wie üblich das
Wahrscheinlichkeitsniveau ( 1 / n ) * 100% = 1,67%
(dann würde dieser Punkt genau wie im Wahrscheinlichkeitspapier dargestellt),

sondern das um ( 1 / 2n ) * 100% reduzierte Wahrscheinlichkeitsniveau

( 1 / 2n ) * 100% = 0,833% und damit den y-Wert

InvNorm(1/120) = Phi-1(0,0833) = -2.3939...


qqpael96.gif
Bild 11:

Notwendige Voreinstellung in WINDOW zur Darstellung eines Bildausschnittes


qqpbel96.gif
Bild 12:

Bildausschnitt aus der statistischen Grafik N.P.:
deutlich sichtbar werden die senkrecht übereinanderliegenden Punkte bei Datenhäufung in einem bestimmten x-Wert

Pfeil zeigt hier bei x*30 = 14 auf den untersten Punkt bei

y = InvNorm((2*30-1)/120) = -0,02089...


qqpcel96.gif
Bild 13:

Darstellung der empirischen Verteilungsfunktion mit Hilfe von Line-Befehlen

(hier für 11.5 < x < 12 und 12 < x < 13 )



usw.


qqpdel96.gif
Bild 14:

Darstellung der empirischen Verteilungsfunktion mit Hilfe von Line-Befehlen

(hier schließlich für 14 < x < 15 und 15 < x < 15.5 )


qqpeel96.gif
Bild 15:

Bildausschnitt aus der statistischen Grafik N.P. mit Treppenfunktion:
vgl. Bild 12


qqpfel96.gif
Bild 16:

Bildausschnitt aus der statistischen Grafik N.P.:
zusätzliche Darstellung der empirischen Verteilungsfunktion (Treppenfunktion) aus dem Wahrscheinlichkeitspapier

z.B. y = InvNorm(22/60) = -0.34069... > -0.36291... für 12 < x < 13

(d.h. hier line(12,InvNorm(22/60),13,InvNorm(22/60)) )

Bemerkung: Der Pfeil wurde nachträglich in die Bilder hineinkopiert.


Allgemein gilt damit für die Darstellung im EL-9600 folgender Zusammenhang:

Dem k-ten x-Wert in der Variationsreihe wird das (kumulierte) Wahrscheinlichkeitsniveau (( 2k -1 ) / 2n ) * 100% und damit das N(0,1)-Quantil InvNorm( ( 2k -1 ) / 2n ) = Phi-1( ( 2k -1 ) / 2n ) = z( 2k -1 ) / 2n zugeordnet. Damit liegt die Punktwolke im NormProbPlot etwas tiefer als im Wahrscheinlichkeitspapier. Der gewünschte Vergleich mit einer Geraden (Verlauf der Verteilungsfunktion einer Normalverteilung im Wahrscheinlichkeitspapier bzw. im NormProbPlot) wird dadurch nicht beeinträchtigt.

Wegen der Nichteindeutigkeit der Quantil-Bestimmung für nicht streng monotone (empirische) Verteilungsfunktionen (rechtsseitig stetige Treppenfunktionen) stehen die Darstellungen im Wahrscheinlichkeitspapier und im NormProbPlot nicht im Widerspruch zueinander !
Der k-te Wert x*k in der Variationsreihe ist nämlich gleichzeitig Quantil der empirischen Verteilungsfunktion sowohl zum Niveau k / n als auch zum Niveau ( 2k - 1 ) / 2n und nicht zuletzt auch zum Niveau k / ( n + 1 ) oder ( k - 1 ) / n usw.



Zur Erinnerung die Quantil-Definition:

Die Kennzahl xgamma, 0 < gamma < 1, einer Zufallsgröße X heißt Quantil der Ordnung gamma,
wenn die Ungleichung P( X < xgamma ) < gamma < P( X < xgamma ) erfüllt ist.



Damit erfüllt der k-te Wert x*k der Variationsreihe die Quantil-Definition sowohl für das Wahrscheinlichkeitsniveau k / n als auch für das Wahrscheinlichkeitsniveau ( 2k - 1 ) / 2n (und auch für das Wahrscheinlichkeitsniveau k / ( n + 1 ) oder ( k - 1 ) / n, also für jedes Niveau gamma mit ( k - 1 ) / n < gamma < k / n ):

P( X < x*k ) < k / n < P( X < x*k ) und P( X < x*k ) = ( k - 1 ) / n < ( 2k - 1 ) / 2n < P( X < x*k ) = k / n

Damit ist die statistische Grafik vom Typ N.P. korrekt, obwohl im Vergleich zum Wahrscheinlichkeitspapier die Punktwolke etwas niedriger liegt.


Ludwig Paditz, 04. August 1999