Michael Ralph Pape
Mai 1998
Bisher haben wir eine einzige Zufallsvariable untersucht. Nun wollen
wir zwei Zufallsvariablen untersuchen, d.h. ihre Zustände
-mal
beobachten.
| Klassenstufe | ||||||||||
| Gymnasien | 5. | 6. | 7. | 8. | 9. | 10. | 11. | 12. | 13. | insg. |
| Droste- | 87 | 89 | 88 | 102 | 98 | 90 | 109 | 79 | 74 | 816 |
| Kepler- | 79 | 87 | 122 | 123 | 129 | 88 | 101 | 85 | 85 | 899 |
| Friedrich- | 79 | 61 | 71 | 65 | 59 | 62 | 51 | 56 | 65 | 569 |
| Bertholt- | 49 | 55 | 59 | 50 | 57 | 45 | 40 | 50 | 52 | 457 |
| Goethe- | 56 | 81 | 68 | 95 | 106 | 95 | 108 | 124 | 79 | 812 |
| Rotteck- | 100 | 105 | 91 | 100 | 129 | 83 | 75 | 81 | 59 | 823 |
| Wenzinger- | 156 | 164 | 149 | 156 | 186 | 176 | 115 | 94 | 64 | 1260 |
| Theodor-Heuss- | 98 | 123 | 145 | 130 | 88 | 79 | 49 | 0 | 0 | 712 |
| Deutsch-Franz.- | 62 | 61 | 84 | 91 | 73 | 48 | 34 | 0 | 0 | 453 |
| zusammen | 766 | 286 | 877 | 912 | 925 | 766 | 682 | 569 | 478 | 6801 |
Addiert man die in den Spalten stehenden Häufigkeiten, so erhält man die Häufigkeitsverteilung der Zufallsvariable ``Klassenstufe''.
Addiert man die in jeweils einer Zeile stehenden Häufigkeiten, so erhält man die Häufigkeitsverteilung der Zufallsvariable ``Name der besuchten Schule''.
Diese Häufigkeitsverteilungen werden auch Randverteilung (Marginalverteilung) der Zufallsvariable ``Klassenstufe'' bzw. ``Name der besuchten Schule'' genannt. Die Randverteilungen sind also nichts anderes als die bisher schon bekannte Verteilung von einer Zufallsvariablen.
Man kann ihnen entnehmen, daß z.B. 569 Schüler das Friedrich-Gymnasium besuchten, oder z.B. daß es 912 Schüler in der 8. Klassenstufe gibt.
Die erste Zufallsvariable bezeichnen wir künftig mit
, die zweite
mit
. Im Allgemeinen wird der Wert der ersten Zufallsvariablen bei
der
-ten Beobachtung mit ``
'' bezeichnet und
entsprechend der Wert der zweiten Zufallsvariablen mit``
'.
So entsteht dann eine Urliste bestehend aus
Paaren (
) von
Werten. Damit haben wir eine gemeinsame Häufigkeitsverteilung der
beiden Zufallsvariablen ``
'' und ``
'' gegeben.
Die von 5 zufällig ausgewählen Personen ermittelten Daten über
die Zufallsvariable ``Körpergröße''
und die Zufallsvariable
``Gewicht''
sind unten stehend abgebildet.
| Person | 1 | 2 | 3 | 4 | 5 |
| 155 | 163 | 167 | 172 | 174 | |
| 49 | 45 | 56 | 68 | 66 |
Diese Zahlenpaare tragen wir dann in ein kartesisches Koordinatensystem ein. Dabei wird der erste Wert in Richtung der x-Achse eingetragen und der zweite in Richtung der y-Achse.
|
Wir haben natürlich auch noch andere Möglichkeiten unsere Wertepaare graphisch darzustellen, so z.B. in einem 3-dimensonalen Stabdiagramm. Allerdings wird man ein solches Diagramm nur dann benutzen, wenn man viele Wertepaare mit Mehrfachbelegung hat.
Bisher haben wir gelernt, wie wir die gemeinsame Verteilung von zwei Zufallsvariablen darstellen können.
Nun könnte jemand auf die Idee kommen, daß zwischen den beiden Zufallsvariablen ein Zusammenhang in irgendeiner Form besteht. Will man diesem Zusammenhang auf die Schliche kommen, so kennt die Mathematik das Mittel der linearen Regression.
Wir wollen nun versuchen einem solchen Zusammenhang auf die Schliche zu kommen. Dabei betrachten wir der Einfachkeit wegen das Beispiel 1.2. Wir könnten aber auch eine umfangreichere Urliste betrachten.
Trägt man diese Daten auf, so ergibt sich folgendes Bild!
|
Bei genauer Betrachtung der Zahlenpaare oder der Punktwolke aus Beispiel
1.2 und Beispiel 2.1, und auch aus unserer persönlichen
Erfahrung fällt auf, daß größere Personen ``tendenziell'' auch ein
größeres Körpergewicht haben. Um Aussagen über diesen statistischen
Zusammenhang zu treffen, liegt es nahe eine ``Trendgerade'', später mit
bezeichnet, möglichst gut durch diese Punktwolke zu legen.
Möglichst gut bedeutet hier, daß möglichst viele Punkte auf der Gerade
oder sehr nahe bei ihr liegen.
Wir suchen nun also eine Gerade
. Von dieser erwarten wir dann,
daß die Summe der Abweichung der Ausprägungspaare
,
von den Punkten
im Mittel möglichst klein
ist. Diese Abweichung kann man am Besten durch das Quadrat
messen.
Dies läßt sich dabei folgendermaßen veranschaulichen.
Hier wollen wir also, daß diese Quadrate möglichst klein werden.
Die dafür notwendige Rechnung werden wir am Beispiel 1.2 durchführen.
Die Koeffizienten
und
der Gleichung
sind so zu bestimmen, daß die Funktion
Dazu halten wir zunächst die Variable
fest und betrachten die Funktion
[1.Argumentation]
Auserhält man
. Dabei ist
,
das arithmetische Mittel von
bzw.
. Dieses Ergebnis setzt man in (1) ein. Es ergibt sich der Ausdruck
Dadurch wird dann eine Funktion
definiert. Für diese Funktion ist ebenfalls das Minimum zu berechnen. Dazu multiplizieren wir zunächst aus und sortieren nach den Potenzen von. Es ergibt sich
Mit den Abkürzungen,
und
erhalten wir
Die Ableitung vonist
. Aus
erkennt man, daß das Minimum für
angenommen wird.
[2.Argumentation]
Aus der Gleichung (*) erhalten wir dann
Das Minimum wird also fürerreicht. Dies setzt man in die Funktion (1) ein und erhält dann eine Funktion
.
Für diese Funktion ist ebenfalls das Minimum zu berechnen. Dazu multiplizieren wir zunächst aus und sortieren nach den Potenzen von. Es ergibt sich
Mit den Abkürzungen,
und
erhalten wir
Durch quadratische Ergänzung erhalten wir daraus die Gleichung
Dies ist eine Parabel mit dem Scheitel.
Die geschilderte Vorgehensweise läßt sich geometrisch leicht veranschaulichen. Die Gleichung
stellt in einem (a,s)-Koordinatensystem eine Schar von Parabeln mit Scharparameter b dar. Die Rechnung zeigt uns, daß die Scheitel dieser Parabeln wieder auf einer Parabel liegen. Deren Scheitel ist nun das gesuchte Minimum von, also
.
Dies verdeutlicht auch das folgende Bild.
Die nun eindeutig bestimmte Funktion
kann man nun
benutzen, um von einem nicht notwendigerweise beobachteten Wert von
den Funktionswert
zu bestimmen.
Dieses Verfahren heißt ``Lineare Regression'', die dabei verwendete Gerade heißt ``Regressionsgerade''.
und
Nun wenden wir auf das Beispiel 1.2 das folgende Schema an.
![]() |
Ihr Verlauf ist nachstehend abgebildet.
|
Bisher haben wir nun kennengelernt wie man zu jedem Wert der
Zufallsvariable
im Punktdiagramm einen ``Schätzwert'' für die
Zufallsvariable
angeben kann.
Es ist aber oft auch interessant, umgekehrt, also von dem Wert der
Zufallsvariable
auf den Wert der Zufallsvariable
zu schließen.
Will man dies tun, so muß man eine neue Regressionsgerade berechnen, also
die Gerade für die die Summe der horizontalen Abweichungsquadrate
minimal ist.
Um die Abhängigkeit der Zufallsvariable
von der Zufallsvariablen
zu bestimmen, vertauscht man einfach die Rollen von
und
. Dann
erhält man die Regressionsgerade mit der Gleichung
Die Werte für
,
,
,
sowie
kann man aus
der Abbildung 5 einfach ablesen. Daraus lassen sich leicht die Werte für
und
bestimmen.
Als Regressionsgerade ergibt sich dann
Im Bild sieht das dann so aus.
Wir wissen nun wie und wozu wir Regressionsgeraden berechnen können.
Nun könnten wir uns noch die Frage stellen, ob vielleicht zwischen den beiden Regressionsgeraden ein Zusammenhang, genauer, ein linearer Zusammenhang besteht?
Ja, es besteht ein solcher Zusammenhang.
Was ist den nun der ``linearen Zusammenhangs'' zweier Zufallsvariablen?
Der ``linearen Zusammenhangs'' zweier Zufallsvariablen ist eine Kennzahl
, genau wie zum Beispiel der Erwartungswert, die Varianz oder die
Standardabweichung. Diese Kennzahl heißt auch noch
Korrelationskoeffizient.
Nun sehen wir uns folgende Bildserien an. Was fällt auf?
Aufgrund der Bilderfolgen wird man nun vermuten, daß der Wert von
bei Diagrammen mit zunehmend ausgeprägter linearer Tendenz steigt und
bei Diagrammen, bei denen kaum eine lineare Tendenz zu erkennen ist,
nahe bei 0 liegt.
Wir wollen nun den Korrelationskoeffizienten für unser Beispiel 1.2 ausrechnen.
heißt Korrelationskoeffizient der
gemeinsamen Häufigkeitsverteilung der Zufallsvariablen
und
.
Dabei ist vorausgesetzt, daß der Nenner positiv ist.
Mit der vorhin berechneten Tabelle ergibt sich der
Korrelationskoeffizient aus
zu
.
Aus den Bilderfolgen kann man auch erkennen, daß
gilt und
daß die Werte
und
in den Ausnahmefällen in denen die Punkte
auf einer Geraden liegen, angenommen werden.
Liegt der Wert der Korrelationskoeffizienten
in der Nähe von +1 bzw.
-1, so liegen die Werte fast alle auf einer Geraden, d.h. der lineare
Zusammenhang ist stark ausgeprägt. Liegt der Wert von
in der Nähe
von Null, so besteht kein linearer Zusammenhang. Wir sehen lediglich ein
Punktwolke.