Auswahl Aktion im Forum Suche Kontakt Für Mitglieder Mathematisch für Anfänger Wer ist Online | |
| Autor |
Chiquadrat-Anpassungstest |
|
Mych
Aktiv  Dabei seit: 09.07.2009 Mitteilungen: 289
Aus: Zürich
 |     Themenstart: 2012-08-09 22:16
|
 
\Hi! Wir haben im Skript folgendes Beispiel: Radioaktiver Zerfall irgendeines Teilchens - wir suchen ein Modell für die Anzahl Xder Emissionen in eimenm Zeitintervall von 10s. - die geordneten Daten schreibt man als x_1 < x_2 < .. < x_n - die auftretenden Werte y_1 < ... < y_m, dabei ist natürlich m <= n Wir teilen die beobachteten Daten nun in Klassen auf: Klasse 1 beispielsweise steht für die Intervalle à 10 Sekunden, während denen 0-2 Emissionen beobachtet wurden - von diesen Intervallen gibt es zB 18. Diese Anzahl Beobachtungen pro Klasse (das heisst wieviele Intervalle mit der gleichen Anzahl von Emissionen) bezeichnet man mit U_k: U_k(\omega) = abs({i; X_i(\omega) liegt in Klasse k}). Die konkreten Beobachtungen bezeichnen wir mit u_k (Grossbuchstabe für Zufallsvariable und klein geschrieben für empirische Daten). Wir nehmen nun an, dass unsere Zufallsvariablen X_i (nochmals: Zufallsvariable definiert Emission pro Intervall) i.i.d. und poissonverteilt sind (mit Parameter \lambda natürlich). So weit so gut. Nun kommt einiges, das ich gar nicht verstehe: - Für den Vektor (U_1, U_2, ... , U_k) gehen wir davon aus, dass er multinomialverteilt ist - was heisst das genau? Für X_i sind wir ja von einer Poissonverteilung ausgegangen...was ist hier mit der Multinomialverteilung beschrieben? - Zudem rechnen wir jetzt die Wahrscheinlichkeit, dass ein X_i in Klasse k landet, wieder mit der Poissonverteilung aus(?!) - Es wird gesagt, dass die Randverteilung der Multinomialverteilung Binomialverteilungen sind - das heisst, nehme ich an, wenn man quasi die Anzahl Zerfälle für eine Klasse konstant hält und dann alle möglichen Häufigkeiten für die anderen Klassen aufsummiert und die Wahrscheinlichkeit berechnet, hat man eine Binomialverteilung? - Nun macht man weiter Folgendes: Da U_k binomialverteilt ist, wird gesagt sei die erwartete Anzahl der Beobachtungen in der Klasse k E[U_k] = n*p_k, dabei ist p_k die mit der Poissonverteilung ausgerechnete Wahrscheinlichkeit - n die Anzahl der Vorkommnisse ALLER Intervalle...ich verstehe diese Vorgehensweise für die Berechnung des Erwartungswertes nicht - einerseits nimmt man eine der Klasse angepasst Wahrscheinlichkeit p_k - multipliziert diese aber mit der Gesamtzahl der Klassen... - U_k ist doch ein empirischer bzw. stochastischer Wert. Weshalb benutzt man für die Berechnung der des Erwartungswertes nicht den empirischen Mittelwert sondern die Formel für den theoretischen Erwartungswert? - Und warum hat Statistik so wenig mit Math zu tun? :-p Vielen, vielen Dank...
|
Profil
Quote
Link |
Ehemaliges_Mitglied Neu  Dabei seit: 00.00.0000 Mitteilungen: 0
Aus:
 |     Beitrag No.1, eingetragen 2012-08-10 19:13
|
Hallo, Mych!
Was sollen die bezeichnen? Das habe ich Deinem Text noch nicht entnehmen können.
---
Du sollst hier die Hypothese testen, dass die Anzahl der Emissionen in einem Intervall von 10 Sekunden zum Parameter poissonverteilt ist.
Dazu berechnest Du, wieviele Beobachtungen im Mittel in einer Klasse liegen müssten, wenn die tatsächlich so verteilt wären. Und diese Häufigkeiten sind eben , da die Klassenhäufigkeiten binomialverteilt sein sollen.
Es macht auch Sinn, anzunehmen, dass die Klassenhäufigkeiten binomialverteilt sind, da man sie als Summe bernouilliverteilter Zufallsvariablen schreiben kann (nämlich von Indikatorfkt., die jeweils "zählen", ob ein in die Klasse fällt oder nicht).
Da die Klassenhäufigkeiten natürlich nicht voneinander unabhängig sind, ist deren gemeinsame Dichte halt von irgendeiner komplizierteren Form (wenn sie unabhängig wären, könnte man die gemeinsame Dichte ja viel leichter hinschreiben), hier geht man davon aus, dass sie eine Multinomialverteilung ist, also sozusagen eine Binomialverteilung in n Dimensionen. Im Endeffekt ist aber nur wichtig, dass die einzelnen Klassenhäufigkeiten (also die Randverteilungen) binomialverteilt sind.
Dass sich theoretische und empirische Daten "vermischen", liegt in der Natur der Teststatistik begründet, denn Du sollst ja gerade vergleichen, ob die theoretisch benötigten Häufigkeiten mit den empirisch festgestellten "übereinstimmen" bzw. sich nahe kommen.
:-)
[ Nachricht wurde editiert von dennis2012 am 10.08.2012 20:02:56 ]
[ Nachricht wurde editiert von dennis2012 am 11.08.2012 11:53:40 ]
|
Profil
Quote
Link |
Mych
Aktiv  Dabei seit: 09.07.2009 Mitteilungen: 289
Aus: Zürich
 |     Beitrag No.2, vom Themenstarter, eingetragen 2012-08-11 08:17
|
 
\ Hi Dennis Erstmals vielen Dank! Zu den y_i: Das sind (siehe ganz oben) die auftretenden Werte. Die x_i sind die Realisierungen der Zufallsvariablen X_i: Wieviele Emissionen in 10 Sekunden. Mit Y_i klassifiziert man dann quasi diese Realisierungen: Beispielsweise kann es sein, dass man zwar 1000 Zeitintervalle betrachtet, aber nur y_1, y_2, y_3 zu deren Beschreibung genügen da nur die ''Fälle'' 10, 20 oder 25 Emissionen pro 10 Sekunden auftreten. Dann wäre z.B. abs(y_1)= 500, abs(y_2) = 300, abs(y_3) = 200. - Nochmal zu den verschiedenen Verteilungen: Verstehe ich es also richtig, dass man: i) Die Poissonverteilung verwendet, um anzugeben, wie wahrscheinlich eine bestimmte Anzahl Emissionen per Zeitintervall ist (das heisst, damit gibt man eigentlich die Wahrscheinlichkeit von x_i an!) ii) Die Multinomialverteilung (bzw. als Randverteilung derer Binomialverteilung) verwendet, um anzugeben, wieviele jeder solcher Intervalle zu erwarten sind? Was ich immer noch nicht verstehe, ist die Berechnung des Erwartungswertes. Wenn ich zum Beispiel weiss, dass die Wahrscheinlichkeit mit einem (unfairen) Würfel eine gerade Zahl zu werfen 3/4 ist, die Wahrscheinlichkeit für eine ungerade Zahl 1/4, dann rechne ich doch 3*3/4 + 3*1/4 - und nicht etwa 6*3/4 um den Erwartungswert für eine gerade Zahl zu berechnen?! Vielen Dank + viele Grüsse
|
Profil
Quote
Link |
Ehemaliges_Mitglied Neu  Dabei seit: 00.00.0000 Mitteilungen: 0
Aus:
 |     Beitrag No.3, eingetragen 2012-08-11 11:51
|
Ja, richtig. Das ist die Hypothese, die man zu testen hat. Man behauptet, die seien so verteilt.
Die bezeichnen die Anzahlen der in einer Klasse. Die Klasse Nr. 3 sei zum Beispiel "5 bis 10 Emissionen in 10 Sekunden" und es fallen z.B. und in diese Klasse (d.h. zwei Mal wurden 5-10 Emissionen in 10 Sekunden gemessen) , also . Dann soll binomialverteilt sein.
Die Häufigkeiten zusammen sollen multinomialverteilt sein. Die Multinomialverteilung ist nichts Anderes als die multivariate Verallgemeinerung der Binomialverteilung.
(Die Randdichte einer Multinomialverteilung ist eine Binomialverteilung, es passt also alles zusammen.)
Dein Würfelbeispiel passt hier nicht (ist aber richtig berechnet), denn es handelt sich bei diesem Würfelwurf nicht um eine binomialverteilte Zufallsgröße.
Sei eine gemäß der Parameter n und p binomialverteilte Zufallsvariable. Dann lautet der Erwartungswert . Kannst Du ja mal versuchen zu beweisen.
[ Nachricht wurde editiert von dennis2012 am 11.08.2012 12:02:20 ]
|
Profil
Quote
Link |
Mych
Aktiv  Dabei seit: 09.07.2009 Mitteilungen: 289
Aus: Zürich
 |     Beitrag No.4, vom Themenstarter, eingetragen 2012-08-11 12:17
|
 
Hey D! Der erste Teil ist mir jetzt klar - und das ist sicher dieser Diskussion zu verdanken, toll!! Zum Erwartungswert einer Binomialverteilung: Das ist nicht schwer, eigentlich müsste man Folgendes ausrechnen: E[Z] = sum(k*(n;k)p^k*(1-p)^(n-k),k=1,n) Dies weil man ja für den Erwartungswert einer diskreten ZV Gewichtsfunktion mit der entsprechenden Wert aus der Wertemenge multipliziert (und diese für alle Werte der Wertemenge aufaddiert). Weils einfacher geht, greift man aber auf n Bernoulli-verteilte ZVs zurück (Binomialverteile ZVs lassen sich als Summe von Bernoulli-veteilten ZVs darstellen) und mit der Linearität des Erwartungswertes hat man n*p. Aber das ist eben nicht dasselbe wie n*p_k! Ich sehe hier immer noch keine Analogie...:-(
|
Profil
Quote
Link |
Ehemaliges_Mitglied Neu  Dabei seit: 00.00.0000 Mitteilungen: 0
Aus:
 |     Beitrag No.5, eingetragen 2012-08-11 12:20
|
Wieso ist das nicht dasselbe wie ?
ist binomialverteilt gemäß den Parametern n und !
[ Nachricht wurde editiert von dennis2012 am 11.08.2012 12:21:56 ]
|
Profil
Quote
Link |
Mych
Aktiv  Dabei seit: 09.07.2009 Mitteilungen: 289
Aus: Zürich
 |     Beitrag No.6, vom Themenstarter, eingetragen 2012-08-11 12:33
|
Habs kapiert!
Super!!!Danke^1000
|
Profil
Quote
Link |
|