Die Mathe-Redaktion - 19.11.2019 16:12 - Registrieren/Login
Auswahl
ListenpunktHome
ListenpunktAktuell und Interessant ai
ListenpunktArtikelübersicht/-suche
ListenpunktAlle Links / Mathe-Links
ListenpunktFach- & Sachbücher
ListenpunktMitglieder / Karte / Top 15
ListenpunktRegistrieren/Login
ListenpunktArbeitsgruppen
Listenpunkt? im neuen Schwätz
ListenpunktWerde Mathe-Millionär!
ListenpunktFormeleditor fedgeo
Schwarzes Brett
Aktion im Forum
Suche
Stichwortsuche in Artikeln und Links von Matheplanet
Suchen im Forum
Suchtipps

Bücher
Englische Bücher
Software
Suchbegriffe:
Mathematik bei amazon
Naturwissenschaft & Technik
In Partnerschaft mit Amazon.de
Kontakt
Mail an Matroid
[Keine Übungsaufgaben!]
Impressum

Bitte beachten Sie unsere Nutzungsbedingungen, die Distanzierung, unsere Datenschutzerklärung und
die Forumregeln.

Sie können Mitglied werden. Mitglieder können den Matheplanet-Newsletter bestellen, der etwa alle 2 Monate erscheint.

Der Newsletter Okt. 2017

Für Mitglieder
Mathematisch für Anfänger
Wer ist Online
Aktuell sind 885 Gäste und 16 Mitglieder online.

Sie können Mitglied werden:
Klick hier.

Über Matheplanet
 
Zum letzten Themenfilter: Themenfilter:
Matroids Matheplanet Forum Index
Moderiert von Kleine_Meerjungfrau Monkfish epsilonkugel
Mathematik » Stochastik und Statistik » Varianz nicht trivial anwendbar
Druckversion
Druckversion
Autor
Universität/Hochschule J Varianz nicht trivial anwendbar
bambusbieber
Aktiv Letzter Besuch: im letzten Quartal
Dabei seit: 10.01.2019
Mitteilungen: 91
Zum letzten BeitragZum nächsten BeitragZum vorigen BeitragZum erstem Beitrag  Themenstart: 2019-07-24


Hallo Freunde,



Man Betrachte den zuerst den Erwartungswert für ein Unterschiedliches Paar
Sein nun \(E[\mathbb{1}_{\{x_i \neq X_{i-1}\}}]=0 * [...] + 0 * [...] + 1 * P[[x_{i}=1]~\cap~[x_{i-1}=0]] + 1 * [P[[x_{i}=0]~\cap~[x_{i-1}=1]] \\= 2pq \)
mit
\(P[[x_{i}=1]~und~[x_{i-1}=0]] = p*q \)
und
\([P[[x_{i}=0]~und~[x_{i-1}=1]]= q * p\)

So ist \[E[R] = 1 + \sum_{n=0}^n 2pq = 1 + (n-1) * 2pq\]
So weit so gut, nun ist \(VAR(X) = E[X^2] - E[X]^2\) die Varianz mittels Verschiebungssatz.

\(E[R^2] = E[R]\) ergibt sich aus der herleitung oben da wir nur X quadrieren was entweder 0^2 = 0 oder 1^2 = 1 ist.

 \(E[R]^2 = 4 n^2 p^2 q^2 - 8 n p^2 q^2 + 4 n p q + 4 p^2 q^2 - 4 p q + 1\)
siehe www.wolframalpha.com/input/?i=(1%2B(n-1)*2pq)%5E2

Die Erwartete Varianz ist aber leider vernab (komplett daneben) von der emprisches Varianz die ich mittels eines kleinem matlab snippet ausrechne... Wo ist der fehler in meinem Ansatz?

Matlab snippet:

clear;
p = 0.3;
runamount = 1000;

runs = -1 * ones(runamount,1);
for run=1:runamount
    clear valcont
    clear n
    n = 1000;
    valcont = -1 * ones(n, 1);
    for i=1:n
       value = randi(100);
       if value/100  <= p
           valcont(i) = 1;
       else
           valcont(i) = 0;
       end

       oness = sum(valcont)   ;
    end
    r = 1;
    for j=2:n
       if valcont(j-1) ~= valcont(j)
           r = r+1;
       end
    end
    runs(run,1)=r;

end

q = 1-p
erwartungswertEST = 1+(n-1) * 2 * p*q
varianceEST = (1 + (n-1) * 2*p*q )- (4 *n^2* p^2* q^2 - 8* n *p^2* q^2 + 4* n *p *q + 4* p^2* q^2 - 4 *p *q + 1)


avg = mean(runs)
variance = var(runs)





  Profil  Quote  Link auf diesen Beitrag Link
Kampfpudel
Senior Letzter Besuch: in der letzten Woche
Dabei seit: 02.08.2013
Mitteilungen: 1622
Zum letzten BeitragZum nächsten BeitragZum vorigen BeitragZum erstem Beitrag  Beitrag No.1, eingetragen 2019-07-24


Hallo bambusbieber,

Du verwendest, dass \(R^2=R\) gilt. Das stimmt aber nicht. Richtig ist, dass \(X^2=X\) ist, aber nicht \(R^2=R\)



  Profil  Quote  Link auf diesen Beitrag Link
bambusbieber
Aktiv Letzter Besuch: im letzten Quartal
Dabei seit: 10.01.2019
Mitteilungen: 91
Zum letzten BeitragZum nächsten BeitragZum vorigen BeitragZum erstem Beitrag  Beitrag No.2, vom Themenstarter, eingetragen 2019-07-24


danke für die schnelle Antwort.. jetzt stehe ich doch etwas auf dem schlauch

1. Was genau muss ich denn quadrieren?
2. Stimmt die Rechte Seite der Subtraktion?


EDIT ZU 1.
R^2 ist ja einfach \( (1+\sum \mathbb{1}_{x_i \neq x_{x-1}})^2 \) was wiederum ein richtiger Pain mit Binomischer Formel wird..

Gibt es nicht vielleicht einen schlaueren Weg?



  Profil  Quote  Link auf diesen Beitrag Link
Kampfpudel
Senior Letzter Besuch: in der letzten Woche
Dabei seit: 02.08.2013
Mitteilungen: 1622
Zum letzten BeitragZum nächsten BeitragZum vorigen BeitragZum erstem Beitrag  Beitrag No.3, eingetragen 2019-07-24


Was meinst du mit rechter Seite der Subtraktion?

Also es ist schon \(Var(R)= E(R^2) - E(R)^2\), aber so würde ich gar nicht ansetzen. Die Varianz hat schöne Rechenregeln was die Summe unabhängiger Zufallsvariablen angeht. Benutze diese



  Profil  Quote  Link auf diesen Beitrag Link
bambusbieber
Aktiv Letzter Besuch: im letzten Quartal
Dabei seit: 10.01.2019
Mitteilungen: 91
Zum letzten BeitragZum nächsten BeitragZum vorigen BeitragZum erstem Beitrag  Beitrag No.4, vom Themenstarter, eingetragen 2019-07-24



Durch die Varianz einer beliebigen Summe von Zufallsvariable git:

\( VAR(R) = \sum^n Var(X_{i \neq i-1}) \)

Anmerkung es ist leicht zu zeigen dass die einzelnen Wahrscheinlichkeiten der Wechsel nicht korrelieren weswegen Cor = 0 und hier nicht berücksichtig werden muss...

Leider komme ich aber auch mit

\( VAR(R) = \sum^{n} E[X^2] - E[X]^2 = (n-1) * 2pq * 4p^2q^2 \)

NICHT auf das richtige Ergebnis



  Profil  Quote  Link auf diesen Beitrag Link
Kampfpudel
Senior Letzter Besuch: in der letzten Woche
Dabei seit: 02.08.2013
Mitteilungen: 1622
Zum letzten BeitragZum nächsten BeitragZum vorigen BeitragZum erstem Beitrag  Beitrag No.5, eingetragen 2019-07-24


Das Ergebnis ist \((n-1) (2pq - 4p^2q^2)\), das letzte * sollte ein - bei dir sein.

Wer sagt denn, dass dein Ergebnis von Ausgangsbeitrag das richtige Ergebnis ist?



  Profil  Quote  Link auf diesen Beitrag Link
bambusbieber
Aktiv Letzter Besuch: im letzten Quartal
Dabei seit: 10.01.2019
Mitteilungen: 91
Zum letzten BeitragZum nächsten BeitragZum vorigen BeitragZum erstem Beitrag  Beitrag No.6, vom Themenstarter, eingetragen 2019-07-24


Ah danke da ist mir ein kleiner fehler unterlaufen - trotzdem komme ich nicht auf richtige ergebnisse

ich habe von 1000 Läufen ein run(x) berechnet und die Varianz und median händig (matlab) ausgerechnet..

mit


varianceEST = (n-1) * (2*p*q - (2^2 * p^2 * q^2)) in

MATLAB

clear;
p = 0.3;
runamount = 10000;

runs = -1 * ones(runamount,1);
for run=1:runamount
    clear valcont
    clear n
    n = 1000;
    valcont = -1 * ones(n, 1);
    for i=1:n
       value = randi(100);
       if value/100  <= p
           valcont(i) = 1;
       else
           valcont(i) = 0;
       end

       oness = sum(valcont)   ;
    end
    r = 1;
    for j=2:n
       if valcont(j-1) ~= valcont(j)
           r = r+1;
       end
    end
    runs(run,1)=r;

end

q = 1-p
erwartungswertEST = 1+(n-1) * 2 * p*q
varianceEST = (n-1) * (2*p*q - (2^2 * p^2 * q^2))
avg = mean(runs)
histogram(runs,40)
variance = var(runs)




  Profil  Quote  Link auf diesen Beitrag Link
Kampfpudel
Senior Letzter Besuch: in der letzten Woche
Dabei seit: 02.08.2013
Mitteilungen: 1622
Zum letzten BeitragZum nächsten BeitragZum vorigen BeitragZum erstem Beitrag  Beitrag No.7, eingetragen 2019-07-24


Ich kann dir zu deinem Matlabergebnis leider nicht viel sagen, da ich mich mit Matlab nicht auskenne.

Die Mathematik ist aber ziemlich klar und lässt kein anderes Ergebnis als das berechnete zu

Edit: die Mathematik ist schon klar und wären die \(\mathbf{1}_{\{X_i \neq X_{i-1} \}}\) unabhängig, dann wäre auch das Ergebnis so. Sie sind es aber nicht und deswegen ist das Ergebnis ein anderes



  Profil  Quote  Link auf diesen Beitrag Link
bambusbieber
Aktiv Letzter Besuch: im letzten Quartal
Dabei seit: 10.01.2019
Mitteilungen: 91
Zum letzten BeitragZum nächsten BeitragZum vorigen BeitragZum erstem Beitrag  Beitrag No.8, vom Themenstarter, eingetragen 2019-07-24


Klar kein Problem und vielen Dank!

Zusammenfassung


Analytische Lösung
Eerwartungswert steht oben.
\( VAR(R) = \sum^{n} E[X^2] - E[X]^2 = (n-1) * 2pq - 4p^2q^2 \)

Numerische Lösung:
Erwartunswert passt
Var nicht..


FALLS jemand LUST hat hier nochmal abzugleichen wäre ich sehr glücklich - ich bin mir leider sehr sicher mit dem code




  Profil  Quote  Link auf diesen Beitrag Link
Kampfpudel
Senior Letzter Besuch: in der letzten Woche
Dabei seit: 02.08.2013
Mitteilungen: 1622
Zum letzten BeitragZum nächsten BeitragZum vorigen BeitragZum erstem Beitrag  Beitrag No.9, eingetragen 2019-07-25


Ich muss meine Behauptung, die ZVs \(Y_i := \mathbf{1}_{\{X_i \neq X_{i-1} \}}\) wären unabhängig, revidieren, denn für \(j \in \{i-1,i+1\}\) sind \(Y_i\) und \(Y_j\) nicht unabhängig. Dadurch wird die Varianz tatsächlich eine andere.
Ich schreibe heute vormittag/mittag noch was dazu

Edit: In der Tat sind \(Y_i\) und \(Y_j\) für \(|i-j| \geq 2\) unabhängig, für \(|i-j|=1\) aber nicht. Daher muss auch die Varianz anders berechnet werden

\( Var(1+ \sum\limits_{i=2}^{n} \mathbf{1}_{\{X_i \neq X_{i-1} \}}) = Var(\sum\limits_{i=2}^{n} \mathbf{1}_{\{X_i \neq X_{i-1} \}})= Cov(\sum\limits_{i=2}^{n} \mathbf{1}_{\{X_i \neq X_{i-1} \}}, \sum\limits_{j=2}^{n} \mathbf{1}_{\{X_j \neq X_{j-1} \}}) \)
\(=\sum\limits_{i,j=2}^{n} Cov(\mathbf{1}_{\{X_i \neq X_{i-1} \}}, \mathbf{1}_{\{X_j \neq X_{j-1} \}}) \)
\(= \sum\limits_{i=2}^{n} Var(\mathbf{1}_{\{X_i \neq X_{i-1} \}}) + \sum\limits_{i,j=2, i \neq j}^{n} Cov(\mathbf{1}_{\{X_i \neq X_{i-1} \}}, \mathbf{1}_{\{X_j \neq X_{j-1} \}})\)
\(= \sum\limits_{i=2}^{n} Var(\mathbf{1}_{\{X_i \neq X_{i-1} \}}) + 2\sum\limits_{i,j=2, i < j}^{n} Cov(\mathbf{1}_{\{X_i \neq X_{i-1} \}}, \mathbf{1}_{\{X_j \neq X_{j-1} \}})\)
\(= \sum\limits_{i=2}^{n} Var(\mathbf{1}_{\{X_i \neq X_{i-1} \}}) + 2 \sum\limits_{i=2}^{n-1} Cov(\mathbf{1}_{\{X_i \neq X_{i-1} \}}, \mathbf{1}_{\{X_{i+1} \neq X_{i} \}})\)

Den ersten Summanden kennen wir ja schon und der zweite Summand ist nicht 0 (was er bei Unabhängigkeit sein müsste, ist er aber nicht). Das lasse ich dich noch mal selbst ausrechnen. Es kommt aber ein Ergebnis raus, dass ziemlich nahe an deinem mit Matlab ermittelten Wert liegt.



  Profil  Quote  Link auf diesen Beitrag Link
bambusbieber
Aktiv Letzter Besuch: im letzten Quartal
Dabei seit: 10.01.2019
Mitteilungen: 91
Zum letzten BeitragZum nächsten BeitragZum vorigen BeitragZum erstem Beitrag  Beitrag No.10, vom Themenstarter, eingetragen 2019-07-25


Leider sehe ich die Abhänigkeit nicht.



rot ist x und x-1 sind verschieden
orange x und x+1 sind verschieden

blau ist beides ist verschieden... \(\frac{1}{2}*\frac{1}{2}=\frac{1}{4}\)



  Profil  Quote  Link auf diesen Beitrag Link
Kampfpudel
Senior Letzter Besuch: in der letzten Woche
Dabei seit: 02.08.2013
Mitteilungen: 1622
Zum letzten BeitragZum nächsten BeitragZum vorigen BeitragZum erstem Beitrag  Beitrag No.11, eingetragen 2019-07-25


Was hat diese Tabelle von 8 Stichproben mit der (Un-)abhängigkeit zu tun?

Wären \(Y_i\) und \(Y_{i+1}\) unabhängig, so müsste für beliebige \(a,b \in \{0,1\}\) die Gleichung

\(P(\{Y_i=a \} \cap \{Y_{i+1}=b \})= P (\{Y_i=a \}) \cdot P(\{ Y_{i+1}=b \})\)
gelten.

Insbesondere müsste (wenn man sich den Fall \(a=b=0\) heraus pickt) die folgende Gleichung gelten:

\(P(\{Y_i=0 \} \cap \{Y_{i+1}=0 \})= P (\{Y_i=0 \}) \cdot P(\{ Y_{i+1}=0 \})\)

Links kommt allerdings \(p^3 + q^3\) heraus, rechts \((p^2+q^2)^2\). Gleichheit gilt "nur" im Fall \(p= \frac{1}{2}\), wenn man die trivialen Fälle \(p=0\) oder \(p=1\) außer acht lässt.



  Profil  Quote  Link auf diesen Beitrag Link
bambusbieber
Aktiv Letzter Besuch: im letzten Quartal
Dabei seit: 10.01.2019
Mitteilungen: 91
Zum letzten BeitragZum nächsten BeitragZum vorigen BeitragZum erstem Beitrag  Beitrag No.12, vom Themenstarter, eingetragen 2019-07-25


Die Tabelle hilft für die Begründung von:

\(P(\{Y_i=0 \} \cap \{Y_{i+1}=0 \}) \neq P (\{Y_i=0 \}) \cdot P(\{ Y_{i+1}=0 \})\)

Leider gilt
\(P(\{Y_i=1 \} \cap \{Y_{i+1}=1 \}) = P (\{Y_i=1 \}) \cdot P(\{ Y_{i+1}=1 \})\)
 und damit hatte ich mich abgefunden... blöder Fehler



  Profil  Quote  Link auf diesen Beitrag Link
bambusbieber
Aktiv Letzter Besuch: im letzten Quartal
Dabei seit: 10.01.2019
Mitteilungen: 91
Zum letzten BeitragZum nächsten BeitragZum vorigen BeitragZum erstem Beitrag  Beitrag No.13, vom Themenstarter, eingetragen 2019-07-25


habe mich dazu entschieden die Covarianz nicht zu implementieren weil ich es verstanden habe und keine Lust mehr habe auf diese Aufgabe.

Der Code ist also nutzlos für die Varianz!!

Ich danke dir



  Profil  Quote  Link auf diesen Beitrag Link
Kampfpudel
Senior Letzter Besuch: in der letzten Woche
Dabei seit: 02.08.2013
Mitteilungen: 1622
Zum letzten BeitragZum nächsten BeitragZum vorigen BeitragZum erstem Beitrag  Beitrag No.14, eingetragen 2019-07-25


Jetzt verstehe ich, was du mit deiner Tabelle aussagen möchtest. Dort sind alle möglichen Abfolgen von 0en und 1en aufgelistet. Aber diese Abfolgen treten nicht alle gleich wahrscheinlich auf, solange nicht \(p=\frac{1}{2}\) gilt.

Deswegen gilt auch
\(P(\{Y_i=1 \} \cap \{Y_{i+1}=1 \}) = P (\{Y_i=1 \}) \cdot P(\{ Y_{i+1}=1 \})\)
nur für \(p=\frac{1}{2}\)


Edit: Wieso ist er nutzlos? Er liefert doch tatsächlich das, was rauskommen soll!
[Die Antwort wurde nach Beitrag No.12 begonnen.]



  Profil  Quote  Link auf diesen Beitrag Link
bambusbieber
Aktiv Letzter Besuch: im letzten Quartal
Dabei seit: 10.01.2019
Mitteilungen: 91
Zum letzten BeitragZum nächsten BeitragZum vorigen BeitragZum erstem Beitrag  Beitrag No.15, vom Themenstarter, eingetragen 2019-07-25


Nutzlos weil ich die formel nicht empirisch belegen werde was der eigentlich Nutzen war.


Ich bekomme für
\(4pq * 4pq = pqp + qpq \)
 mit \( q = p = \frac{1}{2} \)
\(1 * 1 \neq  \frac{2}{2^3} \)

Stimmt es also doch nicht für den fall dass p = 0.5 ist?



  Profil  Quote  Link auf diesen Beitrag Link
Kampfpudel
Senior Letzter Besuch: in der letzten Woche
Dabei seit: 02.08.2013
Mitteilungen: 1622
Zum letzten BeitragZum nächsten BeitragZum vorigen BeitragZum erstem Beitrag  Beitrag No.16, eingetragen 2019-07-25


\(P(\{Y_i=1 \} \cap \{Y_{i+1}=1 \})\) ergibt \(p^2q + pq^2 =pq(p+q)=pq\) und \(P (\{Y_i=1 \}) \cdot P(\{ Y_{i+1}=1 \}) = 2pq \cdot 2pq= 4p^2q^2\).  Bei dir sollte also jeweils \(2pq\) statt \(4pq\) stehen.

Noch immer verstehe ich nicht, wieso du alles über den Haufen werfen willst. Wenn man nun mit dem Wissen, dass \(Y_i\) und \(Y_{i+1}\) für \(i \in \{2,..., n-1\}\) nicht unabhängig sind, also der Term
\(Cov(\mathbf{1}_{\{X_i \neq X_{i-1} \}}, \mathbf{1}_{\{X_{i+1} \neq X_{i} \}})\)
nicht zwingend 0 ist, die nun korrekte Varianz ausrechnet (siehe Beitrag No. 9), so komme ich mit den Parametern aus deinem Beispiel, also \(n=1000\) und \(p=0.3\), auf eine tatsächliche Varianz von 310,422, was nun ziemlich nah an deinem empirisch mit 1000 Wiederholungen des Experiments ermittelten Wert von 308,007 liegt.

Also, sehr sehr wahrscheinlich funktioniert dein Programm einwandfrei




  Profil  Quote  Link auf diesen Beitrag Link
bambusbieber
Aktiv Letzter Besuch: im letzten Quartal
Dabei seit: 10.01.2019
Mitteilungen: 91
Zum letzten BeitragZum nächsten BeitragZum vorigen BeitragZum erstem Beitrag  Beitrag No.17, vom Themenstarter, eingetragen 2019-07-25


2019-07-25 18:17 - Kampfpudel in Beitrag No. 16 schreibt:
\(P(\{Y_i=1 \} \cap \{Y_{i+1}=1 \})\) ergibt \(p^2q + pq^2 =pq(p+q)=pq\) und \(P (\{Y_i=1 \}) \cdot P(\{ Y_{i+1}=1 \}) = 2pq \cdot 2pq= 4p^2q^2\).  Bei dir sollte also jeweils \(2pq\) statt \(4pq\) stehen.

Noch immer verstehe ich nicht, wieso du alles über den Haufen werfen willst. Wenn man nun mit dem Wissen, dass \(Y_i\) und \(Y_{i+1}\) für \(i \in \{2,..., n-1\}\) nicht unabhängig sind, also der Term
\(Cov(\mathbf{1}_{\{X_i \neq X_{i-1} \}}, \mathbf{1}_{\{X_{i+1} \neq X_{i} \}})\)
nicht zwingend 0 ist, die nun korrekte Varianz ausrechnet (siehe Beitrag No. 9), so komme ich mit den Parametern aus deinem Beispiel, also \(n=1000\) und \(p=0.3\), auf eine tatsächliche Varianz von 310,422, was nun ziemlich nah an deinem empirisch mit 1000 Wiederholungen des Experiments ermittelten Wert von 308,007 liegt.

Also, sehr sehr wahrscheinlich funktioniert dein Programm einwandfrei




Da hab ich durch meine 'smarte' Kombinatorik Tabelle die Wahrscheinlichkeiten doppelt gezählt...

Zum Haufen werfen.
Mir ist nur die Implementierung der Cov zu antrengend - das wird eine hickhack mit den schleifen in Matlab..

Die lösung weiß ich ja nun :)

wie gesagt - danke




  Profil  Quote  Link auf diesen Beitrag Link
bambusbieber hat die Antworten auf ihre/seine Frage gesehen.
bambusbieber hat selbst das Ok-Häkchen gesetzt.
Neues Thema [Neues Thema]  Druckversion [Druckversion]

 


Wechsel in ein anderes Forum:
 Suchen    
 
All logos and trademarks in this site are property of their respective owner. The comments are property of their posters, all the rest © 2001-2019 by Matroids Matheplanet
This web site was made with PHP-Nuke, a web portal system written in PHP. PHP-Nuke is Free Software released under the GNU/GPL license.
Ich distanziere mich von rechtswidrigen oder anstößigen Inhalten, die sich trotz aufmerksamer Prüfung hinter hier verwendeten Links verbergen mögen.
Lesen Sie die Nutzungsbedingungen, die Distanzierung, die Datenschutzerklärung und das Impressum.
[Seitenanfang]