Matroids Matheplanet Forum Index
Moderiert von Kleine_Meerjungfrau Monkfish epsilonkugel
Mathematik » Stochastik und Statistik » Wartezeitparadoxon
Druckversion
Druckversion
Antworten
Antworten
Autor
Universität/Hochschule Wartezeitparadoxon
Tintifax
Aktiv Letzter Besuch: im letzten Monat
Dabei seit: 20.09.2007
Mitteilungen: 30
Wohnort: Wien
Zum letzten BeitragZum nächsten BeitragZum vorigen BeitragZum erstem Beitrag  Themenstart: 2021-04-05


Hallo!

Ich komme hier beim Verständnis nicht weiter:

Busse fahren nach Fahrplan exakt jede Stunde vom Busbahnhof weg.
Bei einer entfernten Busstation kommen sie alle pünktlich jede Stunde an.
Dann ist an dieser Station der Erwartungswert der Intervalle \(\mu=1\).
Wenn man zu einem zufälligen Zeitpunkt zur Station kommt, dann ist die mittlere Wartezit 1/2 Stunde, intuitiv klar und die Rechnung dazu auch.

Wenn jetzt die Ankunftszeit der Busse durch z.B. unterschiedliches Verkehrsaufkommen streut, dann ist der Erwartungswert der Wartezeit laut https://de.wikipedia.org/wiki/Wartezeitparadoxon \(\frac{\mu}{2}+\frac{\sigma^2}{2\mu}\).
Dass der Erwartungswert der Wartezeit in diesem Fall größer als \(\frac{\mu}{2}\) sein muss ist mir klar. Die Wahrscheinlichkeit, ein längeres Intervall zu erwischen ist einfach größer als ein kürzeres. Die Herleitung für die exakte Berechnung verstehe ich aber leider gar nicht. Wieso fällt die Wartezeit linear von \(X_k\) auf 0? Woher kommt die Summe über die \(X_i^2\)?

Ich kann mir nur denken, dass man zuerst aus zwei Ankunftszeiten \(X_k\) und \(X_{k+1}\) über Differenzbildung auf die Intervallzeiten \(Y=X_{k+1}-X_k\) kommt. Habe das erwischte Intervall die Länge L. Von so einem Intervall wartet man auch im Mittel L/2 (bei Annahme einer symmetrischen Verteilung). Das muss man jetzt noch mit der Wahrscheinlichkeit gewichten, ein Intervall der Länge L zu erwischen.
Diese wird wohl proportional zur Länge sein: \(P(Y_i=L)=\alpha L\)?
Danke für jeden Tipp!

Gruß,
T



Eine Notiz zu diese Forumbeitrag schreiben Notiz   Profil  Quote  Link auf diesen Beitrag Link
Diophant
Senior Letzter Besuch: in der letzten Woche
Dabei seit: 18.01.2019
Mitteilungen: 6862
Wohnort: Rosenfeld, BW
Zum letzten BeitragZum nächsten BeitragZum vorigen BeitragZum erstem Beitrag  Beitrag No.1, eingetragen 2021-04-06

\(\begingroup\)\(\newcommand{\ba}{\begin{aligned}} \newcommand{\ea}{\end{aligned}} \newcommand{\bpm}{\begin{pmatrix}} \newcommand{\epm}{\end{pmatrix}} \newcommand{\bc}{\begin{cases}} \newcommand{\ec}{\end{cases}} \newcommand{\on}{\operatorname} \newcommand{\ds}{\displaystyle} \newcommand{\ID}{\mathbb{D}} \newcommand{\IW}{\mathbb{W}}\)
Hallo Tintifax,

ich habe jetzt lang über den Ansatz auf der verlinkten Wikipediaseite nachgegrübelt. Und gestern kräftig gegoogelt. Man findet diesen Ansatz aber nirgends (es geht sonst überall via Poisson-Prozess).

Meiner Ansicht nach könnte man sich diesen Ansatz folgendermaßen erklären: es wird ja zunächst eine feste Anzahl \(n\) an Bussen betrachtet, so dass \(X_1+X_2+\dotsc +X_n\) die Gesamtzeit zwischen 'Beginn Beobachtungszeitraum' und 'Ankunft letzter Bus' ist. Man könnte nun einen Mittelwert für die Wartezeit bekommen, indem man über alle einzelnen Wartezeiten integriert und das Integral zum Zweck der Mittelwertbildung durch die gesamte Wartezeit dividiert. Die \(\frac{X_i^2}{2}\) sind so gesehen die bestimmten Integrale über die einzelnen Wartezeiten, da ja jedesmal die Identität von 0 bis \(X_i\) aufsummiert wird.

Das wäre jetzt einmal so der Versuch einer Interpretation, denn das Resultat ist ja offensichtlich korrekt.

Die Wikipediaseite ist ja sicherlich auch nicht ohne Grund als unzureichend belegt gekennzeichnet.

Möglicherweise habe ich oben jetzt einen rechten Senf geschrieben. Ich wollte aber u.a. auch verhindern, dass diese interessante Frage einfach so untergeht...


Gruß, Diophant
\(\endgroup\)


Eine Notiz zu diese Forumbeitrag schreiben Notiz   Profil  Quote  Link auf diesen Beitrag Link
Tintifax
Aktiv Letzter Besuch: im letzten Monat
Dabei seit: 20.09.2007
Mitteilungen: 30
Wohnort: Wien
Zum letzten BeitragZum nächsten BeitragZum vorigen BeitragZum erstem Beitrag  Beitrag No.2, vom Themenstarter, eingetragen 2021-04-08


Ah, schön langsam verstehe ich, was gemeint sein könnte.
Danke für deine Idee!
Ich habe mal einen anderen Ansatz probiert, leider kommt nicht das gleiche raus:
Sagen wir, die Intervalle haben als Verteilung die Dichte \(f_X(x)\).
\(f_X(x)\) ist also die Wahrscheinlichkeitsdichte, ein Intervall der Länge \(x\) zu treffen (\(f_X(x)\) ist ja die relative Häufigkeit des Auftretens eines Intervalls der Länge \(x\)). Wenn man jetzt die Intervalllängen \(x\) mit ihrer relativen Häufigkeit gewichtet (\(x \cdot f_X(x)\)) , bekommt man die Verteilung der Intervallzeiten nach ihrer Trefferwahrscheinlichkeit. Die mittlere Intervalllänge ist jetzt der Erwartungswert dieser Verteilung: \(E(x \cdot f_X(x)) = \int_{-\infty}^{\infty}{x \cdot x \cdot f_X(x)}{dx}\), was nichts anderes ist als \(E(X^2)\).
Die mittlere Wartezeit ist jetzt (bei symmetrischer Verteilung) genau die Hälfte dieser Intervalllänge.
Somit sollte die mittlere Wartezeit \(\frac{1}{2}E(X^2)=\frac{1}{2}Var(X)+\frac{1}{2}E^2(X) = \frac{\sigma^2}{2} + \frac{\mu^2}{2}\) sein.
Wo ist mein Fehler?



Eine Notiz zu diese Forumbeitrag schreiben Notiz   Profil  Quote  Link auf diesen Beitrag Link
Diophant
Senior Letzter Besuch: in der letzten Woche
Dabei seit: 18.01.2019
Mitteilungen: 6862
Wohnort: Rosenfeld, BW
Zum letzten BeitragZum nächsten BeitragZum vorigen BeitragZum erstem Beitrag  Beitrag No.3, eingetragen 2021-04-08

\(\begingroup\)\(\newcommand{\ba}{\begin{aligned}} \newcommand{\ea}{\end{aligned}} \newcommand{\bpm}{\begin{pmatrix}} \newcommand{\epm}{\end{pmatrix}} \newcommand{\bc}{\begin{cases}} \newcommand{\ec}{\end{cases}} \newcommand{\on}{\operatorname} \newcommand{\ds}{\displaystyle} \newcommand{\ID}{\mathbb{D}} \newcommand{\IW}{\mathbb{W}}\)
Hallo Tintifax,

du hast ja diese "Trefferwahrscheinlichkeit" nicht näher charakterisiert. Die müsste ja gegeben sein durch etwas wie

\(P(X=X_i)=\frac{X_i}{X_1+X_2+\dotsc+X_n}\).

Auf der anderen Seite ist in deinem Ergebnis eben genau der Faktor \(\mu\approx\frac{X_1+X_2+\dotsc+X_n}{n}\) zu viel.

Das korrespondiert zwar irgendwie miteinander, ich bin mir aber nicht sicher, ob man das so angehen kann.

In meiner Überlegung habe ich einfach die Gleichverteilung der einzelnen Wartezeiten verwendet (also: innerhalb des Intervalls, in dem du an die Haltestelle kommst, tritt jede Wartezeit mit der gleichen Wahrscheinlichkeit auf). Und dann habe ich einfach die Wartezeiten folgendermaßen aufsummiert:

\[\int_0^{X_i}{x_i \on{dx_i}}=\frac{x_i^2}{2}\Bigg|_0^{X_i}=\frac{X_i^2}{2}\]
Alle diese "Wartezeiten-Summen" addiert und diese Summe durch die gesamte Wartezeit \(\sum_{i=1}^n X_i\) dividiert ergibt dann eben gerade den Anfangsterm der Betrachtung bei Wikipedia. Und dieser schnoddrige Nebensatz mit der linearen Abnahme der Wartezeit könnte u.U. so zu verstehen sein, eine solche Überlegung zu motivieren.

Ich gebe aber offen zu, dass das zu 100% 'reverse engineering' ist, einfach weil dieser Ansatz irgendwo genial wäre - so er denn stimmt...

Nachtrag:
Eine stringente Überlegung/Begründung steht im folgenden Beitrag, vergiss also meine Idee hier.

Wie gesagt: das Problem hatte mich irgendwie auf Anhieb fasziniert und ich hatte deine Frage sozuagen als eine Art Knobelaufgabe gekapert...


Gruß, Diophant
\(\endgroup\)


Eine Notiz zu diese Forumbeitrag schreiben Notiz   Profil  Quote  Link auf diesen Beitrag Link
Nuramon
Senior Letzter Besuch: in der letzten Woche
Dabei seit: 23.01.2008
Mitteilungen: 2759
Zum letzten BeitragZum nächsten BeitragZum vorigen BeitragZum erstem Beitrag  Beitrag No.4, eingetragen 2021-04-08

\(\begingroup\)\(\renewcommand{\Re}{\operatorname{Re}} \renewcommand{\Im}{\operatorname{Im}} \newcommand{\End}{\operatorname{End}} \newcommand{\id}{\operatorname{id}} \newcommand{\GL}{\operatorname{GL}} \newcommand{\im}{\operatorname{im}} \newcommand{\sgn}{\operatorname{sgn}} \newcommand{\d}{{\rm d}} \newcommand{\rg}{\operatorname{rg}} \newcommand{\spur}{\operatorname{spur}} \newcommand{\Hom}{\operatorname{Hom}} \newcommand{\tr}{\operatorname{tr}} \newcommand{\opn}{\operatorname}\)
Hallo,

der Term auf Wikipedia dürfte so zustande kommen:
Wenn man zu einem zufälligen Zeitpunkt nach der Ankunft des $i-1$-ten aber vor der Ankunft des $i$-ten Busses zur Haltestelle kommt, dann muss man im Schnitt $\frac 12 X_i$ Zeiteinheiten warten.
Die Wahrscheinlichkeit zwischen dem $i-1$-ten und dem $i$-ten Bus anzukommen, beträgt bei $n$ Bussen $X_i/(X_1+\ldots +X_n)$.
Damit ergibt sich als zu erwartende Wartezeit $\sum_{i=1}^n \frac 12X_i \cdot X_i/(X_1+\ldots +X_n)$.

[Die Antwort wurde nach Beitrag No.2 begonnen.]
\(\endgroup\)


Eine Notiz zu diese Forumbeitrag schreiben Notiz   Profil  Quote  Link auf diesen Beitrag Link
Diophant
Senior Letzter Besuch: in der letzten Woche
Dabei seit: 18.01.2019
Mitteilungen: 6862
Wohnort: Rosenfeld, BW
Zum letzten BeitragZum nächsten BeitragZum vorigen BeitragZum erstem Beitrag  Beitrag No.5, eingetragen 2021-04-08


@Nuramon:
Das ist es. Damit ist meine Überlegung hinfällig (weil entweder falsch oder viel zu umständlich).

Rätsel gelöst, dankeschön! 🙂


Gruß, Diophant



Eine Notiz zu diese Forumbeitrag schreiben Notiz   Profil  Quote  Link auf diesen Beitrag Link
Tintifax
Aktiv Letzter Besuch: im letzten Monat
Dabei seit: 20.09.2007
Mitteilungen: 30
Wohnort: Wien
Zum letzten BeitragZum nächsten BeitragZum vorigen BeitragZum erstem Beitrag  Beitrag No.6, vom Themenstarter, eingetragen 2021-04-10


Ja vielen Dank!
Ich versuche trotzdem noch meinen Ansatz über die Dichte hinzubekommen.

\(\endgroup\)
\(\begingroup\)\(\newcommand{\ba}{\begin{aligned}} \newcommand{\ea}{\end{aligned}} \newcommand{\bpm}{\begin{pmatrix}} \newcommand{\epm}{\end{pmatrix}} \newcommand{\bc}{\begin{cases}} \newcommand{\ec}{\end{cases}} \newcommand{\on}{\operatorname} \newcommand{\ds}{\displaystyle} \newcommand{\ID}{\mathbb{D}} \newcommand{\IW}{\mathbb{W}}\)2021-04-08 15:40 - Diophant in Beitrag No. 3 schreibt:
Hallo Tintifax,

du hast ja diese "Trefferwahrscheinlichkeit" nicht näher charakterisiert. Die müsste ja gegeben sein durch etwas wie

\(P(X=X_i)=\frac{X_i}{X_1+X_2+\dotsc+X_n}\).
\(\endgroup\)

Ist nicht gerade die Dichte die relative Häufigkeit der Intervallzeiten und damit die WK ihres Auftretens?

Was ich aber gerade bemerkt habe:
Die gewichteten Intervallzeiten \(x \cdot f_X(x)\) sind ja keine Dichte, und die Normierungskonstante lässt sich ohne Annahme einer konkreten Dichte wohl nicht angeben.



Eine Notiz zu diese Forumbeitrag schreiben Notiz   Profil  Quote  Link auf diesen Beitrag Link
Tintifax hat die Antworten auf ihre/seine Frage gesehen.
Neues Thema [Neues Thema] Antworten [Antworten]    Druckversion [Druckversion]

 


Wechsel in ein anderes Forum:
 Suchen    
 
All logos and trademarks in this site are property of their respective owner. The comments are property of their posters, all the rest © 2001-2021 by Matroids Matheplanet
This web site was originally made with PHP-Nuke, a former web portal system written in PHP that seems no longer to be maintained nor supported. PHP-Nuke is Free Software released under the GNU/GPL license.
Ich distanziere mich von rechtswidrigen oder anstößigen Inhalten, die sich trotz aufmerksamer Prüfung hinter hier verwendeten Links verbergen mögen.
Lesen Sie die Nutzungsbedingungen, die Distanzierung, die Datenschutzerklärung und das Impressum.
[Seitenanfang]