Forum:  Stochastik und Statistik
Thema: Vergleich zweier Stichproben
Themen-├ťbersicht
xxxyyy
Aktiv
Dabei seit: 09.04.2016
Mitteilungen: 68
Themenstart: 2020-10-21 20:04

Hallo zusammen,

mal eine Frage an alle die sich mit Statistik besser auskennen als ich (also vermutlich jeder hier ­čśä).

+++++++++
Problemstellung:

Gegeben sind zwei Stichproben, die miteinander verglichen werden sollen. Ziel ist es zu sagen wie ├Ąhnlich die zugrundeliegenden Verteilungen sind und ob die Stichproben eventuell aus derselben Grundgesamtheit stammen. Ideal w├Ąre es einen Kennwert zu haben an dem man festmachen kann wie ├Ąhnlich sich die den Stichproben zugrundeliegenden Verteilungen sind (z.B. 0 f├╝r komplett verschieden und 1 f├╝r identisch).

Die Datenpunkte der Stichprobe k├Ânnen von beliebiger Dimensionalit├Ąt sein d.h. ein Datenpunkt kann z.B. sein x=(1,1) oder x=(1,1,1,...). Ein Ansatz, den ich mir vorstellen k├Ânnte w├Ąre es die Stichproben f├╝r jede Koordinate zu vergleichen und dann die Ergebnisse der Koordinaten irgendwie zu mitteln - aber nur so eine Idee meinerseits.

Es ist nicht bekannt welche Verteilungen den Stichproben zugrunde liegt und die zwei Stichproben selbst k├Ânnen auch unterschiedliche Verteilungen besitzen.
+++++++++

Wenn jemand eine Idee hat oder ein Verfahren kennt, das man auf diese Problemstellung anwenden k├Ânnte, w├Ąre es toll, wenn er das mal in die Runde werfen k├Ânnte. Bei einem statistischen Verfahren reicht auch bereits die Bezeichnung (einarbeiten kann ich mich dann selbst).

Vielen Dank schon mal vorab :)


Caban
Senior
Dabei seit: 06.09.2018
Mitteilungen: 1448
Herkunft: Brennpunkt einer Parabel
Beitrag No.1, eingetragen 2020-10-21 20:35

Hallo

Sagt dir der t-test und fer F-test was?

Gru├č Caban


xxxyyy
Aktiv
Dabei seit: 09.04.2016
Mitteilungen: 68
Beitrag No.2, vom Themenstarter, eingetragen 2020-10-22 09:13

Danke, aber die gehen doch nur bei Normalverteilung bzw. TVerteilung,oder?


luis52
Senior
Dabei seit: 24.12.2018
Mitteilungen: 410
Beitrag No.3, eingetragen 2020-10-22 09:18

Moin allerseits,

ein t-Test ist im Prinzip anwendbar, wenn Annahmen hinsichtlich der Verteilung in den Grundgesamtheiten getroffen werden koennen, insbesondere Normalverteilung. Das ist hier ausdruecklich nicht der Fall, weswegen ich eher einen nichtparametrischen Test vorschlage.

Die Idee der Mittelung der Werte koennte vielleicht zum Ziel fuehren. So entstehen ordinal skalierte Daten, wofuer bspw. der Mann-Whitney-Wilcoxon-Test geeignet ist.

vg Luis

[Die Antwort wurde nach Beitrag No.1 begonnen.]


xxxyyy
Aktiv
Dabei seit: 09.04.2016
Mitteilungen: 68
Beitrag No.4, vom Themenstarter, eingetragen 2020-10-22 10:32

Hallo, habe Mal nach den Test recherchiert. Der Test ist in der Lage zu sagen ob ein zuf├Ąlliger Wert aus einer Population (bei mir w├Ąre das in N├Ąherung Stichprobe 1) im Mittel gr├Â├čer oder kleiner als ein zuf├Ąlliger aus einer anderen Population (bei mir dann Stichprobe 2) ausgew├Ąhlter Wert ist.

Deine Idee w├Ąre nun: Wenn die Werte ca. Identisch sind, sind die Stichproben identisch? Dazu m├╝sste ich den Test praktisch f├╝r jede Koordinate durchf├╝hren und dann aus den erhaltenen Abweichungen den Mittelwert der Betr├Ąge bilden.
Kann ich dir folgen?


luis52
Senior
Dabei seit: 24.12.2018
Mitteilungen: 410
Beitrag No.5, eingetragen 2020-10-22 11:08

Ich weiss nicht, ob *ich* dir folgen kann ...

Nehmen wir an, deine Datenssaetze sind

DS 1: $(1,1)$, $(1,1,1)$, $(1,1)$, $(1,1,1,1)$
DS 2: $(1,1,1)$, $(1,1,1)$, $(1,1)$, $(1,1,1,1)$, (1,1,1,1,1)

Durschnittsbildung ist doch nicht hilfreich, denn du erhaeltst jeweils
das arithmetische Mittel $1$. Bildest du hingegen Summen, so ergibt sich


DS 1: $2,3,2,4$
DS 2: $3,3,2,4,5$

Und fuer diese Situation ist der MWW-Test durchaus geeignet. Wichtig ist,
dass die Daten zumindest ein ordinales Messniveau haben.


vg Luis



xxxyyy
Aktiv
Dabei seit: 09.04.2016
Mitteilungen: 68
Beitrag No.6, vom Themenstarter, eingetragen 2020-10-22 12:25

Danke f├╝r die R├╝ckmeldung.

Ich denke das mit der Dimensionalit├Ąt w├╝rde bei der Problemstellung nicht ganz klar.
Die Daten in den beiden Stichproben habe alle dieselbe Dimensionalit├Ąt. Nur die Dimensionalit├Ąt selbst kann abweichen d.h. der Test soll auf Daten beliebiger Dimensionalit├Ąt angewendet werden k├Ânnen.

Z.B.
Stichprobe 1: (1,1,1), (1,2,3), ...
Stichprobe 2: (2,2,2), (3,2,1), ...

Aber es k├Ânnte z.B. auch sein
Stichprobe 1: (1,1,1,1), (1,2,3,4), ...
Stichprobe 2: (2,2,2,2), (4,3,2,1), ...


luis52
Senior
Dabei seit: 24.12.2018
Mitteilungen: 410
Beitrag No.7, eingetragen 2020-10-22 14:00

2020-10-22 12:25 - xxxyyy in Beitrag No. 6 schreibt:
Die Daten in den beiden Stichproben habe alle dieselbe Dimensionalit├Ąt. Nur die Dimensionalit├Ąt selbst kann abweichen d.h. der Test soll auf Daten beliebiger Dimensionalit├Ąt angewendet werden k├Ânnen.

Okay, das aendert aber nichts an meinem Vorschlag ...

vg Luis


xxxyyy
Aktiv
Dabei seit: 09.04.2016
Mitteilungen: 68
Beitrag No.8, vom Themenstarter, eingetragen 2020-10-22 16:20

Ja, vielen Dank f├╝r deinen Vorschlag, das kann ich Mal ausprobieren :).

Was ich meine ist, wenn man den Test f├╝r jede Achse durchf├╝hrt und dann aus den sich ergebenden U-Werten den Mittelwert bildet.
Denkst du das w├╝rde auch gehen?


luis52
Senior
Dabei seit: 24.12.2018
Mitteilungen: 410
Beitrag No.9, eingetragen 2020-10-22 17:20

2020-10-22 16:20 - xxxyyy in Beitrag No. 8 schreibt:
Was ich meine ist, wenn man den Test f├╝r jede Achse durchf├╝hrt und dann aus den sich ergebenden U-Werten den Mittelwert bildet.
Denkst du das w├╝rde auch gehen?

So, aus der Ferne laesst sich das nicht  sagen. Wie wurde man den gemittelten U-Wert denn interpretieren?


vg Luis


xxxyyy
Aktiv
Dabei seit: 09.04.2016
Mitteilungen: 68
Beitrag No.10, vom Themenstarter, eingetragen 2020-10-22 18:16

Ja, stimmt. Vielen Dank schon Mal an dich.
Bin nat├╝rlich f├╝r weitere Vorschl├Ąge offen ;)




Dieses Forumbeitrag kommt von Matroids Matheplanet
https://https://matheplanet.de

Die URL f├╝r dieses Forum-Thema ist:
https://https://matheplanet.de/default3.html?topic=249940=100
Druckdatum: 2021-01-19 22:31