Die Mathe-Redaktion - 14.10.2019 15:37 - Registrieren/Login
Auswahl
ListenpunktHome
ListenpunktAktuell und Interessant ai
ListenpunktArtikelübersicht/-suche
ListenpunktAlle Links / Mathe-Links
ListenpunktFach- & Sachbücher
ListenpunktMitglieder / Karte / Top 15
ListenpunktRegistrieren/Login
ListenpunktArbeitsgruppen
Listenpunkt? im neuen Schwätz
ListenpunktWerde Mathe-Millionär!
ListenpunktFormeleditor fedgeo
Schwarzes Brett
Aktion im Forum
Suche
Stichwortsuche in Artikeln und Links von Matheplanet
Suchen im Forum
Suchtipps

Bücher
Englische Bücher
Software
Suchbegriffe:
Mathematik bei amazon
Naturwissenschaft & Technik
In Partnerschaft mit Amazon.de
Kontakt
Mail an Matroid
[Keine Übungsaufgaben!]
Impressum

Bitte beachten Sie unsere Nutzungsbedingungen, die Distanzierung, unsere Datenschutzerklärung und
die Forumregeln.

Sie können Mitglied werden. Mitglieder können den Matheplanet-Newsletter bestellen, der etwa alle 2 Monate erscheint.

Der Newsletter Okt. 2017

Für Mitglieder
Mathematisch für Anfänger
Wer ist Online
Aktuell sind 463 Gäste und 14 Mitglieder online.

Sie können Mitglied werden:
Klick hier.

Über Matheplanet
 
Zum letzten Themenfilter: Themenfilter:
Matroids Matheplanet Forum Index
Moderiert von Kleine_Meerjungfrau Monkfish epsilonkugel
Mathematik » Stochastik und Statistik » Standardabweichung bei nicht normalverteilten Daten
Druckversion
Druckversion
Antworten
Antworten
Autor
Beruf Standardabweichung bei nicht normalverteilten Daten
MartinaS
Aktiv Letzter Besuch: im letzten Quartal
Dabei seit: 11.03.2014
Mitteilungen: 35
Zum letzten BeitragZum nächsten BeitragZum vorigen BeitragZum erstem Beitrag  Themenstart: 2019-08-01


Hallo!

Ich habe eine Zahlenreihe mit Zahlen zwischen 3 und 7, die nicht normalverteilt (bzw. ähnlich dazu) sind, also nicht die typische glockenartige Form aufweisen. Die Zahlen können immer wieder neu zufällig erzeugt werden.

Im Mathematikbuch wurde beschrieben, dass das Standardabweichungsintervall einen Bereich angibt, in dem etwa 68,3% der Messwerte liegen. Wenn ich für diese Reihe das Intervall berechne liegen meistens jedoch nur etwa 30% der Werte darin. Das erscheint mir auch logisch, da es ja eben keine Normalverteilung ist, mit der die Zahlen erzeugt werden, aber die Frage die sich mir dann stellt ist, wozu mir das Buch diese Information gibt und mich dann eine Aufgabe berechnen lässt, wo das gar nicht passt...?

Anders formuliert: Welchen Nutzen hat die Standardabweichung denn bei nicht normalverteilten Stichproben, wenn sie eben NICHT den obigen 68,3%-Satz einhält? Oder macht man das nur aus Spaß am rechnen? wink

Vielen Dank für die Antworten!

Martina



  Profil  Quote  Link auf diesen Beitrag Link
Radix
Senior Letzter Besuch: im letzten Monat
Dabei seit: 20.10.2003
Mitteilungen: 6138
Aus: Wien
Zum letzten BeitragZum nächsten BeitragZum vorigen BeitragZum erstem Beitrag  Beitrag No.1, eingetragen 2019-08-01


Hallo Martina!

Die Standardabweichung ist ein Maß dafür, wie weit die Daten vom Mittelwert entfernt liegen. Das ist für alle Verteilungen sinnvoll, nicht nur für die Normalverteilung. Diese 68,3% gelten jedoch nur für die Normalverteilung.

Beispiel: Du hast 3 Datenwerte: Einer in der Mitte, einer weit links und einer weit rechts. Durch Verschieben der beiden äußeren Datenwerte kannst du die Standardabweichung beliebig vergrößern/verkleinern. Trotzdem wird immer genau 1 Datenwert (der in der Mitte) im Standardabweichungsintervall liegen.

Gruß,
Radix



  Profil  Quote  Link auf diesen Beitrag Link
hgseib
Aktiv Letzter Besuch: im letzten Monat
Dabei seit: 04.04.2019
Mitteilungen: 172
Zum letzten BeitragZum nächsten BeitragZum vorigen BeitragZum erstem Beitrag  Beitrag No.2, eingetragen 2019-08-01


- entweder ist die Stichprobe zu klein (so das man die wahre Verteilung nicht daraus erkennen kann)
- oder die Daten sind links/rechts schief verteilt
- oder die Daten sind tatsächlich nicht normalverteilt

Letzteres kann und sollte man zwingend als erstes Prüfen: Test auf Normalverteilung.

Liegt keine Normalverteilung vor, dann ist jegliche Berechnung auf Basis der Normalverteilung logischer Weisse absolut sinnfrei.

Und es zeigt einmal mehr, das man sich nicht nur auf Zahlen verlassen darf, sondern sich Gedanken über Art und Herkunft der Daten machen muss.

mfg



  Profil  Quote  Link auf diesen Beitrag Link
Diophant
Senior Letzter Besuch: in der letzten Woche
Dabei seit: 18.01.2019
Mitteilungen: 1889
Aus: Rosenfeld, BW
Zum letzten BeitragZum nächsten BeitragZum vorigen BeitragZum erstem Beitrag  Beitrag No.3, eingetragen 2019-08-02

\(\begingroup\)\( \newcommand{\ba}{\begin{aligned}} \newcommand{\ea}{\end{aligned}} \newcommand{\bpm}{\begin{pmatrix}} \newcommand{\epm}{\end{pmatrix}} \newcommand{\bc}{\begin{cases}} \newcommand{\ec}{\end{cases}}\)
Hallo,

wie schon von Radix angedeutet, ist die Standardabweichung ein Maß für die Streuung von Daten, und zwar im Gegensatz zur Varianz ein Maß, bei dem die Einheit die gleiche ist wie die der Stichprobendaten. Und neben der Bedeutung, die das Konzept rein theoretisch in der Stochastik hat, ist das von allergrößter praktischer Relevanz.

Nehmen wir mal an, auf einer Maschine werden Präzisionsbolzen mit eine Länge von l=20mm gefertigt. Täglich werden der Produktion nun eine bestimmte Anzahl dieser Bolzen entnommen und ihre Länge vermessen. Dabei erhält man eine Stichprobe, die man nun zu Qualitätssicherungszwecken statistisch aufarbeiten kann. Es ist offensichtlich, dass man für den Mittelwert der Stichprobe einen Bereich \([20-\Delta l,20+\Delta l]\) vorgeben wird, wobei der maximal zulässige Fehler \(\Delta l\) noch von den Anforderungen an die Bolzen abhängt.

Weiter wird man eine bestimmte Erwartung an die Standardabweichung haben, denn diese sagt uns, wie stark die Längen der Bolzen um den Mittelwert herum streuen. D.h., die Standardabweichung darf einen bestimmten Wert nicht überschreiten, damit die Stichprobe den Qualitätsanforderungen genügt.

Und natürlich kann man das jetzt noch weiter aufarbeiten (man zählt ja auch die Anzahl der Werkstücke, die aus den Vorgaben herausfallen, etc.), aber ich möchte hier auf eine interessante Tatsache hinweisen, die vielleicht nicht ganz so bekannt ist:

- wenn bei einem solchen Qualitätstest der Mittelwert vom Zielwert zu stark abweicht, dann wird man davon ausgehen, dass die Produktionsanlage falsch bzw. unzureichend kalibriert ist.
- wenn die Standardabweichung zu groß ist, wird man dagegen von Abnutzungserscheinungen oder Defekten an der Anlage ausgehen, in der Regel durch versäumte Wartungsarbeiten verursacht.

Das mal als praktische Veranschaulichung, um was es dabei in der Praxis geht. Denn das Wort 'Streuungsmaß' ist sonst schon ein wenig arg abstrakt.  smile


Gruß, Diophant
\(\endgroup\)


  Profil  Quote  Link auf diesen Beitrag Link
Kitaktus
Senior Letzter Besuch: in der letzten Woche
Dabei seit: 11.09.2008
Mitteilungen: 6048
Aus: Niedersachsen
Zum letzten BeitragZum nächsten BeitragZum vorigen BeitragZum erstem Beitrag  Beitrag No.4, eingetragen 2019-08-02


2019-08-01 16:35 - MartinaS im Themenstart schreibt:
Wenn ich für diese Reihe das Intervall berechne liegen meistens jedoch nur etwa 30% der Werte darin.

Dass nur 30% der Stichprobe vom Mittelwert eine Abweichung kleiner als die Standardabweichung haben, ist möglich, aber dazu muss die Verteilung schon recht speziell sein(*).
Könnte es sein, dass hier ein Rechenfehler vorliegt? Kannst Du die Werte hier posten? 10 Stück oder so würden für den Anfang schon reichen.

(*) Insbesondere müsste die Wahrscheinlichkeitsdichte in einem Bereich um den Mittelwert herum relativ niedrig sein, niedriger als in einigen Bereichen, die mehr als eine Standardabweichung vom Mittelwert entfernt sind. Das ist schon recht ungewöhnlich.



  Profil  Quote  Link auf diesen Beitrag Link
MartinaS
Aktiv Letzter Besuch: im letzten Quartal
Dabei seit: 11.03.2014
Mitteilungen: 35
Zum letzten BeitragZum nächsten BeitragZum vorigen BeitragZum erstem Beitrag  Beitrag No.5, vom Themenstarter, eingetragen 2019-08-02


Guten Abend,

vielen Dank für die Rückmeldungen! Das ist schon sehr hilfreich, aber ganz verstanden habe ich es immer noch nicht. Was die Standardabweichung für normalverteilte Daten bedeutet ist klar, der allgemeine Zusammenhang zur Streuung der Daten denke ich auch.

Aber zum Hinweis von Radix: "Die Standardabweichung ist ein Maß dafür, wie weit die Daten vom Mittelwert entfernt liegen. Das ist für alle Verteilungen sinnvoll, nicht nur für die Normalverteilung." - Das es einen Zusammenhang gibt ist klar, wie genau sieht dieser aus?

Also z.B.: Ich habe Daten mit dem Mittelwert 5 und Standardabweichung 3. Wenn sie normalverteilt sind, bedeutet das, dass wahrscheinlich ca. 68,3% der Elemente zwischen 2 und 8 liegen. Was bedeutet es, wenn sie nicht normalverteilt sind?

Zur Frage nach meinen Daten (Ich weiß leider nicht, wie ich sie hier am besten einstellen kann):


4
4
5
6
4
5
4
5
6
6
4
4
4
6
4
6
6
5
5
4
4
6
4
6
6
5
4
5
5
6
4
4
6
5
6
4
5
6
6
4
5
6
5
6
5
5
5
5
6
5
4
6
4
5
5
5
4
5
6
4
6
4
6
4
4
4
4
4
5
6
4
6
4
4
6
4
6
4
5
5
4
5
4
5
4
5
5
6
4
6
4
4
4
6
4
5
5
6
4
5


Wenn ich mich nicht verrechnet habe, beträgt die Standardabweichung etwa 0,83, aber nur 31% der Elemente liegen im entsprechenden Intervall. Wenn ich die Listenelemente "neu auswürfeln" lasse, ist das in den meisten Fällen ähnlich.




  Profil  Quote  Link auf diesen Beitrag Link
Radix
Senior Letzter Besuch: im letzten Monat
Dabei seit: 20.10.2003
Mitteilungen: 6138
Aus: Wien
Zum letzten BeitragZum nächsten BeitragZum vorigen BeitragZum erstem Beitrag  Beitrag No.6, eingetragen 2019-08-03


Für jede Verteilung gilt: Je größer die Standardabweichung, desto weiter liegen die Daten vom Mittelwert entfernt.

Dieser Prozentsatz ist aber bei jeder Verteilung anders.

Gruß,
Radix



  Profil  Quote  Link auf diesen Beitrag Link
hgseib
Aktiv Letzter Besuch: im letzten Monat
Dabei seit: 04.04.2019
Mitteilungen: 172
Zum letzten BeitragZum nächsten BeitragZum vorigen BeitragZum erstem Beitrag  Beitrag No.7, eingetragen 2019-08-03


2019-08-01 16:35 - MartinaS im Themenstart schreibt:
Ich habe eine Zahlenreihe mit Zahlen zwischen 3 und 7, die nicht normalverteilt (bzw. ähnlich dazu) sind, also nicht die typische glockenartige Form aufweisen. Die Zahlen können immer wieder neu zufällig erzeugt werden.

2019-08-02 23:01 - MartinaS in Beitrag No. 5 schreibt:
Wenn ich die Listenelemente "neu auswürfeln" lasse, ist das in den meisten Fällen ähnlich.

Man kann z.B. das mittlere Gewicht und die sich daraus ergebende Standardabweichung von einem Auto, einer Banane und einem Nasenpobel berechnen. Nur sinnvoll ist das nicht.

Wenn du deine Zahlen erwürfelst, dann sind sie wohl gleich verteilt. Gleichverteilt ist nicht Normalverteilt.

Wird nicht Chinesisch gesprochen, dann nützt auch ein chinesischer Übersetzer nichts. Bzw. was der dann übersetzen wird, wird wenig sinnvoll sein.


Was auch immer in deinem Mathematikbuch stehen mag und egal wie Richtig die Aussagen der Anderen über die Standardabweichung auch sind. Nicht Normalverteilt ist und bleibt nicht Normalverteilt.

2019-08-01 20:43 - hgseib in Beitrag No. 2 schreibt:
Liegt keine Normalverteilung vor, dann ist jegliche Berechnung auf Basis der Normalverteilung logischer Weisse absolut sinnfrei.


Wenn du etwas über Statistik lernen möchtest, dann empfehle ich dir ein anderes Buch zu nehmen ;-)
Oder maile mal den Autor/-in an, was es/sie sich dabei gedacht hat.


mfg



  Profil  Quote  Link auf diesen Beitrag Link
Diophant
Senior Letzter Besuch: in der letzten Woche
Dabei seit: 18.01.2019
Mitteilungen: 1889
Aus: Rosenfeld, BW
Zum letzten BeitragZum nächsten BeitragZum vorigen BeitragZum erstem Beitrag  Beitrag No.8, eingetragen 2019-08-03


Hallo nochmals,

2019-08-02 23:01 - MartinaS in Beitrag No. 5 schreibt:
vielen Dank für die Rückmeldungen! Das ist schon sehr hilfreich, aber ganz verstanden habe ich es immer noch nicht. Was die Standardabweichung für normalverteilte Daten bedeutet ist klar, der allgemeine Zusammenhang zur Streuung der Daten denke ich auch.

Aber zum Hinweis von Radix: "Die Standardabweichung ist ein Maß dafür, wie weit die Daten vom Mittelwert entfernt liegen. Das ist für alle Verteilungen sinnvoll, nicht nur für die Normalverteilung." - Das es einen Zusammenhang gibt ist klar, wie genau sieht dieser aus?

Um das besser zu verstehen, solltest du dich nochmals mit der Varianz beschäftigen.

Die Idee, einen Gesamtfehler durch Summation der Quadrate von Einzelfehlern zu messen, geht auf Carl Friedrich Gauss zurück. Diese Idee steckt auch hinter dem Konzept der Varianz. Die Stichprobenvarianz liefert im Prinzip den Durchschnitt der quadrierten Abweichungen vom Mittelwert einer Stichprobe zurück. Demenstprechend tut dies die Varianz für die Wahrscheinlichkeits- bzw. Dichtefunktion einer Wahrscheinlichkeitsverteilung.

Es gibt nun mehrere Gründe, vom so gemessenen "Fehler" noch die Quadratwurzel zu ziehen. Diese nennt man dann Standardabweichung. Ein ganz praktischer Grund ist der, dass diese wieder die gleiche Einheit besitzt wie die Stichprobendaten. Die mathematische Theorie liefert noch wesentlich triftigere Gründe für das Konzept der Standardabweichung als Streuungsparameter.

Der einzige Nachteil ist, dass man jetzt keine griffige Formulierung für die Interpretation der Zahlenwerte hat. In der Mathematik gilt eben meist Qualität vor Quantität und frei nach diesem Motto lässt sich dieses Manko, also dass die Standardabweichung keine "anschauliche" Größe ist, leicht verschmerzen.


Gruß, Diophant



  Profil  Quote  Link auf diesen Beitrag Link
MartinaS
Aktiv Letzter Besuch: im letzten Quartal
Dabei seit: 11.03.2014
Mitteilungen: 35
Zum letzten BeitragZum nächsten BeitragZum vorigen BeitragZum erstem Beitrag  Beitrag No.9, vom Themenstarter, eingetragen 2019-08-03


2019-08-03 10:14 - Diophant in Beitrag No. 8 schreibt:
Der einzige Nachteil ist, dass man jetzt keine griffige Formulierung für die Interpretation der Zahlenwerte hat.

Aber genau das meine ich ja. Korrigiert mich gerne, wenn ich immer noch auf dem Schlauch stehe, aber das ist in diesem Zusammenhang ein ganz erheblicher Nachteil (abgesehen von normalverteilten Daten natürlich). Wie hier auch schon so schön erläutert wurde scheint mir der Begriff der Standardabweichung doch gerade dazu da zu sein, eine Vorstellung von der Streuung der Daten zu bekommen.
Und da erscheint mir "je größer desto größer die Streuung" einfach viel zu ungenau.

Entweder entgeht mir da etwas oder ich sehe es tatsächlich wie Hgseib: "Liegt keine Normalverteilung vor, dann ist jegliche Berechnung auf Basis der Normalverteilung logischer Weisse absolut sinnfrei."



  Profil  Quote  Link auf diesen Beitrag Link
Diophant
Senior Letzter Besuch: in der letzten Woche
Dabei seit: 18.01.2019
Mitteilungen: 1889
Aus: Rosenfeld, BW
Zum letzten BeitragZum nächsten BeitragZum vorigen BeitragZum erstem Beitrag  Beitrag No.10, eingetragen 2019-08-03

\(\begingroup\)\( \newcommand{\ba}{\begin{aligned}} \newcommand{\ea}{\end{aligned}} \newcommand{\bpm}{\begin{pmatrix}} \newcommand{\epm}{\end{pmatrix}} \newcommand{\bc}{\begin{cases}} \newcommand{\ec}{\end{cases}}\)
Hallo,

2019-08-03 16:03 - MartinaS in Beitrag No. 9 schreibt:
2019-08-03 10:14 - Diophant in Beitrag No. 8 schreibt:
Der einzige Nachteil ist, dass man jetzt keine griffige Formulierung für die Interpretation der Zahlenwerte hat.

Aber genau das meine ich ja. Korrigiert mich gerne, wenn ich immer noch auf dem Schlauch stehe, aber das ist in diesem Zusammenhang ein ganz erheblicher Nachteil (abgesehen von normalverteilten Daten natürlich). Wie hier auch schon so schön erläutert wurde scheint mir der Begriff der Standardabweichung doch gerade dazu da zu sein, eine Vorstellung von der Streuung der Daten zu bekommen.
Und da erscheint mir "je größer desto größer die Streuung" einfach viel zu ungenau.

Was haben denn Standardabweichung und Normalverteilung gemeinsam? Du argumentierst gerade folgendermaßen: die Heckleuchten eines bestimmten Automodells gefallen dir sehr. Die eines anderen überhaupt nicht. Also sagst du: was soll der ganze Quatsch mit den Heckleuchten, wenn es nicht gerade um das Auto meiner Wahl geht...  wink

Man muss bei diesen Parametern ja immer die beiden Seiten der Medaille sehen: zum einen definieren sie als Parameter eben eine Normalverteilung (weil bei der Normalverteilung im Unterschied zu anderen gebräuchlichen Verteilungen die beiden Parameter Mittelwert und Standardabweichung unabhängig voneinander sind). Zum anderen haben sie in der Statistik ihre jeweils ganz praktische Bedeutung.

Ich habe ja weiter oben den Namen Gauss nicht umsonst erwähnt. Er gilt ja als Begründer der Fehlerrechnung. Und damit ist eben die Erkenntnis aufs engste verknüpft, dass es eben nun einmal die optimale Methode ist, einen Gesamtfehler zu messen, indem man die Summe der Quadrate der Einzelfehler betrachtet.

Jetzt könnte man (in praktischen Anwendungen) sagen: ok, verwenden wir die Varianz, die können wir uns noch einigermaßen vorstellen. Aber dann hätte man (jetzt zum dritten Mal erwähnt) das Problem, dass die Maßzahl für den Gesamtfehler eine andere Maßeinheit hätte als die Stichprobendaten.

Und auf der anderen Seite haben wir die Normalverteilung, die ihren Namen auch nicht umsonst bekommen hat, weil viele (aber nicht alle) Dinge, bei denen ein Wert dem Zufall gehorcht, eben normalverteilt sind. Die Normalverteilung, bei der die Standardabweichung die schöne Eigenschaft besitzt, dass das Intervall um den Mittelwert: \(\mu\pm\sigma\) stets den gleichen Anteil der (Stichproben-)Daten 'einschließt'. Das Verdienst, dies entdeckt zu haben, kommt ja auch Gauß zu, also einem der genialsten Mathematiker der Menschheitsgeschichte....

Also um es zusammenzufassen: du kannst dir ja gerne eine neue (allgemeingültige) Definition für ein Streuungsmaß ausdenken. Wenn es geeigneter ist als die Standardabweichung, dann wird es sich sogar durchsetzen. Nur: es darf bezweifelt werden, dass du eine solche Definition findest!

2019-08-03 16:03 - MartinaS in Beitrag No. 9 schreibt:
Entweder entgeht mir da etwas oder ich sehe es tatsächlich wie Hgseib: "Liegt keine Normalverteilung vor, dann ist jegliche Berechnung auf Basis der Normalverteilung logischer Weisse absolut sinnfrei."

Der obige Satz ist völlig sinnfrei. Wenn man eine Standardabweichung berechnet, dann hat das doch zunächst mal überhaupt nichts mit der Normalverteilung zu tun.


Gruß, Diophant
\(\endgroup\)


  Profil  Quote  Link auf diesen Beitrag Link
MartinaS
Aktiv Letzter Besuch: im letzten Quartal
Dabei seit: 11.03.2014
Mitteilungen: 35
Zum letzten BeitragZum nächsten BeitragZum vorigen BeitragZum erstem Beitrag  Beitrag No.11, vom Themenstarter, eingetragen 2019-08-03


Vielen lieben Dank für die Antwort!

2019-08-03 16:28 - Diophant in Beitrag No. 10 schreibt:
Was haben denn Standardabweichung und Normalverteilung gemeinsam? Du argumentierst gerade folgendermaßen: die Heckleuchten eines bestimmten Automodells gefallen dir sehr. Die eines anderen überhaupt nicht. Also sagst du: was soll der ganze Quatsch mit den Heckleuchten, wenn es nicht gerade um das Auto meiner Wahl geht...  wink

Solche Vergleiche hinken zwar leider oft, wenn man im Detail diskutiert, aber ich versuche mal bei diesem Bild zu bleiben: Ich Frage mich, warum man Heckenleuchten (Standardabweichung), die bei einem bestimmten Modell gut passen (Normalverteilung) auch in anderen Modellen verbauen sollte, die gar nicht die passende Elektrik besitzen, sodass sie nicht leuchten?

2019-08-03 16:28 - Diophant in Beitrag No. 10 schreibt:
Also um es zusammenzufassen: du kannst dir ja gerne eine neue (allgemeingültige) Definition für ein Streuungsmaß ausdenken. Wenn es geeigneter ist als die Standardabweichung, dann wird es sich sogar durchsetzen. Nur: es darf bezweifelt werden, dass du eine solche Definition findest!

Es geht mir ja nicht darum, dass ich glaube, eine "bessere" Definition finden zu können. Nur in besagtem Mathebuch (und ebenso in einigen Beiträgen hier) liest es sich, als wäre die Standardabweichung nicht nur im Spezialfall von normalverteilten Daten, sondern generell immer sehr nützlich. Und da frage ich mich eben worin genau dieser Nutzen bestehen soll. Angenommen zum Beispiel (analog zu Aussagekraft bei der Normalverteilung) ich habe einen Datensatz und möchte wissen, wie breit ich ein Intervall um den Mittelwert wählen muss, sodass ein zufällig ausgewähltes Element in etwa 70% der Fälle darin liegt. Der Mittelwert beträgt 5, die Standardabweichung beträgt 3. Inwiefern bringt mich das irgendwie weiter?
So wie ich es verstehe gar nicht. Und dann frage ich mich, wozu sollte ich in solchen Fällen die Standardabweichung berechnen? Das klingt für mich, als wollte ich wissen, wie steil eine Funktion im Ursprung steigt und berechne dazu erstmal, gegen was die Funktion für immer größere Werte konvergiert/divergiert. Kann man machen, aber wozu?

a) Ich irre mich und man kann etwas mit der Standardabweichung anfangen. Dann wüsste ich gerne was.
b) Man kann nichts damit anfangen. Dann wüsste ich gerne, warum man die Standardabweichung irgendwo außer bei normalverteilten Daten anwenden sollte.



  Profil  Quote  Link auf diesen Beitrag Link
Diophant
Senior Letzter Besuch: in der letzten Woche
Dabei seit: 18.01.2019
Mitteilungen: 1889
Aus: Rosenfeld, BW
Zum letzten BeitragZum nächsten BeitragZum vorigen BeitragZum erstem Beitrag  Beitrag No.12, eingetragen 2019-08-03


2019-08-03 17:16 - MartinaS in Beitrag No. 11 schreibt:
Vielen lieben Dank für die Antwort!

2019-08-03 16:28 - Diophant in Beitrag No. 10 schreibt:
Was haben denn Standardabweichung und Normalverteilung gemeinsam? Du argumentierst gerade folgendermaßen: die Heckleuchten eines bestimmten Automodells gefallen dir sehr. Die eines anderen überhaupt nicht. Also sagst du: was soll der ganze Quatsch mit den Heckleuchten, wenn es nicht gerade um das Auto meiner Wahl geht...  wink

Solche Vergleiche hinken zwar leider oft, wenn man im Detail diskutiert, aber ich versuche mal bei diesem Bild zu bleiben: Ich Frage mich, warum man Heckenleuchten (Standardabweichung), die bei einem bestimmten Modell gut passen (Normalverteilung) auch in anderen Modellen verbauen sollte, die gar nicht die passende Elektrik besitzen, sodass sie nicht leuchten?

Ganz einfach: weil jedes Auto Heckleuchten besitzen muss.

2019-08-03 17:16 - MartinaS in Beitrag No. 11 schreibt:
2019-08-03 16:28 - Diophant in Beitrag No. 10 schreibt:
Also um es zusammenzufassen: du kannst dir ja gerne eine neue (allgemeingültige) Definition für ein Streuungsmaß ausdenken. Wenn es geeigneter ist als die Standardabweichung, dann wird es sich sogar durchsetzen. Nur: es darf bezweifelt werden, dass du eine solche Definition findest!

Es geht mir ja nicht darum, dass ich glaube, eine "bessere" Definition finden zu können. Nur in besagtem Mathebuch (und ebenso in einigen Beiträgen hier) liest es sich, als wäre die Standardabweichung nicht nur im Spezialfall von normalverteilten Daten, sondern generell immer sehr nützlich.

Wir sprechen von einem mathematischen Begriff. Da spielt es zunächsteinmal überhaupt keine Rolle, ob er nützlich ist (denn das liegt im Auge des Betrachters). Sondern wenn überhaupt, dann fragt man sich, ob der Begriff bzw. das dahinterliegende Konzept sinnvoll ist. Und das ist im Fall der Standardabweichung eindeutig mit 'Ja' zu beantworten, du kannst aber nicht erwarten, dies einzusehen mit den Informationen eines einzigen Mathebuchs. Da muss man sich schon gründlicher mit der Materie beschäftigen.

2019-08-03 17:16 - MartinaS in Beitrag No. 11 schreibt:
Und da frage ich mich eben worin genau dieser Nutzen bestehen soll.

Wie gesagt: das ist in der Mathematik die falsche Frage.

2019-08-03 17:16 - MartinaS in Beitrag No. 11 schreibt:
Angenommen zum Beispiel (analog zu Aussagekraft bei der Normalverteilung) ich habe einen Datensatz und möchte wissen, wie breit ich ein Intervall um den Mittelwert wählen muss, sodass ein zufällig ausgewähltes Element in etwa 70% der Fälle darin liegt. Der Mittelwert beträgt 5, die Standardabweichung beträgt 3. Inwiefern bringt mich das irgendwie weiter?
So wie ich es verstehe gar nicht.

Wie kommst du überhaupt auf die Idee, dass dies stets mit der Standardabweichung klappen sollte? Man fertigt ja nicht umsonst in der Statistik Boxplots an und versieht sie u.a. mit den beiden Quartilen...

2019-08-03 17:16 - MartinaS in Beitrag No. 11 schreibt:
a) Ich irre mich und man kann etwas mit der Standardabweichung anfangen. Dann wüsste ich gerne was.
b) Man kann nichts damit anfangen. Dann wüsste ich gerne, warum man die Standardabweichung irgendwo außer bei normalverteilten Daten anwenden sollte.

Nochmal: in der Mathematik geht es nicht nur um die Anwendung.

Generell (und auch hier wiederhole ich mich) ist die Standardabweichung das geeignetste weil allgemeingültigste Maß, um die Streuung von Daten um einen Mittelwert zu charakterisieren.

Was du jetzt in welcher Situation ausrechnen 'musst', das bleibt ja dir überlassen, das war doch aber niemals die Frage. Vergiss die Geschichte mit den 68,3% einmal völlig und/oder versuche, das ganze unabhängig von der Normalverteilung zu betrachten.


Gruß, Diophant



  Profil  Quote  Link auf diesen Beitrag Link
MartinaS
Aktiv Letzter Besuch: im letzten Quartal
Dabei seit: 11.03.2014
Mitteilungen: 35
Zum letzten BeitragZum nächsten BeitragZum vorigen BeitragZum erstem Beitrag  Beitrag No.13, vom Themenstarter, eingetragen 2019-08-03


Gut, ich denke, dann haben wir hier alles. Danke für alle Antworten!



  Profil  Quote  Link auf diesen Beitrag Link
StrgAltEntf
Senior Letzter Besuch: in der letzten Woche
Dabei seit: 19.01.2013
Mitteilungen: 5160
Aus: Milchstraße
Zum letzten BeitragZum nächsten BeitragZum vorigen BeitragZum erstem Beitrag  Beitrag No.14, eingetragen 2019-08-03


Hallo MartinaS,

2019-08-02 23:01 - MartinaS in Beitrag No. 5 schreibt:
Also z.B.: Ich habe Daten mit dem Mittelwert 5 und Standardabweichung 3.

Es gibt da auch noch die Tschebyscheffsche Ungleichung, die für jede Verteilung (nicht nur für die Normalverteilung) gilt. Diese besagt:

Wenn \(X\) den Mittelwert \(\mu\) und die Standardabweichung \(\sigma\) hat, dann ist \[P(|X-\mu|>a)\leq\frac{\sigma^2}{a^2}\] In deinem Beispiel also etwa:
Die W'keit, dass ein Wert mehr als a=4 vom Mittelwert abweicht, ist kleinergleich \(\frac9{16}=0,5625\)



  Profil  Quote  Link auf diesen Beitrag Link
MartinaS
Aktiv Letzter Besuch: im letzten Quartal
Dabei seit: 11.03.2014
Mitteilungen: 35
Zum letzten BeitragZum nächsten BeitragZum vorigen BeitragZum erstem Beitrag  Beitrag No.15, vom Themenstarter, eingetragen 2019-08-06


Ah, das ist das Stichwort. Genau danach habe ich gesucht. Jetzt wo ich es lese, erinnere ich mich auch. Manchmal hängt es wirklich... Dankeschön!



  Profil  Quote  Link auf diesen Beitrag Link
Kitaktus
Senior Letzter Besuch: in der letzten Woche
Dabei seit: 11.09.2008
Mitteilungen: 6048
Aus: Niedersachsen
Zum letzten BeitragZum nächsten BeitragZum vorigen BeitragZum erstem Beitrag  Beitrag No.16, eingetragen 2019-08-07


Noch eine Bemerkung zu der "geringen Anzahl an Werten", die in der 1-$\sigma$-Umgebung des Mittelwertes lagen.
Als Du von Werten zwischen 3 und 7 schriebst, dachte ich an das Intervall ] oder auch die Menge {3,4,5,6,7}. In beiden Fällen hätten weit über 50% der Werte in der 1-$\sigma$-Umgebung gelegen.
Tatsächlich nimmt Deine Zufallsgröße aber nur die Werte 4, 5 und 6 an, $\sigma$ ist etwas kleiner als 1 und damit liegen nur die Fünfen in der 1-$\sigma$-Umgebung des Mittelwertes. Die restliche Masse liegt kurz hinter der Grenze.
Deine Verteilung (in etwa Gleichverteilung auf drei diskreten Werten) ist ziemlich "weit weg" von der Normalverteilung.



  Profil  Quote  Link auf diesen Beitrag Link
Folgende Antworten hat der Fragesteller vermutlich noch nicht gesehen.
Force4
Neu Letzter Besuch: im letzten Monat
Dabei seit: 04.09.2019
Mitteilungen: 1
Zum letzten BeitragZum nächsten BeitragZum vorigen BeitragZum erstem Beitrag  Beitrag No.17, eingetragen 2019-09-04


Guten Tag,

Zwar bin ich kein Mathematiker aber ich bin mit dieser Problematik bzw. Fragestellung vertraut und kann meine Erfahrung als Praktiker schildern.

Ich arbeite für die Prozessindustrie als Automatisierungstechniker und der momentane Trend in Richtung Big Data, Industrie 4.0 geht nicht an der Statistik vorbei.

Man möchte heutzutage die Prozessgrößen wie Temperaturen, Drücke oder Geschwindigkeiten besser analysieren um Rückschlüsse auf bisher unbekannte Qualitätsunterschiede einer Produktion zu ziehen.

Die Betrachtung des Mittelwerte unter der Annahme der Normalverteilung ist bei diesen Anwendungsfällen nicht brauchbar weil nahezu alle solcher Messreihen nicht normalverteilt sind. Die Standardabweichung konnte uns keine Aussagen liefern wie stabil sich ein Prozesswert verhält. Wenn wir das Sigma berechnen können wir keine Aussage treffen wie sehr ein Messwert streut, weil es eben keinen Mittelwert gibt der die größte Häufigkeit der Daten angibt.

Besser an der Stelle ist es, den Median und seine Quartile zu betrachten - der sogenannten Boxplot. Dieser ist robust da er aussagt wo die Masse der Datenpunkten liegt und es ihm egal ist welche Verteilung vorliegt.

Sicherlich ist die Standardabweichung eine abstrakte Größe die (nach Gauss) durch die Fehlerquadrate immer die beste Streuung angibt. Brauchbar für den Praktiker wird es aber erst dann wenn der Mittelwert eine repräsentative Mitte wird z.b. bei einer Normalverteilung.

Gruß



  Profil  Quote  Link auf diesen Beitrag Link
MartinaS wird per Mail über neue Antworten informiert.
Neues Thema [Neues Thema] Antworten [Antworten]    Druckversion [Druckversion]

 


Wechsel in ein anderes Forum:
 Suchen    
 
All logos and trademarks in this site are property of their respective owner. The comments are property of their posters, all the rest © 2001-2019 by Matroids Matheplanet
This web site was made with PHP-Nuke, a web portal system written in PHP. PHP-Nuke is Free Software released under the GNU/GPL license.
Ich distanziere mich von rechtswidrigen oder anstößigen Inhalten, die sich trotz aufmerksamer Prüfung hinter hier verwendeten Links verbergen mögen.
Lesen Sie die Nutzungsbedingungen, die Distanzierung, die Datenschutzerklärung und das Impressum.
[Seitenanfang]