Matroids Matheplanet Forum Index
Moderiert von Kleine_Meerjungfrau Monkfish epsilonkugel
Mathematik » Stochastik und Statistik » Anteil der Varianz für nichtlineare Repräsentationen
Druckversion
Druckversion
Antworten
Antworten
Autor
Kein bestimmter Bereich Anteil der Varianz für nichtlineare Repräsentationen
besterma
Neu Letzter Besuch: im letzten Quartal
Dabei seit: 24.03.2020
Mitteilungen: 1
Zum letzten BeitragZum nächsten BeitragZum vorigen BeitragZum erstem Beitrag  Themenstart: 2020-03-24


Hallo zusammen,

Bei PCA ist der Anteil der Varianz, der von einem Komponenten erklärt wird, proportinal zum Eigenwert dieses Komponenten.

Ich habe nun ein Problem, bei dem ich für eine nonlineare Repräsentation herausfinden möchte, wie viel der Varianz ein Komponent erklärt. Der gleiche Ansatz wie für PCA funktioniert hier leider nicht.

Ein bisschen spezifischer formuliert:

Ich habe ein hochdimensionales Datenset, von dem ich eine eindimensionale Repräsentation habe. Wie gross ist der Anteil der Varianz, die diese Repräsentation erklärt?

Ich hoffe, die Frage ist verständlich genug formuliert, sonst kann ich gerne versuchen, sie noch weiter zu erläutern.

Danke schonmal und Gruss,
besterma



Eine Notiz zu diese Forumbeitrag schreiben Notiz   Profil  Quote  Link auf diesen Beitrag Link
AnnaKath
Senior Letzter Besuch: in der letzten Woche
Dabei seit: 18.12.2006
Mitteilungen: 3292
Aus: hier und dort (s. Beruf)
Zum letzten BeitragZum nächsten BeitragZum vorigen BeitragZum erstem Beitrag  Beitrag No.1, eingetragen 2020-03-28


Huhu bersterma und herzlich willkommen auf dem Matheplaneten!

Deine Frage ist sehr allgemein; und so möchte ich Dir eine allgemeine Antwort geben.

In z.B. Kégl, Balázs & Wunsch, Donald & Zinovyev, Andrei. (2008). Principal Manifolds for Data Visualisation and Dimension Reduction, LNCSE 58 findest Du eine brauchbare Übersicht über das Thema.

Als Stichworte zum selber googeln:
- principal curves
- principal manifolds
- nonlinear PCA

Zumindest in der englischsprachigen Wikipedia gibt es diese Stichworte auch als Einträge.

Was nun den erklärten Anteil der Varianz angeht:
Eine Hauptkomponentenanalyse lässt sich immer in der Form zweier Abbildungen $p:\mathbb{R}^n\to\mathbb{R}^m$ und $r:\mathbb{R}^m\to\mathbb{R}^n$ angeben (wobei natürlich m< n ist, bei Dir ist sogar $m=1$).
Setzt man für jedem Datenpunkt $x_t$ dann $\epsilon_t=p(r(x_t))-x_t$, so ist gerade $\sum_t \| \epsilon_t \|^2$ der nichterklärte Teil der Varianz.
Ist $p$ die Projektion auf eine Ebene, so ist das die normale (lineare) PCA und man kann diesen Wert sehr einfach ermitteln. I.A. hängt das aber sehr vom konkreten Verfahren ab (ist aber m.W.n. meist sehr schwierig).

lg, AK.



Eine Notiz zu diese Forumbeitrag schreiben Notiz   Profil  Quote  Link auf diesen Beitrag Link
besterma hat die Antworten auf ihre/seine Frage gesehen.
besterma wird per Mail über neue Antworten informiert.
Neues Thema [Neues Thema] Antworten [Antworten]    Druckversion [Druckversion]

 


Wechsel in ein anderes Forum:
 Suchen    
 
All logos and trademarks in this site are property of their respective owner. The comments are property of their posters, all the rest © 2001-2020 by Matroids Matheplanet
This web site was originally made with PHP-Nuke, a former web portal system written in PHP that seems no longer to be maintained nor supported. PHP-Nuke is Free Software released under the GNU/GPL license.
Ich distanziere mich von rechtswidrigen oder anstößigen Inhalten, die sich trotz aufmerksamer Prüfung hinter hier verwendeten Links verbergen mögen.
Lesen Sie die Nutzungsbedingungen, die Distanzierung, die Datenschutzerklärung und das Impressum.
[Seitenanfang]