|
Autor |
Ableitung von Gleichungen mit Matrix |
|
Tryptamine
Neu  Dabei seit: 08.07.2020 Mitteilungen: 1
 | Themenstart: 2020-07-08
|
Ich weiß nicht genau, in welchen Forenbereich diese Frage gehört. Bei einem bessern Vorschlag werde ich sie verschieben.
Ich habe zwei Vorlesungen, in beiden eine Ableitung, die ich nicht verstehe.
Die Gleichung in Roboterdynamik ist praktisch folgende:
\[
\Phi(x) = \frac{1}{2}x^{T}*W*x
\]
wobei
\[
x \in \mathbb{R}^n\\
W \in \mathbb{R}^{n \times n}
\]
Hierfür ist im Skript (\(W = W^T\) bzw. symmetrisch) folgende Lösung:
\[
\frac{\partial\Phi(x)}{\partial x} = W*x
\]
Größenordnungstechnisch macht das definitiv sinn. Ich verstehe jedoch nicht, wie ich mathematisch dahin komme. Außerdem könnte meiner Meinung nach ebenso gelten
\[
\frac{\partial\Phi(x)}{\partial x} = x^T*W
\]
Ich gehe davon aus, dass das einfach eine Konvention ist.
Weiterhin weiß ich nicht, wie das für eine nichtsymmetrische Matrix aussähe.
Wende ich einfach die Kettenregel an, komme ich zu
\[
\frac{\partial\Phi(x)}{\partial x} = \frac{1}{2}(\frac{\partial x^T}{\partial x}*W*x+x^T*W*\frac{\partial x}{\partial x})\\
= \frac{1}{2}(1^T*W*x+x^T*W*1)
\]
wobei 1 ein n-dimensionaler Vektor wäre. Daraus werde ich nicht schlau.
Im anderen Fach (Computer Vision) lautet mein Problem:
\[
\frac{d}{dv}( v^T*\nabla I * \nabla I^T * v)
\]
Was im Endeffekt exakt das gleiche ist wie die Gleichung aus Roboterdynamik, da \(
\nabla I * \nabla I^T
\) eine symmetrische Matrix ist.
|
Profil
|
zippy
Senior  Dabei seit: 24.10.2018 Mitteilungen: 4966
 | Beitrag No.1, eingetragen 2020-07-08
|
Rechne einfach komponentenweise:$$\begin{align*}
&{\partial\Phi\over\partial x_k} =
{\partial\over\partial x_k}
\left[\frac12\sum_{i,j=1}^nx_i\,W_{ij}\,x_j\right] =
\frac12\left[\sum_{j=1}^nW_{kj}\,x_j +
\sum_{i=1}^nx_i\,W_{ik} \right] \\[1.5ex]
\implies
&{\partial\Phi\over\partial x} =
\frac12 \left[
W+W^T\right]x
\end{align*}$$--zippy
|
Profil
|
Vercassivelaunos
Senior  Dabei seit: 28.02.2019 Mitteilungen: 1267
 | Beitrag No.2, eingetragen 2020-07-08
|
\(\begingroup\)\(\newcommand{\N}{\mathbb{N}}
\newcommand{\Z}{\mathbb{Z}}
\newcommand{\Q}{\mathbb{Q}}
\newcommand{\R}{\mathbb{R}}
\newcommand{\C}{\mathbb{C}}
\newcommand{\F}{\mathbb{F}}
\newcommand{\K}{\mathbb{K}}
\newcommand{\E}{\mathbb{E}}
\newcommand{\H}{\mathbb{H}}
\newcommand{\D}{\mathrm{D}}
\newcommand{\d}{\mathrm{d}}
\newcommand{\i}{\mathrm{i}}
\newcommand{\e}{\mathrm{e}}
\newcommand{\diag}{\operatorname{diag}}
\newcommand{\span}{\operatorname{span}}
\newcommand{\im}{\operatorname{im}}
\newcommand{\id}{\operatorname{id}}
\newcommand{\grad}{\operatorname{grad}}
\newcommand{\zyk}[1]{\Z/#1\Z}
\newcommand{\matrix}[1]{\left(\begin{matrix}#1\end{matrix}\right)}
\newcommand{\vector}[1]{\left(\begin{array}{c}#1\end{array}\right)}
\newcommand{\align}[1]{\begin{align*}#1\end{align*}}
\newcommand{\ket}[1]{\left\vert#1\right>}
\newcommand{\bra}[1]{\left<#1\right\vert}
\newcommand{\braket}[2]{\left<#1\middle\vert#2\right>}
\newcommand{\braketop}[3]{\left<#1\middle\vert#2\middle\vert#3\right>}
\newcommand{\mean}[1]{\left<#1\right>}
\newcommand{\lvert}{\left\vert}
\newcommand{\rvert}{\right\vert}
\newcommand{\lVert}{\left\Vert}
\newcommand{\rVert}{\right\Vert}\)
Hallo Tryptamine,
du hast hier eine Abbildung $\Phi:\R^n\to\R$. Die Ableitung an der Stelle $x$ einer solchen Funktion ist nichts anderes, als der Gradient, der darüber definiert ist, dass
\[\lim_{h\to 0}\frac{f(x+h)-f(x)-\operatorname{grad\Phi(x)}\cdot h}{\Vert h\Vert}=0.\]
Der Punkt im Term $\operatorname{grad\Phi(x)}\cdot h$ steht dabei für Matrizenmultiplikation oder das Skalarprodukt, je nach der Konvention, ob man einen Spalten- oder Zeilenvektor hat. Das ist der Unterschied zwischen $x^T W$ und $W x$ in deinem Beispiel. Ich benutze lieber die Konvention mit der Matrizenmultiplikation, weil sich das besser in die noch allgemeinere Definition der Ableitung für vektorwertige Funktionen einreiht. Dann muss also überprüft werden, ob
\[\lim_{h\to 0}\frac{f(x+h)-f(x)-x^T Wh}{\Vert h\Vert}=0.\]
Also alles einsetzen:
\[\begin{align*}
\frac{f(x+h)-f(x)-x^T Wh}{\Vert h\Vert}&=\frac{\frac{1}{2}(x+h)^TW(x+h)-\frac{1}{2}x^T Wx-x^TWh}{\Vert h\Vert}\\
&=\frac{\frac{1}{2}\left(x^T Wx+h^TWx+x^TWh+h^TWh\right)-\frac{1}{2}x^TWx-x^TWh}{\Vert h\Vert}\\
&=\frac{h^TWh}{\Vert h\Vert}.
\end{align*}\]
In der letzten Umformung wurde die Symmetrie von $W$ benutzt.
Dieser Term konvergiert gegen 0, was man zeigen kann indem man beispielsweise nutzt, dass $\Vert h^TWh \Vert\leq\Vert h\Vert\Vert W\Vert\Vert h\Vert=\Vert h\Vert^2\Vert W\Vert$, wobei $\Vert W\Vert$ die Spektralnorm von $W$ ist.
Wenn $W$ nicht symmetrisch ist, dann wäre die Ableitung $\frac{1}{2}x^T\left(W+W^T\right)$, wie man durch Ausprobieren herausfinden kann (in obiger Umformung auf die Symmetrieeigenschaft verzichten und überlegen, was man statt $x^TWh$ subtrahieren müsste, um zum selben Endergebnis zu kommen).
Was deine Kettenregel angeht: Welche Funktionen hast du denn da verkettet? Und wie sieht deine Kettenregel im Allgemeinen für mehrere Dimensionen aus? Ich erkenne das nämlich ehrlich gesagt nicht.
Viele Grüße
Vercassivelaunos
[Die Antwort wurde vor Beitrag No.1 begonnen.]\(\endgroup\)
|
Profil
|
Tryptamine hat die Antworten auf ihre/seine Frage gesehen. Tryptamine hat selbst das Ok-Häkchen gesetzt. |
|
All logos and trademarks in this site are property of their respective owner. The comments are property of their posters, all the rest © 2001-2023 by Matroids Matheplanet
This web site was originally made with PHP-Nuke, a former web portal system written in PHP that seems no longer to be maintained nor supported. PHP-Nuke is Free Software released under the GNU/GPL license.
Ich distanziere mich von rechtswidrigen oder anstößigen Inhalten, die sich trotz aufmerksamer Prüfung hinter hier verwendeten Links verbergen mögen. Lesen Sie die
Nutzungsbedingungen,
die Distanzierung,
die Datenschutzerklärung und das Impressum.
[Seitenanfang]
|