|
Autor |
computation of the Gram matrix for natural energy descent |
|
sell
Neu  Dabei seit: 22.03.2023 Mitteilungen: 1
 | Themenstart: 2023-03-22
|
I h*ave found a paper on https://arxiv.org/abs/2302.13163 where a modification of the natural gradient descent is proposed.
The natural gradient can be computet with (eq. 8)
$$
\nabla^EL(\theta) := G^{-1}_E(\theta)\nabla L(\theta).
$$
$\theta$ are the parameters of a neural network and L is the loss-function.
The formula for the "energy Gram matrix" is (eq. 6)*
$$
G_E(\theta)_{ij} := D^2E(u_\theta)(\partial_{\theta_i}u_\theta.\partial_{\theta_j}u_\theta)
$$
If I understood the paper right $D^2$ is the vector of soft derivatives up to the order 2 and $D^2E(u_\theta)$ is an operator
E(u) is the energy function. And in one example it is defines as (eq 16):
$$E(u):=\frac{1}{2} \int_{\Omega}\left|u^{\prime}\right|^{2} \mathrm{~d} x+\frac{1}{4} \int_{\Omega} u^{4} \mathrm{~d} x-\int_{\Omega} f u \mathrm{~d} x$$
The given "energy Gram matrix is (one equation after eq. 17)
$$D^{2} E(u)(v, w)=\int_{\Omega} v^{\prime} w^{\prime} \mathrm{d} x+3 \int_{\Omega} u^{2} v w \mathrm{~d} x$$
I dont understand how eq. 6 is used to derive the last equation. Thank you for your time
|
Profil
| Folgende Antworten hat der Fragensteller vermutlich noch nicht gesehen. Er/sie war noch nicht wieder auf dem Matheplaneten |
Buri
Senior  Dabei seit: 02.08.2003 Mitteilungen: 46782
Wohnort: Dresden
 | Beitrag No.1, eingetragen 2023-03-22
|
Profil
|
zippy
Senior  Dabei seit: 24.10.2018 Mitteilungen: 4614
 | Beitrag No.2, eingetragen 2023-03-22
|
$D^2E(u)(v,w)$ ist die Bilinearform, die zur zweiten Ableitung von $E(u)$ gehört:$$\begin{align*}
D^2E(u)(v,w) &=
\frac12\int_\Omega\left[\left({\partial\over\partial u'}\right)^2|u'|^2
\right]v'w'\,\mathrm dx +
\frac14\int_\Omega\left[\left({\partial\over\partial u}\right)^2u^4
\right]v\,w
\,\mathrm dx \\[2.4ex] &=
\int_\Omega v'w'\,\mathrm dx +
\int_\Omega3u^2\,v\,w
\,\mathrm dx
\end{align*}$$Der dritte Summand von $E(u)$ ist linear in $u$ und trägt daher nichts bei.
--zippy
|
Profil
|
|
All logos and trademarks in this site are property of their respective owner. The comments are property of their posters, all the rest © 2001-2023 by Matroids Matheplanet
This web site was originally made with PHP-Nuke, a former web portal system written in PHP that seems no longer to be maintained nor supported. PHP-Nuke is Free Software released under the GNU/GPL license.
Ich distanziere mich von rechtswidrigen oder anstößigen Inhalten, die sich trotz aufmerksamer Prüfung hinter hier verwendeten Links verbergen mögen. Lesen Sie die
Nutzungsbedingungen,
die Distanzierung,
die Datenschutzerklärung und das Impressum.
[Seitenanfang]
|