Mathematik: Über Berührungen und Ableitungen
Released by matroid on Di. 19. Januar 2021 06:36:43 [Statistics]
Written by Triceratops - 279 x read [Outline] Printable version Printer-friendly version -  Choose language   
Mathematik

\(\begingroup\)

Über Berührungen und Ableitungen

In dem Buch 'Grundzüge der modernen Analysis' von Dieudonné wird der Begriff der Differenzierbarkeit einer Funktion zwischen normierten Räumen sehr anschaulich und geometrisch mithilfe einer Berührungsrelation eingeführt. Die Differenzierbarkeit einer Funktion in einem Punkt wird dadurch definiert, dass sie dort von einer affin-linearen Funktion berührt wird. Leider taucht diese Relation dort nur kurz in der Definition auf und wird nicht weiter benutzt, und andere Quellen verwenden ohnehin einen eher rechnerischen Zugang. In diesem Artikel möchte ich die Berührungsrelation in den Vordergrund stellen und die Ableitungsregeln, insbesondere die Kettenregel, konzeptionell aus entsprechenden Eigenschaften der Berührungsrelation ableiten. Schließlich gibt es auch noch eine kategorientheoretische Einordnung der ganzen Theorie.



Berührung

Die Berührungsrelation lässt sich im relativ allgemeinen Kontext von metrischen Räumen definieren.

Definition. Seien $X,Y$ zwei metrische Räume über und $f,g : X \to Y$ zwei Funktionen. Sei $x_0 \in X$ ein fester Punkt. Wir sagen, $f$ und $g$ berühren sich im Punkt $x_0$ und schreiben dann $f \sim_{x_0} g$, wenn es für alle $\varepsilon > 0 $ ein $\delta > 0$ gibt, sodass für alle $x \in X$ gilt (wobei $d$ jeweils die Metrik bezeichnet):

$(1) \qquad d(x,x_0) \leq \delta \implies d(f(x),g(x))) \leq \varepsilon \cdot d(x,x_0)$

Offensichtlich folgt $f(x_0)=g(x_0)$ (setze $x := x_0$). Eine äquivalente Charakterisierung lautet

$\displaystyle (2) \qquad f(x_0)=g(x_0) \quad \text{und} \quad \lim_{x \to x_0,\, x \neq x_0} \frac{d(f(x),g(x))}{d(x,x_0)} = 0.$

Anschaulich: $f(x)$ und $g(x)$ nähern sich für $x \to x_0$ schneller einander an als $x$ und $x_0$.

Wir interessieren uns hauptsächlich für den Fall von normierten Räumen über $\IK \in \{\IR,\IC\}$, wo die Metrik dann durch $d(x,y) := |x-y|$ gegeben ist (Normen werden hier mit einfachen Strichen notiert) und die Definition sich entsprechend umschreiben lässt: Für alle $\varepsilon > 0$ muss es ein $\delta > 0$ geben, sodass für alle $x \in X$ gilt:

$(1') \qquad |x - x_0| \leq \delta \implies |f(x) - g(x)| \leq \varepsilon \cdot |x - x_0|$

Es gilt also $f \sim_{x_0} g \iff f - g \sim_{x_0} 0$.

Dieudonné wählt in seinem Analysis-Buch die Limes-Definition, sodass $f(x_0)=g(x_0)$ nicht automatisch folgt, was meiner Ansicht nach dem Begriff der Berührung nicht gerecht wird. Noch klarer wird das vielleicht mit der folgenden Verallgemeinerung: Für $\alpha \in \IR_{\geq 0}$ sagen wir, $f$ und $g$ berühren sich vom Grad $\alpha$ im Punkt $x_0$, wenn es für alle $\varepsilon > 0$ ein $\delta > 0$ gibt, sodass für alle $x \in X$ gilt:

$(1^{\alpha}) \qquad d(x,x_0) \leq \delta \implies d(f(x),g(x)) \leq \varepsilon \cdot d(x,x_0)^{\alpha}$

Jede Berührung vom Grad $\alpha$ impliziert dann eine Berührung vom Grad $\beta$ für alle $\beta \leq \alpha$, und Berührung vom Grad $0$ bedeutet einfach $f(x_0)=g(x_0)$. Der Grad gibt an, in welchem Maße sich $f$ und $g$ bei $x_0$ einander anschmiegen. Mehr dazu gibt es eventuell in einer Fortsetzung über höhere Ableitungen. Wir werden uns hier auf den Fall $\alpha=1$ beschränken.

Beispiele

Sei $n \in \IN$. Die Potenzfunktion $x^n$ berührt die Nullfunktion $0$ in $x_0 := 0$ genau dann, wenn $n > 1$; denn $(2)$ vereinfacht sich zu $\lim_{x \to 0,\,x \neq 0} |x|^{n-1}=0$.

<math>\begin{tikzpicture}[scale=2]
\draw[->] (-1.2, 0) -- (1.2, 0) node[right] {$x$};
\draw[->] (0, -0.5) -- (0, 1.2) node[above] {$y$};
\draw[thick, domain=-1.2:1.2, smooth, green] plot ({\x}, {0});
\draw[thick, domain=-1.2:1.2, smooth, blue] plot ({\x}, {\x*\x});
\draw[thick, domain=-0.5:1.2, smooth, red] plot ({\x}, {\x});
\end{tikzpicture}
</math>

Der Begriff der Berührung bezieht sich auf die Funktionswerte, nicht auf die Graphen. Zum Beispiel berühren sich anschaulich gesprochen die Graphen von $\sqrt[3]{x}$ und $\sqrt[5]{x}$ im Ursprung:

<math>
\begin{tikzpicture}[scale=2]
\draw [->] (-1,0)--(1,0) node[right] {$x$};
\draw [->] (0,-1)--(0,1) node[above] {$y$};
\draw [blue, thick, domain=-1:1, smooth, samples=200] plot (\x, {\x^(1/3)});
\draw [red, thick, domain=-1:1, smooth, samples=200] plot (\x, {\x^(1/5)});
\end{tikzpicture}
</math>

Allerdings ist die Berührungsachse hier vertikal. Das heißt, was wir hier eigentlich sehen, ist $x^3 \sim_0 0 \sim_0 x^5$. Aber $\sqrt[3]{x} \sim_0 \sqrt[5]{x}$, also $\sqrt[3]{x} - \sqrt[5]{x} \sim_0 0$ gilt nicht, was man sich mit dem Graphen der Funktion $\sqrt[3]{x} - \sqrt[5]{x}$ veranschaulichen kann:

<math>
\begin{tikzpicture}[scale=5]
\draw [->] (-0.5,0)--(0.5,0) node[right] {$x$};
\draw [->] (0,-0.3)--(0,0.3) node[above] {$y$};
\draw [blue, thick, domain=-0.5:0.5, smooth, samples=300] plot (\x, {\x^(1/3) - \x^(1/5)});
\draw [red, thick, domain=-0.5:0.5] plot (\x, {0});
\end{tikzpicture}
</math>

Erste Beobachtungen

Man sieht leicht, dass die Berührungsrelation eine Äquivalenzrelation ist; die Transitivität folgt aus der Dreiecksungleichung. Im Fall von normierten Räumen ist sie außerdem mit der Addition und Skalierung von Funktionen verträglich: Aus $f \sim_{x_0} g$ folgt $f + u \sim_{x_0} g + u$ für jede weitere Funktion $u$, und außerdem $\lambda f \sim_{x_0} \lambda g$ für jeden Skalar $\lambda \in \IK$.

Die Berührungsrelation bleibt offenbar unverändert, wenn wir die Metriken auf $X$ bzw. $Y$ durch äquivalente Metriken ersetzen. Sie hängt also eigentlich nur von den Topologien von $X$ bzw. $Y$ ab.

Vererbung von Stetigkeit

In diesem Abschnitt zeigen wir, dass verschiedene Typen von Stetigkeit unter Berührung vererbt werden. Seien $X,Y$ metrische Räume und $f,g : X \to Y$ zwei Funktionen.

Vererbung von Stetigkeit. Sei $f \sim_{x_0} g$. Wenn $f$ stetig in $x_0$ ist, dann ist $g$ stetig in $x_0$.

Beweis. Für alle $\varepsilon > 0$ gibt es ein $0 < \delta < 1$, sodass für alle $x$ aus $d(x,x_0) \leq \delta$ sowohl $d(f(x),g(x)) \leq \varepsilon \cdot d(x,x_0)$ als auch $d(f(x),f(x_0)) \leq \varepsilon$ folgt. Dann folgt aber auch

$d(g(x),g(x_0)) = d(g(x),f(x_0)) \leq d(f(x),g(x)) + d(f(x),f(x_0)) \leq \varepsilon \cdot d(x,x_0) + \varepsilon \leq 2 \varepsilon. ~ \checkmark$

Für den Beweis der Kettenregel später brauchen wir einen stärkeren Stetigkeitsbegriff. Nennen wir $f : X \to Y$ punktweise Lipschitz-stetig in $x_0 \in X$, wenn es eine offene Umgebung $U$ von $x_0$ und eine Konstante $L > 0$ gibt, sodass

$d(f(x),f(x_0)) \leq L \cdot d(x,x_0)$

für alle $x \in U$ gilt. Offenbar ist dann $f$ insbesondere stetig in $x_0$. Jede Lipschitz-stetige Funktion (wo also gefordert wird, dass $d(f(x),f(x')) \leq L \cdot d(x,x')$ für alle $x,x' \in X$ gilt) ist auch punktweise Lipschitz-stetig in jedem Punkt. Auch diese Eigenschaft vererbt sich bei Berührung:

Vererbung punktweiser Lipschitz-Stetigkeit. Sei $f \sim_{x_0} g$. Wenn $f$ punktweise Lipschitz-stetig in $x_0$ ist, dann ist $g$ punktweise Lipschitz-stetig in $x_0$.

Beweis. Wähle eine Konstante $L > 0$ und eine offene Umgebung $U$ von $x_0$, sodass $d(f(x),f(x_0)) \leq L \cdot d(x,x_0)$ für alle $x \in U$ gilt. Wegen $f \sim_{x_0} g$ gibt es eine offene Umgebung $U'$ von $x_0$, sodass $d(f(x),g(x)) \leq 1 \cdot d(x,x_0)$ für alle $x \in U'$ gilt. Für $x \in U \cap U'$ folgt nun

$d(g(x),g(x_0)) = d(g(x),f(x_0)) \leq d(f(x),g(x)) + d(f(x),f(x_0)) \leq d(x,x_0) + L \cdot d(x,x_0) = (1+L) \cdot d(x,x_0). ~ \checkmark$

Nennen wir $f : X \to Y$ punktweise invers-Lipschitz-stetig1 in $x_0 \in X$, wenn es eine offene Umgebung $U$ von $x_0$ und eine Konstante $L > 0$ gibt, sodass

$d(f(x),f(x_0)) \geq L \cdot d(x,x_0)$

für alle $x \in U$ gilt. Auch hier gilt:

Vererbung punktweiser invers-Lipschitz-Stetigkeit. Sei $f \sim_{x_0} g$. Wenn $f$ punktweise invers-Lipschitz-stetig in $x_0$ ist, dann ist es auch $g$.

Beweis. Wähle eine Konstante $L > 0$ und eine offene Umgebung $U$ von $x_0$, sodass $d(f(x),f(x_0)) \geq L \cdot d(x,x_0)$ für alle $x \in U$ gilt. Wegen $f \sim_{x_0} g$ gibt es eine offene Umgebung $U'$ von $x_0$, sodass $d(f(x),g(x)) \leq \frac{L}{2} \cdot d(x,x_0)$ für alle $x \in U'$ gilt. Für $x \in U \cap U'$ folgt nun

$d(g(x),g(x_0)) = d(g(x),f(x_0)) \geq d(f(x),f(x_0)) - d(f(x),g(x)) \geq L \cdot d(x,x_0) - \frac{L}{2} \cdot d(x,x_0) = \frac{L}{2} \cdot d(x,x_0). ~ \checkmark$

1Ich kenne den offiziellen Begriff dafür nicht, es ist jedenfalls die zweite Hälfte in der Definition der Bi-Lipschitz-Stetigkeit; der Begriff der Ko-Lipschitz-Stetigkeit ist indes schon anders belegt. Der Name ist natürlich dadurch motiviert, dass wenn $f : X \to Y$ ein Homöomorphismus ist, die Bedingung dazu äquivalent ist, dass $f^{-1} : Y \to X$ punktweise Lipschitz-stetig in $f(x_0)$ ist.

Affin-lineare Funktionen

Eine affin-lineare Funktion ist einfach eine "lineare Funktion bis auf Translation". Genauer gesagt nennen wir eine Funktion $A : X \to Y$ zwischen zwei Vektorräumen affin-linear, wenn sie als $L + y$ mit einer linearen Funktion $L : X \to Y$ und einer Konstanten $y \in Y$ geschrieben werden kann. Beachte, dass $L$ und $y$ eindeutig bestimmt sind: es gilt $y = A(0)$ und $L = A - y$.

Affin-lineare Funktionen sind unter Summen und skalaren Vielfachen abgeschlossen. Sie sind ebenfalls unter Komposition abgeschlossen, denn es gilt $(L+y) \circ (L' + y') = L \circ L' + L(y') + y$ für passende lineare Funktionen $L,L'$ und Konstanten $y,y'$. Wenn $A : X \to Y$ affin-linear und bijektiv ist, dann ist auch $A^{-1}$ affin-linear; genauer gesagt gilt $(L+y)^{-1} = L^{-1} - L^{-1}(y)$.

Wenn $X,Y$ normierte Räume sind, so ist eine affin-lineare Funktion $A = L + y$ genau dann stetig, wenn es $L$ ist. Und das bedeutet wiederum, dass es eine Konstante $r > 0$ gibt, sodass $|L(x)| \leq r |x|$ für alle $x \in X$. Jede stetige affin-lineare Funktion ist daher Lipschitz-stetig.

Wir werden diese Beobachtungen beim Beweis der Ableitungsregeln benutzen.

Ableitung

Ableitungen sollen (affin) lineare Approximationen zu Funktionen sein. Die Berührungsrelation macht es uns möglich, diese Idee zu einer präzisen Definition zu machen, die zugleich auch anschaulich ist.

Zunächst vereinbaren wir eine vereinfachende Notation: Für normierte Räume $X,Y$ meinen wir mit $f : X \dashrightarrow Y$ eine Funktion $f : U \to V$, wobei $U \subseteq X$ und $V \subseteq Y$ offene Teilmengen sind, die nicht weiter notiert werden. Wenn ein Punkt $x_0 \in X$ in dem Kontext gegeben ist, vereinbaren wir dabei natürlich $x_0 \in U$, und wenn wir $f(x)$ schreiben, so versteht sich implizit, dass $x \in U$ gilt. Die Relation $\sim_{x_0}$ interessiert sich nur dafür, was auf einer (kleinen) offenen Umgebung von $x_0$ passiert. Wenn $g : Y \dashrightarrow Z$ eine weitere Funktion ist, so soll $g \circ f$ nur gebildet werden, wenn die Zielmenge von $f$ die Startmenge von $g$ ist.

Definition. Seien $X,Y$ normierte Räume. Wir nennen eine Funktion $f : X \dashrightarrow Y$ im Punkt $x_0 \in X$ differenzierbar (genauer: Fréchet-differenzierbar), wenn es eine stetige affin-lineare Funktion $A : X \to Y$ gibt, welche $f$ in $x_0$ berührt.

<math>\begin{tikzpicture}
\draw[thick, domain=0:2, smooth, teal] plot ({2*\x}, {\x)}) node[above] {$A$};
\draw[thick, domain=0.2:2, smooth, blue] plot ({2*\x}, {ln(\x)+1}) node[below] {$f$};
\fill (2,1) circle [radius=0.05, dashed] node[above] {\footnotesize $x_0$}
\end{tikzpicture}
</math>

Wir sollten uns jetzt direkt davon überzeugen, dass diese stetige affin-lineare Funktion eindeutig bestimmt ist. Das läuft darauf hinaus, zu zeigen, dass zwei affin-lineare Funktionen $X \to Y$ (die Stetigkeit brauchen wir hier nicht), die sich in einem Punkt berühren, schon gleich sind. Dafür genügt es zu zeigen (indem wir in $X$ und $Y$ geeignete Translationen vornehmen), dass für eine lineare Funktion $L : X \to Y$ mit $L \sim_{0} 0$ schon $L=0$ gilt. Nun, für alle $\varepsilon > 0$ gibt es ein $\delta > 0$, sodass

$|h| \leq \delta \implies |L(h)| \leq \varepsilon |h|.$

Für beliebiges $x \in X$, $x \neq 0$ kann man das auf $h := \frac{\delta}{|x|} \cdot x$ anwenden (denn $|h|=\delta$) und erhält $|L(h)| \leq \varepsilon |h|$ bzw. $|L(x)| \leq \varepsilon |x|$. Weil $\varepsilon > 0$ beliebig ist, folgt $|L(x)|=0$, was zu zeigen war.

Insbesondere gibt es bei einer in $x_0 \in X$ differenzierbaren Funktion $f : X \dashrightarrow Y$ genau eine stetige lineare Funktion, die wir mit $\mathrm{D}_{x_0}(f) : X \to Y$ bezeichnen und die Ableitung von $f$ in $x_0$ nennen, sodass

$(4) \qquad f \sim_{x_0} \mathrm{D}_{x_0}(f) + y$

für eine Konstante $y \in Y$. Das ist die anschauliche Definition der Ableitung: Bis auf die notwendige Translation soll sie $f$ bei $x_0$ berühren. Im eindimensionalen Fall ist die Ableitung zwar eine lineare Funktion $\IK \to \IK$, also von der Form $h \mapsto h \cdot \lambda$ für eine "Zahl" $\lambda \in \IK$, die man dann klassischerweise die Ableitung nennt, aber im allgemeinen Fall muss man sich die Ableitung als eine lineare Funktion vorstellen. Mit der Ableitung (sofern sie existiert) können wir feststellen, ob sich zwei Funktionen berühren: Es gilt $f \sim_{x_0} g$ genau dann, wenn $f(x_0)=g(x_0)$ und $\mathrm{D}_{x_0}(f) = \mathrm{D}_{x_0}(g)$.

Schreiben wir einmal die implizite Definition $(4)$ der Ableitung aus: Es ist $f(x_0) = \mathrm{D}_{x_0}(f)(x_0) + y$ bzw. $y = f(x_0) - \mathrm{D}_{x_0}(f)(x_0)$. Die affin-lineare Approximation (im eindimensionalen Fall als "Tangentengleichung" bekannt) ist also

$x \mapsto \mathrm{D}_{x_0}(f)(x) + f(x_0) - \mathrm{D}_{x_0}(f)(x_0) = \mathrm{D}_{x_0}(f)(x-x_0) + f(x_0),$

und $(4)$ bedeutet daher gerade

$\displaystyle (5) \qquad \lim_{x \to x_0,\, x \neq x_0} \frac{|f(x) - f(x_0) - \mathrm{D}_{x_0}(f)(x-x_0)|}{|x-x_0|} = 0.$

Das ist natürlich äquivalent zu

$\displaystyle (5') \qquad \lim_{h \to 0,\, h \neq 0} \frac{|f(x_0+h) - f(x_0) - \mathrm{D}_{x_0}(f)(h)|}{|h|} = 0.$

In den meisten Büchern wird $(5)$ oder $(5')$ als Definition der Ableitung genannt. Wir werden aber mit der Definition $(4)$ arbeiten und die Eigenschaften der Berührungsrelation in den Vordergrund stellen.

Der Zusammenhang zur Stetigkeit

Wenn $f$ differenzierbar in $x_0$ ist, dann ist ihre affin-lineare Approximation per Definition stetig2 in $x_0$. Weil sich Stetigkeit bei Berührung vererbt, ist also auch $f$ stetig in $x_0$.

Tatsächlich folgt eine etwas stärkere Stetigkeitsbedingung: die affin-lineare Approximation ist stetig und damit sogar Lipschitz-stetig, wie wir oben bemerkt haben. Sie ist insbesondere punktweise Lipschitz-stetig in $x_0$, und weil sich diese Eigenschaft bei Berührung vererbt, ist also auch $f$ punktweise Lipschitz-stetig in $x_0$.3

Weil im endlich-dimensionalen Fall jede affin-lineare Funktion automatisch stetig ist, kann man in dem Fall die Forderung der Stetigkeit in der Definition der Differenzierbarkeit weglassen.

2Dieudonné fordert die Stetigkeit nicht, aber die meisten Quellen tun es.
3Wenn $X,Y$ endlich-dimensional sind und $f$ stetig-differenzierbar ist, kann man zeigen, dass $f$ sogar in einer Umgebung von $x_0$ Lipschitz-stetig ist.

Zwei Ableitungsregeln

Die Ableitung einer stetigen affin-linearen Funktion $L + y$ ist natürlich $L$ (in jedem Punkt). Das schließt den Fall $L=0$ mit ein: Die Ableitung einer konstanten Funktion ist $0$.

Weil die Berührungsrelation verträglich mit Summen und skalaren Vielfachen ist, folgen sofort entsprechende Ableitungsregeln: Wenn $f$ durch $A=L+y$ und $g$ durch $L'+y'$ berührt wird (mit stetigen linearen $L,L'$), wird $f+g$ durch $(L+y)+(L'+y)=(L+L')+y+y'$ berührt, sodass die Ableitung von $f+g$ also $L+L'$ ist, die Summe der Ableitungen von $f$ und $g$:

$(6) \qquad \mathrm{D}_{x_0}(f+g)=\mathrm{D}_{x_0}(f) + \mathrm{D}_{x_0}(g)$

Genauso argumentiert man bei

$(7) \qquad \mathrm{D}_{x_0}(\lambda \cdot f) = \lambda \cdot \mathrm{D}_{x_0}(f)$

für Skalare $\lambda \in \IK$.

Kettenregel

Um die Kettenregel für Ableitungen in ähnlicher Weise konzeptionell zu beweisen, müssen wir uns Gedanken darüber machen, inwiefern die Berührungsrelation mit der Komposition von Funktionen verträglich ist. Das ist leider nicht immer der Fall: Betrachten wir die stetigen Funktionen $f,g : \IR \to \IR$, $f(x) := x^2$, $g(x) := \sqrt{|x|}$. Es gilt $f \sim_0 0$, aber $g \circ f \sim_0 g \circ 0 = 0$ und auch $f \circ g \sim_0 0 \circ g = 0$ gelten nicht, denn $f \circ g = g \circ f$ ist die Funktion $x \mapsto |x|$, die offensichtlich nicht die Nullfunktion berührt.

Für (punktweise) Lipschitz-stetige Funktionen geht aber alles gut:

Verträglichkeit mit der Komposition von hinten. Seien $X,Y,Z$ metrische Räume, $x_0 \in X$, $y_0 \in Y$. Seien $g_1,g_2 : Y \to Z$ zwei Funktionen mit $g_1 \sim_{y_0} g_2$, und sei $f : X \to Y$ eine in $x_0$ punktweise Lipschitz-stetige Funktion mit $f(x_0)=y_0$. Dann gilt auch $g_1 \circ f \sim_{x_0} g_2 \circ f$.

Beweis. Wähle eine Konstante $L > 0$, sodass $d(f(x),f(x_0)) \leq L \cdot d(x,x_0)$ für alle $x$ aus einer Umgebung $U$ von $x_0$ gilt. Sei $\varepsilon > 0$. Wähle ein $\delta > 0$, sodass für alle $y \in Y$ gilt:

$d(y,y_0) \leq \delta \implies d(g_1(y),g_2(y)) \leq \frac{\varepsilon}{L} \cdot d(y,y_0)$

Aus $x \in U$ und $d(x,x_0) \leq \frac{\delta}{L}$ folgt nun zunächst

$d(f(x),y_0) = d(f(x),f(x_0)) \leq L \cdot d(x,x_0) \leq \delta$

und daher

$d(g_1(f(x)),g_2(f(x_0))) \leq \frac{\varepsilon}{L} \cdot d(f(x),y_0) \leq\frac{\varepsilon}{L} \cdot L \cdot d(x,x_0) = \varepsilon \cdot d(x,x_0). ~ \checkmark$

Verträglichkeit mit der Komposition von vorne. Seien $X,Y,Z$ normierte Räume, $x_0 \in X$. Seien $f_1,f_2 : X \to Y$ zwei Funktionen mit $ f_1 \sim_{x_0} f_2$. Sei $y_0 = f_1(x_0)=f_2(x_0) \in Y$. Ist $g : Y \to Z$ Lipschitz-stetig, so gilt auch $g \circ f_1 \sim_{x_0} g \circ f_2$.

Beweis. Sei $L > 0$ eine Lipschitz-Konstante für $g$. Sei $\varepsilon > 0$. Wähle ein $\delta > 0$, sodass

$d(x,x_0) \leq \delta \implies d(f_1(x),f_2(x)) \leq \frac{\varepsilon}{L} \cdot d(x,x_0)$

für alle $x \in X$ gilt. Dann gilt also auch

$d(g(f_1(x)),g(f_2(x))) \leq L \cdot d(f_1(x),f_2(x)) \leq L \cdot \frac{\varepsilon}{L} \cdot d(x,x_0) = \varepsilon \cdot d(x,x_0). ~ \checkmark$

Nun können wir konzeptionell die Kettenregel beweisen:

Kettenregel. Seien $X,Y,Z$ normierte Räume, $x_0 \in X$. Seien $f : X \dashrightarrow Y$, $g : Y \dashrightarrow Z$ Funktionen, die in $x_0$ bzw. $y_0 := f(x_0)$ differenzierbar sind. Dann ist auch die Komposition $g \circ f : X \dashrightarrow Z$ in $x_0$ differenzierbar, und für die Ableitungen gilt

$(8) \qquad \mathrm{D}_{x_0}(g \circ f) = \mathrm{D}_{y_0}(g) \circ \mathrm{D}_{x_0}(f).$

Beweis. Es gibt Konstanten $y \in Y$, $z \in Z$ mit

$f \sim_{x_0} \mathrm{D}_{x_0}(f) + y$

$g \sim_{y_0} \mathrm{D}_{y_0}(g) + z$

Weil $f$ punktweise Lipschitz-stetig in $x_0$ ist, folgt aus der Verträglichkeit der Komposition von hinten

$g \circ f ~ \sim_{x_0} ~ (\mathrm{D}_{y_0}(g) + z) \circ f$

Weil $\mathrm{D}_{y_0}(g) + z$ (als stetige affin-lineare Funktion) Lipschitz-stetig ist, folgt aus der Verträglichkeit mit der Komposition von vorne

$(\mathrm{D}_{y_0}(g) + z) \circ f ~ \sim_{x_0} ~ (\mathrm{D}_{y_0}(g) + z) \circ (\mathrm{D}_{x_0}(f) + y)$

Die Komposition rechts ist aber bis auf eine Konstante gleich $\mathrm{D}_{y_0}(g) \circ \mathrm{D}_{x_0}(f)$. $~\checkmark$

Produktregel

Bevor wir das nächste Lemma beweisen, geben wir eine Heuristik dafür an. Sei dazu $f : X \times Y \to Z$ eine bilineare Funktion. Wenn wir diese ableiten wollen, müssen wir daraus eine lineare Funktion gewinnen, was zunächst einmal aussichtlos ist. Nun steht uns aber der Punkt $(x_0,y_0) \in X \times Y$ zur Verfügung, bei dem wir ableiten, und die Definition der Bilinearität beinhaltet gerade, dass $f(x_0,-) : Y \to Z$ und $g(-,y_0) : X \to Z$ lineare Funktionen sind. Dann sind also auch $f(x_0,-) \circ \mathrm{pr}_2 : X \times Y \to Y \to Z$ und $g(-,y_0) \circ \mathrm{pr}_1 : X \times Y \to X \to Z$ linear. Wir wollen aber eine lineare Funktion $X \times Y \to Z$ haben. Die offensichtliche Wahl dafür ist nun die Summe der beiden linearen Funktionen, die wir uns überlegt haben. Dass es tatsächlich die Ableitung ist, wird nun zu einer Routine-Rechnung:

Ableitung bilinearer Funktionen. Seien $X,Y,Z$ normierte Räume. Sei $f : X \times Y \to Z$ eine stetige bilineare Funktion. Dann ist $f$ in jedem Punkt $(x_0,y_0) \in X \times Y$ differenzierbar, und es gilt für die Ableitung

$(9) \qquad \mathrm{D}_{x_0,y_0}(f)(x,y) = f(x_0,y) + f(x,y_0).$

Beweis. Wir wählen die $1$-Norm auf $X \times Y$, also $|(x,y)| := |x| + |y|$. Definiere $F : X \times Y \to Z$ durch $F(x,y) := f(x_0,y) + f(x,y_0)$. Dann ist $F$ linear. Weil $f$ stetig und bilinear ist, gibt es eine Zahl $r > 1$, sodass für alle $(x,y) \in X \times Y$ die Ungleichung $|f(x,y)| \leq r |x| |y|$ besteht. Setze $\delta := \sqrt{\varepsilon}/r$. Für $|(x,y)| \leq \delta$ folgt dann mit der Bilinearität

$|f(x_0+x,y_0+y) - f(x_0,y_0) - F(x,y)| = |f(x,y)| \leq r |x| |y| \leq \varepsilon$.

Damit ist gezeigt, dass $F$ die Ableitung von $f$ in $(x_0,y_0)$ ist. $~\checkmark$

Ableitungen von Paaren. Seien $f : X \dashrightarrow Y$, $g : X \dashrightarrow Z$ zwei Funktionen, die in $x_0 \in X$ differenzierbar sind. Dann ist auch $(f,g) : X \dashrightarrow Y \times Z$ in $x_0$ differenzierbar mit

$(10) \qquad \mathrm{D}_{x_0}(f,g) = (\mathrm{D}_{x_0}(f),\mathrm{D}_{x_0}(g))$

Beweis. Das folgt sofort aus der trivialen allgemeinen Beobachtung $f \sim_{x_0} f'$, $g \sim_{x_0} g'$ $\implies (f,g) \sim_{x_0} (f',g')$. $~\checkmark$

Jetzt können wir elegant die allgemeine Produktregel folgern. Hierbei ist eine normierte Algebra ein normierter Raum, dessen zugrunde liegender Vektorraum zugleich eine Algebra-Struktur trägt, sodass die Rechenregeln $|1| \leq 1$ und $|x \cdot y| \leq |x| \cdot |y|$ gelten. Zum Beispiel ist $\IR$ mit den üblichen Strukturen eine normierte Algebra. Man kann sich überlegen, dass die Multiplikation einer normierten Algebra eine stetige Funktion ist.

Produktregel. Seien $X$ ein normierter Raum und $A$ eine normierte Algebra. Sind dann zwei Funktionen $f,g : X \dashrightarrow A$ in $x_0 \in X$ differenzierbar, dann ist auch die Funktion $f \cdot g : X \dashrightarrow A$ in $x_0$ differenzierbar mit

$(11) \qquad \mathrm{D}_{x_0}(f \cdot g) = f \cdot \mathrm{D}_{x_0}(g) + \mathrm{D}_{x_0}(f) \cdot g$

Beweis. Wir zerlegen $f \cdot g$ in die Komposition der beiden Funktionen $(f,g) : X \dashrightarrow A \times A$ und $m : A \times A \to A$, wobei $m$ die Multiplikation von $A$ ist. Es ist $m$ eine stetige bilineare Funktion, also differenzierbar (in jedem Punkt), und $(f,g)$ ist ebenfalls differenzierbar in $x_0$. Die Kettenregel impliziert daher, dass $f \cdot g$ in $x_0$ differenzierbar ist. Die Ableitung können wir aus den Formeln $(8)$, $(9)$, $(10)$ gewinnen:

$\begin{align*}
\mathrm{D}_{x_0}(f \cdot g)(x) & = \mathrm{D}_{x_0}(m \circ (f,g))(x) \\
& = (\mathrm{D}_{f(x),g(x)}(m) \circ \mathrm{D}_{x_0}(f,g))(x) \\
& = \mathrm{D}_{f(x),g(x)}(m)(\mathrm{D}_{x_0}(f)(x),\mathrm{D}_{x_0}(g)(x)) \\
& = m(f(x),\mathrm{D}_{x_0}(g)(x)) + m(\mathrm{D}_{x_0}(f)(x),g(x)) \\
& = f(x) \cdot \mathrm{D}_{x_0}(g)(x) + \mathrm{D}_{x_0}(f)(x) \cdot g(x) ~ \checkmark
\end{align*}$

Die Produktregel kann man natürlich auch auf mehrere Faktoren verallgemeinern. Damit lässt sich dann zum Beispiel zeigen, dass die Ableitung der Potenzfunktion $a \mapsto a^k$ in einer normierten Algebra $A$ in einem Punkt $a \in A$ die lineare Funktion $h \mapsto h a^{k-1} + a h a^{k-2} + \cdots + a^{k-1} h$ ist – wenn $A$ kommutativ ist, vereinfacht sich das zu $h \mapsto k a^{k-1} h$.

Umkehrregel

Ein Homöomorphismus ist eine stetige Funktion, die eine inverse stetige Funktion besitzt. Wie schon vorher erklärt, vereinfachen wir die Notation: Wenn von einem Homöomorphismus $f : X \dashrightarrow Y$ die Rede ist, meinen wir eigentlich einen Homöomorphismus $f : U \to V$ für gewisse offene Mengen $U \subseteq X$, $V \subseteq Y$.

Umkehrregel. Seien $X,Y$ normierte Räume. Sei $f : X \dashrightarrow Y$ ein Homöomorphismus und $x_0 \in X$ derart, dass $f$ in $x_0$ differenzierbar ist und die lineare Funktion $\mathrm{D}_{x_0}(f) : X \to Y$ ebenfalls ein Homöomorphismus ist. Dann ist $f^{-1}$ in $y_0 := f(x_0)$ differenzierbar, und es gilt die Beziehung

$(12) \qquad \mathrm{D}_{f(x_0)}(f^{-1}) = \mathrm{D}_{x_0}(f)^{-1}.$

Beweis. Wir starten mit der Definition

$f \sim_{x_0} \mathrm{D}_{x_0}(f) + y$

mit einer Konstanten $y \in Y$. Weil $\mathrm{D}_{x_0}(f)^{-1}$ eine stetige lineare Funktion ist, ist sie Lipschitz-stetig. Daraus folgt, dass $\mathrm{D}_{x_0}(f)$ punktweise invers-Lipschitz-stetig in $x_0$ ist. Diese Eigenschaft vererbt sich bei Berührung, sodass also $f$ punktweise invers-Lipschitz-stetig in $x_0$ ist. Das bedeutet aber, dass $f^{-1}$ punktweise Lipschitz-stetig in $y_0$ ist. Die Verträglichkeit mit der Komposition von hinten liefert also

$\mathrm{id}_Y = f \circ f^{-1} \sim_{y_0} (\mathrm{D}_{x_0}(f) + y) \circ f^{-1}.$

Nun ist $(\mathrm{D}_{x_0}(f) + y)^{-1}$ bis auf eine Konstante $x \in X$ gleich $\mathrm{D}_{x_0}(f)^{-1}$ und daher eine stetige affin-lineare Funktion, insbesondere Lipschitz-stetig. Wir können daher die Verträglichkeit mit der Komposition von vorne anwenden und erhalten weiter

$\mathrm{D}_{x_0}(f)^{-1} + x = (\mathrm{D}_{x_0}(f) + y)^{-1} \circ \mathrm{id}_Y \sim_{y_0} (\mathrm{D}_{x_0}(f) + y)^{-1} \circ (\mathrm{D}_{x_0}(f) + y) \circ f^{-1} = f^{-1}.$

Und damit ist alles gezeigt. $~\checkmark$

Im endlich-dimensionalen Fall vereinfacht sich die Annahme an die Ableitung in der Umkehrregel natürlich; es muss lediglich gefordert werden, dass $\mathrm{D}_{x_0}(f)$ bijektiv ist. Entsprechendes gilt, wenn $X,Y$ vollständige normierte Räume, also Banachräume sind (Satz von der offenen Abbildung).

Es stellt sich hier natürlich die Frage, ob allgemeiner für Homöomorphismen $f,g$ die Regel $f \sim_{x_0} g \implies f^{-1} \sim_{y_0} g^{-1}$ gilt. Das ist aber nicht der Fall: wir hatten ja schon anfangs bemerkt, dass zwar $x^3 \sim_0 x^5$ gilt, aber $\sqrt[3]{x} \not\sim_0 \sqrt[5]{x}$.

Inversion

Mit den bisher gezeigten Ableitungsregeln kann man schon viele Beispiele von Funktionen ableiten, aber eine wichtige Funktion fehlt noch: die Funktion $a \mapsto a^{-1}$ auf $\IR^*$ zum Beispiel. Aber auch $a \mapsto a^{-1}$ auf $\mathrm{GL}_n(\IK) \subseteq \IK^{n \times n}$ würden wir gerne ableiten. Allgemeiner kann man folgende Situation betrachten:

Ableitung der Inversion. Sei $A$ eine Banachalgebra (also eine vollständige normierte Algebra). Sei $A^{\times}$ die Menge der invertierbaren Elemente von $A$. Dann ist $A^{\times}$ eine offene Teilmenge von $A$, und die Inversion $I : A^{\times} \to A^{\times}$, $I(a) := a^{-1}$ ist in jedem Punkt differenzierbar. Für $a \in A^{\times}$ ist die Ableitung gegeben durch

$(13) \qquad \mathrm{D}_{a}(I)(h) = - a^{-1} \cdot h \cdot a^{-1}$

Wenn $A$ kommutativ ist, nimmt die Ableitung also die etwas vertraulichere Form $\mathrm{D}_{a}(I)(h) = -a^{-2} \cdot h$ an.

Beweis. Vieles werden wir hier von einem beliebigen Element $a \in A^{\times}$ auf das Element $1 \in A^{\times}$ zurückführen können. Dazu werden wir die stetigen linearen Funktionen $\lambda_a : A \to A$, $x \mapsto ax$ und $\rho_a : A \to A$, $x \mapsto xa$ benötigen. Sie sind sogar Homöomorphismen, denn $\lambda_{a^{-1}}$ ist zu $\lambda_a$ invers; analog mit $\rho$. Außerdem gilt $\lambda_a(1)=a$ und $\rho_a(1)=a$.

Die geometrische Reihe in $A$ (auch als Neumann-Reihe bekannt) ist hier das entscheidende Hilfsmittel. Für $h \in A$ mit $|h| < 1$ konvergiert die Reihe $\sum_{k \geq 0} h^k$ absolut, denn $\sum_{k \geq 0} |h^k| \leq \sum_{k \geq 0} |h|^k = (1 - |h|)^{-1}$ ist eine gewöhnliche geometrische Reihe. Weil $A$ vollständig ist, konvergiert die Reihe also auch in $A$ gegen einen Wert. Er ist offenbar zu $1-h$ invers. Also existiert $(1-h)^{-1}$, und für die Norm gilt zudem die Abschätzung $|(1-h)^{-1}| \leq (1-|h|)^{-1}$.

Wir haben gesehen, dass $1 \in A^{\times}$ eine offene Umgebung $U \subseteq A$ besitzt (nämlich den offenen Ball vom Radius $1$ mit Mittelpunkt $1$), die vollständig in $A^{\times}$ liegt. Für beliebiges $a \in A^{\times}$ ist dann $\lambda_a(U) \subseteq A$ eine offene Umgebung von $\lambda_a(1)=a$, die vollständig in $A^{\times}$ liegt. Also ist $A^{\times}$ offen.

Zeigen wir nun zunächst, dass $I$ differenzierbar in $1 \in A^{\times}$ mit der Ableitung $\mathrm{D}_1(I)(h) = -h$ ist. Es muss also gezeigt werden, dass $|I(1+h)-I(1)-(-h)|/|h| \to 0$ für $h \to 0$, oder äquivalent $|I(1-h)-I(1)-h|/|h| \to 0$ für $h \to 0$. Für $|h| < 1$ gilt aber $I(1-h)-I(1)-h = (1-h)^{-1}-1-h = h^2 (1-h)^{-1}$ (im letzten Schritt benutzt man die geometrische Reihe), also $|I(1-h)-I(1)-h|/|h| \leq |h| (1-|h|)^{-1} \to 0$ für $h \to 0$.

Dass $I$ in einem beliebigen Punkt $a \in A^{\times}$ differenzierbar ist, kann man darauf zurückführen: Es gilt nämlich

$I = \rho_{a^{-1}} \circ I \circ \lambda_{a^{-1}}.$

Aus $\lambda_{a^{-1}}(a)=1$ und der Kettenregel folgt also, dass $I$ in $a$ differenzierbar ist mit

$\mathrm{D}_a(I) = \mathrm{D}_{I(1)}(\rho_{a^{-1}}) \circ \mathrm{D}_1(I) \circ \mathrm{D}_a(\lambda_{a^{-1}}) = \rho_{a^{-1}} \circ (-\mathrm{id}) \circ \lambda_{a^{-1}} = - \rho_{a^{-1}} \circ \lambda_{a^{-1}},$

was gerade die Behauptung ist. $~\checkmark$

Kategorientheoretische Interpretation

Die hier vorgestellte Theorie lässt sich auch kategorientheoretisch interpretieren. Wir betrachten die folgende Kategorie $\mathsf{LocNorm}_*$ der "lokalen punktierten normierte Räume". Objekte sind Paare $(X,U,x_0)$, wobei $X$ ein normierter Raum, $x_0 \in X$ ein Punkt und $x_0 \in U \subseteq X$ eine offene Umgebung ist. Ein Morphismus $f : (X,U,x_0) \to (Y,V,y_0)$ sei eine Funktion $f : U \to V$ mit $f(x_0)=y_0$, welche in $x_0$ stetig ist. Es ist klar, wie die Komposition zu definieren ist.

Die Berührungsrelation ist nun eine Äquivalenzrelation auf den Morphismen-Mengen $\mathrm{Hom}((X,U,x_0),(Y,V,y_0))$ dieser Kategorie. Wenn man so etwas hat, stellt sich sofort die Frage nach der Verträglichkeit mit der Komposition, also ob es sich um eine Kongruenzrelation handelt. Wir haben gesehen, dass das leider nicht der Fall ist, dass aber die Verträglichkeiten "von hinten" bzw. "von vorne" für in dem gewählten Punkt punktweise Lipschitz-stetige bzw. Lipschitz-stetige Funktionen gelten. Daraus kann man ableiten, dass sie allgemein für in dem gewählten Punkt differenzierbare Funktionen gelten. Die differenzierbaren Funktionen liefern demnach eine Unterkategorie

$\mathsf{LocDiff}_* \subseteq \mathsf{LocNorm}_*,$

auf der die Berührungsrelation $\sim$ eine Kongruenzrelation ist, sodass wir die Quotientenkategorie $\mathsf{LocDiff}_* \longrightarrow \mathsf{LocDiff}_* / {\sim}$ bilden können. Weiterhin gibt es einen Isomorphismus von Kategorien

$\mathsf{LinNorm}_{(*)} ~ \cong ~ \mathsf{LocDiff}_* / {\sim}$

wobei $\mathsf{LinNorm}_{(*)}$ die Kategorie der punktierten normierten Vektorräume mit stetigen linearen Funktionen bezeichne, die nicht notwendig punktiert sind. (Es gibt also eine Äquivalenz von Kategorien $\mathsf{LinNorm}_{(*)} \simeq \mathsf{LinNorm}$, keinen Isomorphismus.) Ein punktierter normierter Vektorraum $(X,x_0)$ wird hierbei dem Objekt $(X,X,x_0)$ der Quotientenkategorie zugeordnet, und eine stetige lineare Funktion $L : X \to Y$ mit $L(x_0)=y_0$ der Äquivalenzklasse von $L + (y_0 - L(x_0))$. Dass das ein Isomorphismus von Kategorien ist, liegt letztlich an der Definition der Differenzierbarkeit und der schon beobachteten Tatsache, dass sich zwei affin-lineare Funktionen genau dann bei einem Punkt berühren, wenn sie überall gleich sind. Wir erhalten in der Komposition einen Funktor

$\mathsf{LocDiff}_* \longrightarrow \mathsf{LocDiff}_* / {\sim} ~ \cong ~ \mathsf{LinNorm}_{(*)}.$

Das Bild einer in $x_0$ differenzierbaren Funktion $f$ unter diesem Funktor ist also eine stetige lineare Funktion, ihre Ableitung $\mathrm{D}_{x_0}(f)$. Und dass es ein Funktor ist, ist eben gerade die Kettenregel.

Danke an Vercassivelaunos fürs Korrekturlesen!

\(\endgroup\)
Get link to this article Get link to this article  Printable version Printer-friendly version -  Choose language     Kommentare zeigen Comments  
pdfFür diesen Artikel gibt es keine pdf-Datei


Arbeitsgruppe Alexandria Dieser Artikel ist nicht im Verzeichnis der Arbeitsgruppe Alexandria eingetragen.
[Die Arbeitsgruppe Alexandria katalogisiert die Artikel auf dem Matheplaneten]

 
 
Aufrufzähler 279
 
Aufrufstatistik des Artikels
Insgesamt 1 externer Seitenaufruf zwischen 2021.03 und 2021.03 [Anzeigen]
DomainAnzahlProz
https://duckduckgo.com1100%100 %

[Top of page]

"Mathematik: Über Berührungen und Ableitungen" | 0 Comments
The authors of the comments are responsible for the content.

 
All logos and trademarks in this site are property of their respective owner. The comments are property of their posters, all the rest © 2001-2021 by Matroids Matheplanet
This web site was originally made with PHP-Nuke, a former web portal system written in PHP that seems no longer to be maintained nor supported. PHP-Nuke is Free Software released under the GNU/GPL license.
Ich distanziere mich von rechtswidrigen oder anstößigen Inhalten, die sich trotz aufmerksamer Prüfung hinter hier verwendeten Links verbergen mögen.
Lesen Sie die Nutzungsbedingungen, die Distanzierung, die Datenschutzerklärung und das Impressum.
[Seitenanfang]