Stern Mathematik: Wie man einfache Beweise ohne Mühe finden kann
Released by matroid on Sa. 07. Oktober 2017 10:11:20 [Statistics] [Comments]
Written by Triceratops - 6580 x read [Outline] Printable version Printer-friendly version -  Choose language   
Mathematik

\(\begingroup\)

Wie man einfache Beweise ohne Mühe finden kann

Wenn man mit dem Studium der Mathematik beginnt, kommt es einem manchmal so vor, als ob Beweise sehr schwierig zu finden sind und ein hohes Maß an Kreativität und Talent erfordern. Selbst wenn man die Musterlösung sieht, denkt man sich manchmal "Darauf wäre ich nie gekommen", "Ich bin zu blöd dafür" oder "Das ist total schwierig". Viele Beweise in den ersten Semestern lassen sich aber ohne Mühe finden. Die Beweisschritte sind regelrecht erzwungen. Man muss sich dabei nur ein paar universelle Denkmethoden oder -muster aneignen, die oft zum Ziel führen. Dieser Artikel richtet sich an Studienanfänger und stellt diese Methoden anhand von einigen Beispielen vor.


Erstes Beispiel

Fangen wir mit einem ausführlichen Beispiel an. Die folgende Aufgabe könnte in einer Vorlesung zur linearen Algebra gestellt werden.
Sei \(f : V \to W\) eine injektive lineare Abbildung zwischen zwei \(K\)-Vektorräumen \(V,W\). Sei \((v_1,\dotsc,v_n)\) ein linear unabhängiges Tupel in \(V\). Zeigen Sie, dass dann auch \((f(v_1),\dotsc,f(v_n))\) ein linear unabhängiges Tupel in \(W\) ist.
Bevor wir überhaupt mit der Aufgabe anfangen, müssen wir verstehen, was die mathematischen Begriffe "injektiv", "lineare Abbildung", "Vektorraum", "linear unabhängiges Tupel" bedeuten. Dies lässt sich mit Wikipedia oder dem Skript, mit dem man gerade arbeitet, erledigen. Die Definitionen eines Vektorraumes und einer Abbildung wiederhole ich hier nicht, aber zu den anderen Begriffen: • Eine Abbildung \(f : V \to W\) zwischen zwei \(K\)-Vektorräumen heißt linear, wenn \(f(v+v')=f(v)+f(v')\) für alle \(v,v' \in V\) und \(f(\lambda v) = \lambda f(v)\) für alle \(\lambda \in K\), \(v \in V\) gilt. • Eine Abbildung \(f : X \to Y\) zwischen zwei Mengen heißt injektiv, wenn für alle \(x,x' \in X\) gilt: \(f(x)=f(x') \implies x=x'\). • Ein Tupel \((v_1,\dotsc,v_n)\) von Vektoren in einem \(K\)-Vektorraum \(V\) heißt linear unabhängig, wenn gilt: Ist \((\lambda_1,\dotsc,\lambda_n)\) ein Tupel in \(K\) mit \(\lambda_1 v_1 + \cdots + \lambda_n v_n = 0_V\), so gilt \(\lambda_1=\dotsc=\lambda_n=0\). Bisher haben wir gar nichts getan: Wir haben nur das wiederholt, was uns entweder schon bekannt war oder uns jedenfalls schon vor der Aufgabe notwendigerweise zur Verfügung gestellt worden ist. Wir haben natürlich nicht wiederholt, was eine Matrix ist, weil in der Aufgabe keine Matrizen vorkommen, sondern lediglich die Begriffe, die für die Aufgabe relevant sind. Was ganz hilfreich wäre, ist ein paar Beispiele und Nicht-Beispiele für lineare Abbildungen, injektive Abbildungen, und linear unabhängige Tupel im Kopf zu haben oder ebenfalls nachzuschlagen. Für die Lösung der Beweisaufgabe ist das allerdings nicht unbedingt wichtig. Außerdem ist es nützlich, ein paar Eigenschaften parat zu haben, die bereits in der Vorlesung genannt worden sind. So erfüllt eine lineare Abbildung \(f : V \to W\) zum Beispiel \(f(0_V)=0_W\). Im Idealfall sollte man in der Lage sein, den Beweis für diese Gleichung zu reproduzieren. Nun kommen wir zur eigentlichen Aufgabe. Wir sichten erst einmal, welche Daten und Voraussetzungen gegeben sind: • \(V,W\) sind zwei \(K\)-Vektorräume, • \(f : V \to W\) ist eine lineare Abbildung, die injektiv ist, • \((v_1,\dotsc,v_n)\) ist ein linear unabhängiges Tupel in \(V\). Und daraus soll nun eine Folgerung gezogen werden, nämlich: • \((f(v_1),\dotsc,f(v_n))\) ist ein linear unabhängiges Tupel in \(W\). Eine Skizze kann nie schaden: \begin{tikzpicture}[line width=0.12ex] \draw [fill=blue!5] (0,0) circle [radius=1.5cm] node [below=1.6cm] {\(V\)} node [above] {\(v_1,\dotsc,v_n\)} node [below] {linear unabhängig}; \draw [fill=blue!5] (5,0) circle [radius=1.5cm] node [below=1.6cm] {\(W\)} node {\(f(v_1),\dotsc,f(v_n)\)}; \draw [->] (1.7,0) -- (3.3,0) node [above,midway] {\(f\)} node [below,midway] {linear} node [below=0.35cm,midway] {injektiv}; \end{tikzpicture} Um das zu zeigen, schauen wir uns also die Definition von "linear unabhängiges Tupel" an: Wir müssen ein Tupel \((\lambda_1,\dotsc,\lambda_n)\) in \(K\) nehmen mit \(\lambda_1 f(v_1) + \cdots + \lambda_n f(v_n)=0_W\) und wollen zeigen, dass \(\lambda_1=\dotsc=\lambda_n=0\) gilt. Weil das nicht einfach so gefolgert werden kann, müssen wir dabei die genannten Voraussetzungen verwenden. Insbesondere müssen wir irgendwie die lineare Unabhängigkeit des Tupels \((v_1,\dotsc,v_n)\) ausnutzen. Diese betrifft, wenn wir einen Blick auf die Definition werfen, Ausdrücke der Form \(\lambda_1 v_1 + \cdots + \lambda_n v_n\). Diese spielen sich in \(V\) ab. Der Ausdruck \(\lambda_1 f(v_1) + \cdots + \lambda_n f(v_n)\) spielt sich aber in \(W\) ab. Es gibt nur eine Möglichkeit, diese Ausdrücke in Beziehung zu setzen, nämlich mit der Abbildung \(f : V \to W\), denn es gibt sonst nichts in den Daten, was zwischen \(V\) und \(W\) eine Verbindung herstellen könnte. Wir sind also quasi dazu gezwungen, \(f(\lambda_1 v_1 + \cdots + \lambda_n v_n)\) mit \(\lambda_1 f(v_1) + \cdots + \lambda_n f(v_n)\) zu vergleichen; beides sind Vektoren in \(W\). Bisher haben wir die Linearität von \(f\) gar nicht ausgenutzt, also sollten wir das nun tun. Und wir erkennen, dass die Linearität gerade impliziert, dass die beiden Ausdrücke miteinander übereinstimmen. Es gilt also, wenn wir nun die Annahme verwenden, \(f(\lambda_1 v_1 + \cdots + \lambda_n v_n) = \lambda_1 f(v_1) + \cdots + \lambda_n f(v_n)=0_W.\) Bisher haben wir die Injektivität von \(f\) noch nicht verwendet. Diese sollten wir jetzt also ins Spiel bringen. Weil auch \(f(0_V)=0_W\) gilt, impliziert die Injektivität von \(f\), angewandt auf die beiden Vektoren \(x=\lambda_1 v_1 + \cdots + \lambda_n v_n\) und \(x'=0_V\), dass \(\lambda_1 v_1 + \cdots + \lambda_n v_n = 0_V\) gilt. Jetzt sind wir endlich in der Lage, die noch ausstehende Voraussetzung anzuwenden, dass \((v_1,\dotsc,v_n)\) linear unabhängig ist, und folgern: Es gilt \(\lambda_1=\dotsc=\lambda_n=0\). Das war aber genau zu zeigen. Der Beweis ist fertig, und jeder Schritt war quasi erzwungen. Wenn man so einen Beweis gefunden hat, sollte man ihn am Ende am besten noch einmal kurz und bündig aufschreiben, also die gesamte Prosa von oben entfernen. Das sieht dann so aus: Sei \(\lambda_1 f(v_1) + \cdots + \lambda_n f(v_n)=0_W\) mit \(\lambda_i \in K\). Dann gilt, weil \(f\) linear ist, \(f(\lambda_1 v_1 + \cdots + \lambda_n v_n) = \lambda_1 f(v_1) + \cdots + \lambda_n f(v_n)=0_W=f(0_V)\). Weil \(f\) injektiv ist, folgt \(\lambda_1 v_1 + \cdots + \lambda_n v_n=0_V\). Weil \((v_1,\dotsc,v_n)\) linear unabhängig ist, folgt \(\lambda_1=\dotsc=\lambda_n=0\). Damit ist \((f(v_1),\dotsc,f(v_n))\) linear unabhängig. QED Öfters bekommt man den Beweis dann nur so präsentiert, und als Anfänger stellt man sich dann zu Recht die Frage, wie man darauf gekommen ist. Ich hoffe, dass die obige Herleitung des Beweises klargemacht hat, dass man mehr oder weniger keine Wahl hat, diesen Beweis so zu führen, und dass dafür keinerlei Kreativität oder Talent notwendig sind. Man muss nur über die Daten, Vorausssetzungen und Folgerungen ordentlich Buch führen. Zugegeben hat man oben immer eine Wahl getroffen, welche Voraussetzung gerade benutzt werden sollte. Aber die Aufgaben in diesem Artikel sind so einfach gestrickt, dass man auch dabei immer nur eine sinnvolle Wahl hat. So hätte man bei der Gleichung \(f(\lambda_1 v_1 + \cdots + \lambda_n v_n)=0_W\) nicht erneut die Linearität anwenden sollen, weil dann wäre man ja einen Schritt rückwärts gegangen und wäre wieder bei der Annahme \(\lambda_1 f(v_1) + \cdots + \lambda_n f(v_n)=0_W\) gelandet. Weil wir mit dem Beweis aber vorankommen wollen, macht man so etwas nicht. Bei der Gleichung hätte man auch nicht die Axiome eines Vektorraumes sinnvoll anwenden können. Zwar könnten wir \(\lambda_1 v_1 + \cdots + \lambda_n v_n\) als \(1 (\lambda_1 v_1) + \lambda_2 v_2 + \cdots + \lambda_n v_n - 0_W\) schreiben, aber damit hätte man den Ausdruck nur verkompliziert, und es ist nicht ersichtlich, was uns das helfen sollte. Man sollte also schon im Auge behalten, die Dinge nicht unnötig kompliziert zu machen. Es hilft nichts, alle Voraussetzungen irgendwie anzuwenden, sondern man sollte zielgerichtet auf die Behauptung zusteuern. Es sollte einen übrigens stutzig machen, wenn man den Beweis vermeintlich erledigt hat, aber nirgendwo die Injektivität von \(f\) benutzt hat: Wenn \(f : V \to W\) nicht injektiv ist, gibt es ein \(v \in V\) mit \(v \neq 0_V\) und \(f(v)=0_W\). Dann ist \((v)\) ein linear unabhägiges Tupel in \(V\) (der Länge \(1\)), aber \((f(v))=(0_W)\) ist linear abhängig in \(W\). Die Aufgaben werden in der Regel schon so gestellt, dass fast alle Voraussetzungen gebraucht werden. Auch das sollte man immer im Hinterkopf behalten, zumal es die möglichen Beweisverläufe stark einschränkt. Das gilt zumindest für die explizit genannten Eigenschaften der gegebenen Daten. Wenn man genau hinschaut, haben wir oben nirgendwo gebraucht, dass \(K\) ein Körper ist, und ein Ring etwa würde ebenfalls reichen.

Zweites Beispiel

Die folgende Aufgabe könnte in der Analysis gestellt werden:
Seien \((a_n)_{n \geq 0}\), \((b_n)_{n \geq 0}\) zwei konvergente reelle Folgen mit \(\lim_{n \to \infty} a_n = a\) und \(\lim_{n \to \infty} b_n = b\). Zeigen Sie, dass dann auch \((a_n + b_n)_{n \geq 0}\) konvergiert, und \(\lim_{n \to \infty} (a_n + b_n) = a+b\) gilt.
Wir wiederholen zunächst, was Konvergenz bedeutet: Eine Folge \((a_n)_{n \geq 0}\) konvergiert gegen \(a\), in Zeichen \(\lim_{n \to \infty} a_n = a\), wenn es für alle reelle Zahlen \(\varepsilon>0\) eine natürliche Zahl \(N \geq 0\) gibt, sodass für alle natürlichen Zahlen \(n \geq N\) gilt: \(|a_n - a| < \varepsilon\). (Eine Veranschaulichung gibt es hier.) Dies ist also gegeben. Analog ist \(\lim_{n \to \infty} b_n = b\) gegeben, dass es also für alle reelle Zahlen \(\varepsilon>0\) eine natürliche Zahl \(N \geq 0\) gibt, sodass für alle natürlichen Zahlen \(n \geq N\) gilt: \(|b_n - b| < \varepsilon\). Die Behauptung ist, dass die Folge \((a_n + b_n)_{n \geq 0}\) gegen \(a+b\) konvergiert. Das bedeutet, dass es für alle reellen Zahlen \(\varepsilon>0\) eine natürliche Zahl \(N \geq 0\) gibt, sodass für alle \(n \geq N\) gilt: \(|(a_n + b_n) - (a+b)| < \varepsilon\). Soweit haben wir erst einmal lediglich die Voraussetzungen und die Behauptung ausgeschrieben. Um nun die Behauptung zu zeigen, geben wir uns also eine reelle Zahl \(\varepsilon>0\) vor. Wir müssen irgendwie die beiden Voraussetzungen anwenden. Dafür ist eine reelle Zahl \(>0\) nötig, und die haben wir, zum Beispiel \(\varepsilon\). Allerdings ist diese Wahl von \(\varepsilon\) nicht erzwungen. Wir wenden stattdessen die beiden Voraussetzungen auf zwei reelle Zahlen \(\varepsilon',\varepsilon'' > 0\) an, die wir später präzisieren werden. Es gibt also eine natürliche Zahl \(N'\), sodass \(|a_n - a| < \varepsilon'\) für alle \(n \geq N'\) gilt. Außerdem gibt es eine natürliche Zahl \(N''\), sodass \(|b_n - b| < \varepsilon''\) für alle \(n \geq N''\) gilt. Am besten wäre es, wenn beide Ungleichungen gleichzeitig gelten würden, weil wir auf die Summe \(a_n + b_n\) hinauswollen, in der beide Folgen gleichzeitig vorkommen. Beide Ungleichungen sind offenbar für \(n \geq \max(N',N'')\) erfüllt, weil dann sowohl \(n \geq N'\) als auch \(n \geq N''\) gilt. Erinnern wir uns wieder daran, was eigentlich zu zeigen ist: \(|(a_n + b_n) - (a+b)| < \varepsilon\). Weil wir wissen, dass \(a_n\) etwas mit \(a\) und \(b_n\) etwas mit \(b\) zu tun hat, liegt es nahe, diese jeweils zusammenzubringen, und den Ausdruck \((a_n + b_n) - (a+b)\) umzuschreiben als \((a_n - a) + (b_n - b)\). Wir haben nun also drei Ausdrücke auf dem Stapel, nämlich \(|a_n - a|\), \(|b_n - b|\) und \(|(a_n - a) + (b_n - b)|\), und wir müssen diese miteinander in Beziehung setzen, um weiterzukommen. Sie haben die Form \(|x|\), \(|y|\), \(|x+y|\), und spätestens hier sieht man, dass die Dreiecksungleichung angewandt werden muss: Diese besagt \(|x+y| \leq |x| + |y|\). Wenn man sich daran nicht erinnert, kann man im Skript oder bei Wikipedia nachschlagen, was zum Thema Beträge zu finden ist, weil es sich hier schließlich um Beträge handelt. Jetzt fügen wir die gefundenen Ungleichungen zusammen: \(|(a_n - a)+(b_n - b)| \leq |a_n - a| + |b_n - b| < \varepsilon' + \varepsilon''.\) Wir erinnern uns, dass das Ziel ist, dass der Betrag auf der linken Seite kleiner als \(\varepsilon\) wird. Das wird aus der obigen Ungleichung folgen, indem wir sicherstellen, dass \(\varepsilon' + \varepsilon'' \leq \varepsilon\) gilt. Aber die Wahl von \(\varepsilon'\) und \(\varepsilon''\) steht uns noch frei. Wir können also zum Beispiel \(\varepsilon' := \varepsilon'' := \frac{1}{2} \varepsilon\) definieren, dann ist die Ungleichung erfüllt. Der Beweis ist damit fertig. Auch hier war jeder Schritt mehr oder weniger erzwungen. Schreiben wir den Beweis wieder in Kurzform ohne Prosa auf: Sei \(\varepsilon>0\). Es gibt eine natürliche Zahl \(N'\), sodass \(|a_n-a| < \frac{1}{2} \varepsilon\) für alle \(n \geq N'\) gilt, und es gibt eine natürliche Zahl \(N''\), sodass \(|b_n-b| < \frac{1}{2} \varepsilon\) für alle \(n \geq N''\) gilt. Für alle \(n \geq \max(N',N'')\) folgt dann mit der Dreiecksungleichung \(|(a_n+b_n)-(a+b)| = |(a_n-a)+(b_n-b)| \leq |a_n-a| + |b_n-b| < \frac{1}{2} \varepsilon + \frac{1}{2} \varepsilon = \varepsilon.\) Das zeigt, dass \((a_n + b_n)_{n \geq 0}\) gegen \(a+b\) konvergiert. QED

Die allgemeine Methode

Eine Beweisaufgabe fängt mit einer Liste von Daten und Voraussetzungen an, und schließt mit einer Behauptung ab. Der erste Schritt besteht darin, die dabei verwendeten mathematischen Begriffe zu verstehen. Wenn man sich nicht mehr an die Bedeutungen bzw. Definitionen erinnert, muss man diese im Skript oder bei Wikipedia nachschlagen. Wenn bereits hier Verständnisprobleme auftreten, müssen noch grundlegendere Begriffe sowie die einfachsten Grundlagen der Logik wiederholt werden, bevor die Aufgabe bearbeitet wird. Es kann nützlich sein, sich auch noch einmal allgemein mit den relevanten Begriffen zu beschäftigen, weil in der Aufgabe voraussichtlich auch Eigenschaften verwendet werden, die bereits in der Vorlesung behandelt worden sind. Nach dieser Wiederholung lassen sich die Voraussetzungen und die Behauptung ausführlicher gemäß der Definitionen ausschreiben. Man entwickelt ein Verständnis dafür, worum es eigentlich geht. Zur besseren Übersicht kann man die Objekte bei Bedarf in einer Skizze anordnen. Oftmals muss man, um die Behauptung zu zeigen, gemäß der Definitionen ein paar Daten und/oder Gleichungen vorgeben (z.B. "Sei \(\lambda_1 f(v_1) + \cdots + \lambda_n f(v_n)=0\)" oder "Sei \(\varepsilon>0\)"). Mit diesen kann man dann die Voraussetzungen "füttern", wobei oftmals nur eine mögliche Wahl vorhanden ist. Damit das möglich ist, muss man eventuell die anderen Voraussetzungen benutzen, oder Hilfsaussagen, die bereits in der Vorlesung zum Thema behandelt worden sind. Was dabei herauskommt, sind weitere Aussagen, die entweder in Kombination direkt zur Behauptung führen, oder aber man muss das Spiel von vorne beginnen, ist aber der Behauptung einen Schritt näher gekommen. Um die Orientierung zu behalten und zielführend zu arbeiten, kann man sich immer wieder in Erinnerung rufen, was die Behauptung war, und was man bereits an bewiesenen Aussagen gesammelt hat. Letztere kann man auch durchnummerieren und so schnell wiederfinden. Hierbei hilft auch eine Rückwärtslogik: Um \(Z\) zu beweisen, muss man wohl \(Y\) beweisen. Und um \(Y\) zu beweisen, muss man wohl \(X\) beweisen. Also kümmert man sich erst einmal um \(X\). Man nähert sich dem Ziel also sowohl "von vorne" als auch "von hinten". Es wird umzingelt. Wenn man am Ende des Beweises eine Voraussetzung gar nicht genutzt hat, dann hat man vermutlich einen Fehler gemacht und sollte den Beweis noch einmal überprüfen. Denn Voraussetzungen stehen normalerweise nicht ohne Grund in der Aufgabenstellung. Oftmals sind sie, zumindest in abgeschwächter Form, notwendig, damit die zu beweisende Aussage gilt. Man sollte vielmehr so an die Aufgabe herangehen: Was kann ich mit den mir zur Verfügung gestellten Voraussetzungen anfangen? Wenn ich an einem Punkt im Beweis bin und nicht weiterkomme, welche Voraussetzung habe ich bisher noch nicht genutzt? Wenn man den Beweis am Ende gefunden hat, schreibt man ihn in Kurzform auf und entfernt dabei jede Form von Prosa. Auch die Definitionen müssen nicht mehr allgemein wiederholt werden. Die Argumente müssen hier in einer nachvollziehbaren Reihenfolge aufgeführt werden. Übrigens gehört bei Übungszetteln in der Regel nur diese Kurzform in die Abgabe. Tendenziell funktioniert diese vorgestellte Methode eher bei einfachen algebraischen Beweisen als bei analytischen Beweisen. In der Regel braucht es in der Analysis mehr Kreativität. Im Regelfall sollte man nicht mit einem Widerspruchsbeweis ansetzen (also das Gegenteil der Behauptung annehmen und irgendwie einen Widerspruch herleiten). Die oben dargestellte direkte Methode ist meistens schneller, einfacher und auch (in einem formalen, aber auch informalen Sinne) konstruktiver.

Weitere Beispiele

Beispiel 3

Seien \(X,Y,Z\) drei Mengen. Zeigen Sie \(X \cap (Y \cup Z) = (X \cap Y) \cup (X \cap Z)\).
Hier müssen wir die Definitionen von \(\cap\) und \(\cup\) wiederholen. Für zwei Mengen \(X,Y\) ist ihre Vereinigung \(X \cup Y = \{u : u \in X \text{ oder } u \in Y\}\) und ihr Durchschnitt \(X \cap Y = \{u : u \in X \text{ und } u \in Y\}\). Die Situation lässt sich so veranschaulichen (die Menge in der Aufgabe ist blau markiert): \begin{tikzpicture}[scale=1.4] \definecolor{blau}{rgb}{0.2,0.5,1} \def\firstcircle{(0,0) circle [radius=8mm]} \def\secondcircle{(0.5,0.866) circle [radius=8mm]} \def\thirdcircle{(1,0) circle [radius=8mm]} \begin{scope} \clip \firstcircle; \fill[blau] \secondcircle; \fill[blau] \thirdcircle; \end{scope} \draw [thin] \firstcircle node [below left] {$X$}; \draw [thin] \secondcircle node [above] {$Z$}; \draw [thin] \thirdcircle node [below right] {$Y$}; \end{tikzpicture} Wir müssen uns auch daran erinnern, was die Gleichheit von zwei Mengen bedeutet: Dafür müssen sie dieselben Elemente enthalten. Es ist also zu zeigen, dass \(u \in X \cap (Y \cup Z)\) genau dann gilt, wenn \(u \in (X \cap Y) \cup (X \cap Z)\) gilt. Es sind also zwei Richtungen zu zeigen. Wenn \(u \in X \cap (Y \cup Z)\), so bedeutet das per Definition des Durchschnitts, dass \(u \in X\) und \(u \in Y \cup Z\) gilt. Die Aussage \(u \in Y \cup Z\) bedeutet per Definition der Vereinigung, dass (a) \(u \in Y\) oder (b) \(u \in Z\) gilt. Im Fall (a) haben wir einerseits \(u \in X\) und andererseits \(u \in Y\). Per Definition des Durchschnitts bedeutet dies \(u \in X \cap Y\). Im Fall (b) erhalten wir analog \(u \in X \cap Z\). Wir haben damit gezeigt, dass \(u \in X \cap Y\) oder \(u \in X \cap Z\) gilt. Per Definition der Vereinigung ist also \(u \in (X \cap Y) \cup (X \cap Z)\). Die andere Richtung, also \(u \in (X \cap Y) \cup (X \cap Z) \implies u \in X \cap (Y \cup Z)\), verläuft analog, und lassen wir hier weg. In diesem Beweis haben wir lediglich die Definitionen ausgenutzt und sind so ans Ziel gelangt. Es waren keine Ideen nötig.

Beispiel 4

Sei \(f : V \to W\) eine lineare Abbildung zwischen \(K\)-Vektorräumen \(V,W\). Sei \(U \subseteq V\) ein Unterraum. Zeigen Sie, dass auch das Bild \(f(U) := \{f(u) : u \in U\} \subseteq W\) ein Unterraum ist.
Man wiederholt zunächst die Definitionen von "lineare Abbildung", "Vektorraum" und "Unterraum". Die Definition der Bildmenge \(f(U)\) wurde bereits in der Aufgabenstellung wiederholt. Schaut man in seine Unterlagen zum Thema "Unterraum", so findet man das Unterraum-Kriterium. Es besagt, dass eine Teilmenge \(U \subseteq V\) genau dann ein Unterraum ist, wenn folgendes gilt: (a) \(0_V \in U\), (b) Aus \(u,u' \in U\) folgt \(u+u' \in U\), (c) Aus \(u \in U\) und \(\lambda \in K\) folgt \(\lambda u \in U\). Um also zu zeigen, dass \(f(U) \subseteq W\) ein Unterraum ist, gehen wir (a),(b) und (c) nacheinander durch: Für (a) müssen wir \(0_W \in f(U)\) zeigen. Wir wissen, weil \(U \subseteq V\) ein Unterraum ist, dass \(0_V \in U\) gilt. Wir müssen eine Relation zwischen \(0_V\) und \(0_W\) herstellen. Dies kann und muss über \(f\) geschehen. Die Linearität von \(f\) impliziert nämlich \(f(0_V)=0_W\). Es gilt daher \(0_W = f(0_V) \in f(U)\) wegen \(0_V \in U\). Um (b) zu zeigen, wählen wir uns zwei Vektoren \(x,x' \in f(U)\). Gemäß der Definition von \(f(U)\) bedeutet dies, dass es \(u,u' \in U\) gibt mit \(x = f(u)\) und \(x' = f(u')\). Es liegt nun nahe, (b) für \(U\) anzuwenden: Wir erhalten damit \(u+u' \in U\). Wieder wenden wir die Linearität von \(f\) an, und erhalten \(x+x'=f(u)+f(u')=f(u+u') \in f(U)\). Bei (c) gehen wir genauso vor. In diesem Beweis war jeder Schritt erzwungen. Man kann den Beweis kürzer aufschreiben, indem man die Mengennotationen \(U+U = \{u + u' : u,u' \in U\}\) und \(K \cdot U = \{\lambda u : \lambda \in K,\, u \in U\}\) verwendet: (a) Es gilt \(0_W = f(0_V) \in f(U)\). (b) Es gilt \(f(U)+f(U) \subseteq f(U+U) \subseteq f(U)\). (c) Es gilt \(K \cdot f(U) \subseteq f(K \cdot U) \subseteq f(U)\). QED

Beispiel 5

Sei \(f : V \to W\) eine surjektive lineare Abbildung zwischen zwei \(K\)-Vektorräumen \(V,W\). Sei \((v_1,\dotsc,v_n)\) ein Erzeugendensystem von \(V\). Dann ist auch \((f(v_1),\dotsc,f(v_n))\) ein Erzeugendensystem von \(W\).
Im ersten Schritt wiederholt man die Definitionen von "surjektiv", "lineare Abbildung", "Vektorraum", "Erzeugendensystem". Dann schreibt man sich auf, was die Voraussetzungen und die Behauptung gemäß dieser Definitionen eigentlich bedeuten. Ich schreibe das an dieser Stelle nicht mehr auf. Um zu zeigen, \((f(v_1),\dotsc,f(v_n))\) ein Erzeugendensystem ist, muss man sich ein \(w \in W\) vorgeben, und es als Linearkombination dieser Vektoren schreiben. Um auszunutzen, dass \(f\) surjektiv ist, wählen wir ein \(v \in V\) mit \(w = f(v)\). Um auszunutzen, dass \((v_1,\dotsc,v_n)\) ein Erzeugendensystem ist, wählen wir ein Tupel \((\lambda_1,\dotsc,\lambda_n)\) in \(K\) mit \(v = \lambda_1 v_1 + \cdots + \lambda_n v_n\). Um die Linearität von \(f\) auszunutzen, folgern wir \(f(v) = \lambda_1 f(v_1) + \cdots + \lambda_n f(v_n)\). Aber es gilt \(w = f(v)\) nach Wahl von \(v\). Also ist \(w = \lambda_1 f(v_1) + \cdots + \lambda_n f(v_n)\), und wir sind fertig. In der fertigen Form ersetzt man nur noch "Um auszunutzen, dass" durch "Weil". Oder man schreibt das Argument mit Mengen auf: \(K f(v_1) + \cdots + K f(v_n) = f(K v_1 + \cdots + K v_n) = f(V) = W\).

Beispiel 6

Sei \(V\) ein \(K\)-Vektorraum und \(f : V \to V\) eine lineare Abbildung mit \(f^2=f\). Zeigen Sie \(V = \ker(f) \oplus \mathrm{im}(f)\).
Wir müssen zunächst die Begriffe "Vektorraum", "lineare Abbildung" wiederholen, und außerdem die Bedeutung der Notationen \(f^2\), \(\oplus\), \(\ker(f)\) und \(\mathrm{im}(f)\) nachschlagen. Es ist \(f^2 := f \circ f\), wobei \(\circ\) die übliche Verkettung von linearen Abbildungen ist. Also \(f^2=f\) bedeutet per Definition, dass \(f(f(v))=f(v)\) für alle \(v \in V\) gilt. Die Notation \(V = U \oplus W\) ("interne direkte Summe") für zwei Unterräume \(U,W \subseteq V\) bedeutet, dass sich jedes \(v \in V\) schreiben lässt als \(v = u + w\) mit \(u \in U\), \(w \in W\), und diese Darstellung obendrein eindeutig ist. Das Bild \(\mathrm{im}(f) := \{f(v) : v \in V\}\) ist ein Unterraum von \(V\), und der Kern \(\ker(f) := \{v \in V : f(v)=0\}\) ist ebenfalls ein Unterraum von \(V\). Um nun die eigentliche Aufgabe anzugehen, starten wir mit einem \(v \in V\). Wir suchen eine Darstellung \(v = u + w\) mit \(u \in \ker(f)\) und \(w \in \mathrm{im}(f)\). Das heißt per Definition, dass \(f(u)=0\) gilt, und dass \(w = f(v')\) für ein \(v' \in V\) gilt. Wir suchen also eine Darstellung \(v = u + f(v')\), wobei \(f(u)=0\). Weil uns nicht direkt einfällt, wie das gehen soll, schauen wir uns an, was aus einer solchen Darstellung folgen würde. Denn so könnten wir etwas über \(u\) und \(v'\) herausfinden. Weil wir hier es mit einer Summe zu tun haben, liegt es nahe, einmal \(f\) anzuwenden und die Linearität von \(f\) auszunutzen. Wir erhalten damit \(f(v) = f(u) + f(f(v'))\). Nach Annahme gilt \(f(u)=0\). Außerdem gilt nach Annahme \(f(f(v'))=f(v')\). Die Gleichung vereinfacht sich daher zu \(f(v)=f(v')\), also \(w=f(v)\). Wir haben also bereits den zweiten Summanden \(w\) gefunden. Der erste Summand \(u\) ist dann aber notwendigerweise gleich \(u = v - f(v') = v - f(v)\). Es sind also \(u\) und \(w\) eindeutig bestimmt, sofern sie existieren. Umgekehrt haben wir nun aber eine gute Idee, wie wir die Existenz beweisen können: Für \(v \in V\) setzen wir \(u := v - f(v)\) und \(w := f(v)\). Es gilt also \(v = u + w\), und wir müssen nur noch \(u \in \ker(f)\) und \(w \in \mathrm{im}(f)\) prüfen. Letzteres folgt aus der Definition von \(\mathrm{im}(f)\), und Ersteres lässt sich nachrechnen: Es gilt \(f(u) = f(v - f(v)) = f(v) - f(f(v))\), weil \(f\) linear ist. Nach Annahme gilt aber \(f(f(v))=f(v)\). Also ist \(f(u)=0\). Das schließt den Beweis ab. Zur Kurzform: Die Annahme \(f^2=f\) bedeutet \(f(w)=w\) für \(w \in \mathrm{im}(f)\) (*). Für \(v \in V\) ist \(v = (v - f(v)) + f(v)\) mit \(v - f(v) \in \ker(f)\), denn \(f(v-f(v))=f(v)-f(f(v))=0\), und \(f(v) \in \mathrm{im}(f)\). Ist \(v = u + w\) mit \(u \in \ker(f)\) und \(w \in \mathrm{im}(f)\), so folgt \(0 = f(u) = f(v - w)=f(v)-f(w) = f(v)-w\) wegen (*), also \(w=f(v)\). Das zeigt die Eindeutigkeit von \(w\), und dann ist auch \(u=v-w\) eindeutig. QED

Beispiel 7

Seien \(G_1,G_2\) zwei abelsche Gruppen. Zeigen Sie, dass dann auch \(G_1 \times G_2\) abelsch ist.
Hier muss man zunächst die Definitionen von "abelsch", "Gruppe" und \(\times\) (kartesisches Produkt von Gruppen) nachschlagen. Um zu zeigen, dass \(G_1 \times G_2\) abelsch ist, müssen wir uns zwei Elemente \(x,y \in G_1 \times G_2\) nehmen und \(xy=yx\) zeigen. Per Definition des kartesischen Produktes ist \(x=(x_1,x_2)\) mit \(x_1 \in G_1\) und \(x_2 \in G_2\). Analog ist \(y=(y_1,y_2)\) mit \(y_1 \in G_1\) und \(y_2 \in G_2\). Das Produkt \(xy=(x_1,x_2)(y_1,y_2)\) ist per Definition des kartesischen Produktes von Gruppen gleich \((x_1 y_1,x_2 y_2)\). Analog ist \(yx\) gleich \((y_1 x_1,y_2 x_2)\). Wir müssen also zeigen, dass \((x_1 y_1,x_2 y_2)=(y_1 x_1,y_2 x_2)\), was per Definition eines geordneten Paares bedeutet, dass \(x_1 y_1 = y_1 x_1\) und \(x_2 y_2 = y_2 x_2\) gilt. Soweit haben wir lediglich die Definitionen benutzt, um auszuschreiben, was eigentlich zu zeigen ist. Jetzt müssen wir also die Voraussetzungen anwenden, nämlich dass die beiden Gruppen \(G_1\) und \(G_2\) abelsch sind. Dass \(G_1\) abelsch ist, impliziert aber \(x_1 y_1=y_1 x_1\), und analog ergibt sich \(x_2 y_2 = y_2 x_2\) daraus, dass \(G_2\) abelsch ist. Man hat hier also wieder nichts anderes getan, als die Voraussetzungen unmittelbar anzuwenden und ist, nach der genannten Umschreibung, sofort fertig. Die Kurzform des Beweises lautet ganz einfach: Seien \(x,y \in G_1 \times G_2\), etwa \(x=(x_1,x_2)\) und \(y=(y_1,y_2)\). Dann gilt, weil \(G_1\) und \(G_2\) abelsch sind, \(xy=(x_1 y_1,x_2 y_2)=(y_1 x_1,y_2 x_2)=yx\). Also ist \(G_1 \times G_2\) abelsch. QED

Beispiel 8

Sei \(f : X \to Y\) eine Abbildung. Sei \(\mathcal{B}\) eine \(\sigma\)-Algebra auf \(Y\). Zeigen Sie, dass \(f^{-1}(\mathcal{B}) := \{f^{-1}(B) : B \in \mathcal{B}\}\) eine \(\sigma\)-Algebra auf \(X\) ist.
Vorab bemerken wir, dass \(f^{-1}(B)\) nichts mit der Umkehrabbildung von \(f\) zu tun hat, die auch gar nicht existieren muss (denn \(f\) ist beliebig), sondern dass hier die Urbildmenge von \(B\) bezüglich \(f\) gemeint ist, die wiederum per Definition \(f^{-1}(B) := \{x \in X : f(x) \in B\}\) ist. Die Annahme, dass \(\mathcal{B}\) eine \(\sigma\)-Algebra auf \(Y\) ist, bedeutet per Definition: (a) Es ist \(\mathcal{B} \subseteq P(Y)\). (Und das bedeutet per Definition, dass jedes Element \(B \in \mathcal{B}\) eine Teilmenge von \(Y\) ist.) (b) Es ist \(Y \in \mathcal{B}\). (c) Für \(B \in \mathcal{B}\) ist \(Y \setminus B \in \mathcal{B}\). (d) Ist \((B_i)_{i \geq 0}\) eine Folge von Mengen in \(\mathcal{B}\), so ist auch \(\bigcup_{i \geq 0} B_i\) in \(\mathcal{B}\) enthalten. Zu zeigen ist, dass \(f^{-1}(\mathcal{B})\), was in der Aufgabe definiert worden ist, eine \(\sigma\)-Algebra auf \(X\) ist, was per Definition bedeutet: (a') Es ist \(f^{-1}(\mathcal{B}) \subseteq P(X)\). (b') Es ist \(X \in f^{-1}(\mathcal{B})\). (c') Für \(A \in f^{-1}(\mathcal{B})\) ist \(X \setminus A \in f^{-1}(\mathcal{B})\). (d') Ist \((A_i)_{i \geq 0}\) eine Folge von Mengen in \(f^{-1}(\mathcal{B})\), so ist auch \(\bigcup_{i \geq 0} A_i\) in \(f^{-1}(\mathcal{B})\) enthalten. Soweit haben wir lediglich die Definitionen ausgeschrieben. Noch ist nichts passiert. Um für x = a,b,c,d jeweils (x') zu zeigen, liegt es nahe, (x) zu verwenden. In (a') ist per Definition von \(f^{-1}(\mathcal{B})\) zu zeigen, dass \(f^{-1}(B) \subseteq X\) für alle \(B \in \mathcal{B}\) gilt, was sofort aus der Definition von \(f^{-1}(B)\) folgt; hierbei ist \(f^{-1}(B)\) nur wegen (a) überhaupt definiert. In (b') müssen wir per Definition von \(f^{-1}(\mathcal{B})\) eine Menge \(T \in \mathcal{B}\) mit \(X = f^{-1}(T)\) finden, und aus (b) wissen wir \(Y \in \mathcal{B}\). Es liegt also nahe, \(X = f^{-1}(Y)\) zu prüfen, und das stimmt auch gemäß der Definition von \(f^{-1}(Y)\). In (c') haben wir ein \(A \in f^{-1}(\mathcal{B})\), was per Definition bedeutet, dass \(A = f^{-1}(B)\) für ein \(B \in \mathcal{B}\) gilt. Aus (c) wissen wir \(Y \setminus B \in \mathcal{B}\). (Es bleibt uns nichts anderes übrig, als (c) auf \(B\) anzuwenden, weil kein anderes nichttriviales Element von \(\mathcal{B}\) in Sichtweise ist.) Wir wollen \(X \setminus A \in f^{-1}(\mathcal{B})\) zeigen, d.h. \(X \setminus f^{-1}(B) = f^{-1}(T)\) für ein \(T \in \mathcal{B}\). Es liegt also nahe, \(X \setminus f^{-1}(B) = f^{-1}(Y \setminus B)\) zu prüfen, und das stimmt auch gemäß der Definition des Urbildmenge. (Notfalls muss man diese Gleichung nun noch ausführlicher beweisen, wenn man sie nicht schon aus einer anderen Vorlesung kennt, wovon hier auszugehen wäre.) Bei (d') geht man nun entsprechend vor: Wir schreiben \(A_i = f^{-1}(B_i)\) mit \(B_i \in \mathcal{B}\) und erkennen (ich kürze das nun ab) \(\bigcup_{i \geq 0} A_i = \bigcup_{i \geq 0} f^{-1}(B_i) = f^{-1}\left(\bigcup_{i \geq 0} B_i\right) \in f^{-1}(\mathcal{B})\), denn wegen (d) gilt \(\bigcup_{i \geq 0} B_i \in \mathcal{B}\). Auch in diesem Beweis war jeder Schritt geradzu erzwungen.

Beispiel 9

Sei \((a_n)_{n \geq 0}\) eine reelle Folge mit \(\lim_{n \to \infty} a_n=a\). Sei \(s_n := \frac{1}{n} (a_1 + \cdots + a_n)\). Zeigen Sie, dass dann auch \(\lim_{n \to \infty} s_n = a\) gilt.
Im ersten Schritt wiederholt man die Definition einer konvergenten Folge bzw. des Ausdrucks \(\lim_{n \to \infty} a_n = a\). Um \(\lim_{n \to \infty} s_n = a\) zu zeigen, müssen wir uns eine reelle Zahl \(\varepsilon>0\) vorgeben. Um die Voraussetzung anzuwenden, wählen wir eine reelle Zahl \(\varepsilon'>0\), die wir später festlegen, und finden eine natürliche Zahl \(N\), sodass \(|a_n - a| < \varepsilon'\) für alle \(n > N\) gilt. (Eigentlich können wir hier sogar \(n \geq N\) schreiben, aber es wird sich zeigen, dass die Formeln unten einfacher werden, wenn wir \(n > N\) schreiben.) Wir erinnern uns, dass wir \(|s_n - a| < \varepsilon\) zeigen möchten. Um Ausdrücke der Form \(a_m - a\) zu erhalten, von denen wir etwas wissen, schreiben wir \(s_n - a\) um als \(s_n - a = \frac{1}{n} (a_1 + \cdots + a_n) - \frac{1}{n} (a + \cdots + a) = \frac{1}{n} ((a_1 - a) + \cdots + (a_n - a)).\) Anschließend zeigt uns die Dreiecksungleichung \(|s_n - a| \leq \frac{1}{n} (|a_1 - a| + \cdots + |a_n - a|).\) Wir müssen uns jetzt also diese Summanden \(|a_m - a|\) für \(m=1,\dotsc,n\) näher ansehen. Für \(m > N\) wissen wir bereits \(|a_m - a| < \varepsilon'\). Das betrifft \(n-N\) Summanden. Für \(m \leq N\) hingegen wissen wir nichts über diese Summanden. Wir können also nichts anderes tun, als sie vorerst stehenzulassen. Sei \(R := |a_1 - a| + \cdots + |a_N - a|\). Wir erhalten: \( \frac{1}{n} (|a_1 - a| + \cdots + |a_n - a|) \leq \frac{1}{n} (R + (n-N) \varepsilon') = \frac{R}{n} + \left(1 - \frac{N}{n}\right) \varepsilon'.\) Wir wollen, dass die rechte Seite kleiner als \(\varepsilon\) wird, zumindest wenn \(n\) groß genug ist. Das wird erreicht, wenn beide Summanden kleiner als \(\frac{\varepsilon}{2}\) werden. Die Ungleichung \(\frac{R}{n} < \frac{\varepsilon}{2}\) ist zu \(n > \frac{2R}{\varepsilon}\) äquivalent. Wir brauchen aber eine natürliche Zahl als Schranke und runden daher \(\frac{2R}{\varepsilon}\) lieber auf. Es liegt also nahe, \(N\) durch \(N' := \max(N,\lceil \frac{2R}{\varepsilon} \rceil)\) zu ersetzen. Für \(n > N'\) gilt dann nämlich \(\frac{R}{n} < \frac{\varepsilon}{2}\). Was den zweiten Summanden betrifft, erinnern wir uns daran, dass wir \(\varepsilon'\) noch frei (in Abhängigkeit von \(\varepsilon\)) wählen dürfen, bevor wir die Ungleichung wieder nach \(n\) auflösen. Wenn wir zum Beispiel \(\varepsilon' := \frac{\varepsilon}{2}\) wählen, dann gilt offenbar \(\left(1 - \frac{N}{n}\right) \varepsilon' < \varepsilon' = \frac{\varepsilon}{2}\), wie gewünscht. Das schließt den Beweis ab. Nun schreiben wir wieder die Kurzform auf: Sei \(\varepsilon>0\). Wähle \(N \geq 0\) mit \(|a_n-a| < \frac{\varepsilon}{2}\) für alle \(n>N\). Setze \(R := |a_1 - a| + \cdots + |a_N - a|\) und \(N' := \max(N,\lceil \frac{2R}{\varepsilon} \rceil)\). Für \(n > N'\) folgt dann \(|s_n - a| = \frac{1}{n} |(a_1 - a) + \cdots + (a_n - a)| \leq \frac{1}{n} (|a_1 - a| + \cdots + |a_N - a| + |a_{N+1}-a| + \cdots + |a_n - a|)\) \(\leq \frac{1}{n} (R + (n-N) \frac{\varepsilon}{2}) = \frac{R}{n} + \left(1 - \frac{N}{n}\right) \frac{\varepsilon}{2} < \frac{\varepsilon}{2} + \frac{\varepsilon}{2} = \varepsilon.\) Das zeigt \(\lim_{n \to \infty} s_n = a\). QED

Beispiel 10

Sei \(X\) ein kompakter topologischer Raum und \(A \subseteq X\) eine abgeschlossene Teilmenge. Dann ist auch \(A\) kompakt.
Zunächst wiederholt man die Definition eines kompakten topologischen Raumes: Jede offene Überdeckung besitzt eine endliche Teilüberdeckung. Dann wiederholt man, was eine offene Überdeckung und eine endliche Teilüberdeckung ist, etc. Kompaktheit bezieht sich auf topologische Räume. Aber \(A\) ist erst einmal nur eine Teilmenge. Schaut man in seine Unterlagen zu den Grundlagen der Topologie, findet man dort die Bemerkung, dass auf Teilmengen stets die Teilraumtopologie verwendet wird. Das heißt also: Die offenen Teilmengen von \(A\) haben die Form \(A \cap U\) mit offenen Teilmengen \(U\) von \(X\). Das heißt, jede offene Überdeckung von \(A\) hat die Form \(A = \bigcup_{i \in I} (A \cap U_i)\) mit offenen Teilmengen \(U_i \subseteq X\). Wir müssen die Kompaktheit von \(X\) und die Abgeschlossenheit von \(A\) ausnutzen. Für ersteres müssen wir eine offene Überdeckung von \(X\) finden. Zumindest haben wir bereits \(A\) mit offenen Mengen überdeckt in dem Sinne, dass \(A \subseteq \bigcup_{i \in I} U_i\) gilt. Es bleibt das Komplement \(X \setminus A\) übrig, was per Definition einer abgeschlossenen Menge eine offene Teilmenge von \(X\) ist. Das bedeutet, wir haben eine offene Überdeckung \(X=(X \setminus A) \cup \bigcup_{i \in I} U_i\). Jetzt können bzw. müssen wir die Kompaktheit von \(X\) anwenden und erhalten eine endliche Teilmenge \(J \subseteq I\) mit \(X = (X \setminus A) \cup \bigcup_{i \in J} U_i\) (*). Genauer gesagt würde die Kompaktheit eine endliche Teilmenge von \(\{p\} \cup I\) ergeben, wobei \(p\) ein Index für \(X \setminus A\) sei, aber wir können sie ja ggf. vergrößern und \(p\) hinzunehmen, was die Endlichkeit nicht zerstört. Wir erinnern uns daran, dass wir eine endliche Teilüberdeckung von \(A = \bigcup_{i \in I} (A \cap U_i)\) suchen. Weil wir nun aber schon eine endliche Teilmenge \(J \subseteq I\) haben, liegt es nahe, die Gleichung \(A = \bigcup_{i \in J} (A \cap U_j)\) zu prüfen. Und die stimmt auch; sie folgt direkt aus (*).

Beispiel 11

Sei $E$ ein Banachraum und $T$ eine Menge. Der normierte Raum $\ell^{\infty}(T;E)$ der beschränkten Funktionen $f : T \to E$ mit der Supremumsnorm $\lVert f \rVert := \sup_{t \in T} \lVert f(t) \rVert$ ist vollständig, also ein Banachraum.
Zunächst einmal wiederholt man die Definitionen von normierten Räumen, Banachräumen, Beschränktheit, Norm, Supremum. Dass $\ell^{\infty}(T;E)$ mit der Supremumsnorm ein normierter Raum ist, beweisen wir hier nicht. Wir konzentrieren uns hier auf die Vollständigkeit. Es muss per Definition der Vollständigkeit gezeigt werden, dass jede Cauchyfolge in $\ell^{\infty}(T;E)$ konvergiert. Es sei also $(f_n)_{n \geq 0}$ eine Cauchyfolge in $\ell^{\infty}(T;E)$. Wir suchen einen Grenzwert in $\ell^{\infty}(T;E)$, was insbesondere eine beschränkte Funktion $f : T \to E$ sein wird. Wir müssen also ein $t \in T$ vorgeben und $f(t) \in E$ definieren. Wir wissen, dass $E$ vollständig ist. Um das auszunutzen, müssen wir eine Cauchyfolge in $E$ konstruieren. Weil wir lediglich die $f_n : T \to E$ und das $t \in T$ gegeben haben, ist man dazu gezwungen, die Folge $(f_n(t))_{n \geq 0}$ in $E$ zu betrachten. Sie ist tatsächlich eine Cauchyfolge. Das muss daraus folgen, dass $(f_n)_{n \geq 0}$ eine Cauchyfolge ist. Und tatsächlich, für alle $\varepsilon>0$ gibt es ein $n_0$, sodass für alle $n,m \geq n_0$ gilt: $\lVert f_n - f_m\rVert \leq \varepsilon$. Per Definition der Supremumsnorm bedeutet dies, dass $\lVert f_n(s) - f_m(s) \rVert \leq \varepsilon$ für alle $s \in T$ gilt. Weil wir nur ein Element von $T$ im Moment gegeben haben, nämlich $t$, müssen wir es einsetzen und erhalten $\lVert f_n(t) - f_m(t) \rVert \leq \varepsilon$. Es ist also $(f_n(t))_{n \geq 0}$ eine Cauchyfolge in $E$, und nach Annahme existiert daher ein Grenzwert $f(t) := \lim_{n \to \infty} f_n(t)$. Wir haben damit eine Funktion $f : T \to E$ definiert, und diese ist der einzige Kandidat für den gesuchten Grenzwert. Dafür müssen wir noch die Beschränktheit von $f$ zeigen, damit $f \in \ell^{\infty}(T;E)$ gilt, und dass $\lim_{n \to \infty} \lVert f - f_n \rVert = 0$ gilt. Weil uns spontan keine Schranke für $f$ ins Auge springt, fangen wir mit dem zweiten Teil an. Sei also $\varepsilon>0$. Wir haben bisher noch gar nicht zur Gänze ausgenutzt, dass $(f_n)_{n \geq 0}$ eine Cauchyfolge ist, was wir nun tun müssen. Wir finden also für jedes $\varepsilon'>0$ (welches später spezifiziert werden kann) ein $n_0$, sodass für alle $n,m \geq n_0$ gilt: $\lVert f_n - f_m \rVert \leq \varepsilon'.$ Für jedes $t \in T$ gilt also $\lVert f_n(t) - f_m(t) \rVert \leq \varepsilon'$. Nun wollen wir aber auf $f - f_n$ hinaus, und daher müssen wir auf die Definition von $f$ bzw. genauer gesagt $f(t)$ zurückgreifen. Diese sagt uns, dass es für jedes $\varepsilon''>0$ (welches wir später noch spezifizieren dürfen) ein $n_t$ gibt (der Index soll anzeigen, dass wir im Moment $t$ festgehalten haben und daher $n_t$ in der Regel von $t$ abhängen wird), sodass $\lVert f(t) - f_n(t) \rVert \leq \varepsilon''$ für alle $n \geq n_t$ gilt. Jetzt müssen wir die beiden Ungleichungen natürlich miteinander kombinieren, um weiterzukommen. Das kann nur mit der Dreiecksungleichung funktionieren. Damit die vorletzte Ungleichung anwendbar wird, müssen wir neben $n \geq n_t$ auch noch $n,m \geq n_0$ annehmen und erhalten: $\lVert f(t) - f_m(t) \rVert \leq \lVert f(t) - f_n(t) \rVert + \lVert f_n(t) - f_m(t) \rVert \leq \varepsilon'' + \varepsilon'.$ Es liegt nun also nahe, $\varepsilon'$ und $\varepsilon''$ als $\frac{1}{2} \varepsilon$ zu wählen, denn so erhalten wir insgesamt $\lVert f(t) - f_m(t) \rVert \leq \varepsilon$ für alle $m \geq n_0$ und alle $t \in T$, was gerade zu zeigen war. Zu beachten ist noch, dass wir das $n$ oben auch tatsächlich wählen konnten, zum Beispiel als $\max(n_t,n_0)$, aber dass $m \geq n_0$ eben nicht von $t$ abhängt. Schließlich zur Beschränktheit von $f$: Wir müssen eine konkrete Schranke von $f$ finden. Es bleibt uns also nichts anderes übrig, als eine Ungleichung, die $f(t)$ beinhaltet und für alle $t \in T$ gilt, von oben zu finden, und die restlichen Variablen konkret festzulegen. Zum Beispiel erhalten wir aus der letzten Ungleichung für z.B. $\varepsilon:=1$, dass $\lVert f(t) - f_{n_0}(t) \rVert \leq 1$ für alle $t \in T$ gilt. Es ist also $f - f_{n_0}$ beschränkt. Nun müssen wir endlich die Annahme einfließen lassen, dass sich die Funktionen $f_n$ allesamt im Raum $\ell^{\infty}(T;E)$ befinden, also dass insbesondere $f_{n_0}$ beschränkt ist. Dann ist aber auch die Summe $( f - f_{n_0}) + f_{n_0}$ beschränkt, was an der Dreiecksungleichung liegt, und diese Summe ist gleich $f$. Das schließt den Beweis ab. Genauso lässt sich übrigens die folgende Verallgemeinerung beweisen: Sei $T$ eine Menge und $(E_t)_{t \in T}$ eine Familie von Banachräumen. Dann ist $\{f \in \prod_{t \in T} E_t : \sup_{t \in T} \lVert f(t) \rVert < \infty\}$ mit der Supremumsnorm ein Banachraum, das Produkt der Familie $(E_t)_{t \in T}$.

Beispiel 12

Seien $g : X \to Y$, $f : Y \to Z$ Abbildungen. Es sei $f \circ g$ surjektiv und $f$ injektiv. Dann ist $g$ surjektiv.
Zuerst wiederholt man die Definitionen von "injektiv", "surjektiv" und der Komposition von Abbildungen. Wir müssen zeigen, dass $g$ surjektiv ist, also starten wir mit einem $y \in Y$, und das Ziel ist, ein $x \in X$ zu finden mit $g(x) = y$. Wir haben zwei Voraussetzungen. Die Injektivität von $f$ können wir noch nicht verwenden, weil wir ja erst einmal nur ein Element von $Y$ haben, aber für die Anwendung der Injektivität schon zwei nötig wären. Also gibt es gar keine andere Wahl, als die Surjektivität von $f \circ g : X \to Z$ zu verwenden. Dazu müssten wir aber erst einmal ein Element von $Z$ finden. Wir haben wie gesagt nur ein Element auf unserem Stapel, nämlich $y \in Y$, und die einzige Möglichkeit, daraus mit den gegebenen Daten ein Element von $Z$ zu erzeugen, ist die Abbildung $f : Y \to Z$ anzuwenden. Wir betrachten also das Element $f(y) \in Z$ und erhalten mit der Surjektivität von $f \circ g$ ein Element $x \in X$ mit $(f \circ g)(x) = f(y)$, was also $f(g(x)) = f(y)$ bedeutet. Jetzt bleibt uns nichts anderes übrig, als die noch nicht verwendete Voraussetzung anzuwenden, nämlich die Injektivität von $f$: Aus $f(g(x)) = f(y)$ folgt damit $g(x) = y$. Damit sind wir fertig. In diesem Beweis war jeder Schritt "erzwungen". Kurzfassung: Sei $y \in Y$. Weil $f \circ g$ surjektiv ist, gibt es $x \in X$ mit $f(g(x))=f(y)$. Weil $f$ injektiv ist, ist $g(x)=y$. $\checkmark$

Beispiel 13

Sei $G$ eine Gruppe, sodass $x^2=1$ für alle $x \in G$ gilt. Dann ist $G$ abelsch.
Zunächst einmal wiederholt man die Definitionen von Gruppen, abelschen Gruppen, und $x^2 := x \cdot x = xx$. Wir müssen demnach zeigen, dass $ab = ba$ für alle $a,b \in G$ gilt. Im Kontext haben wir also zwei Elemente gegeben, $a$ und $b$, und müssen daraus Elemente $x$ konstruieren, mit denen wir die Voraussetzung $x^2=1$ füttern können. Dabei sollten wir es möglichst einfach halten und nicht gleich so etwas Kompliziertes wie $x = ab^{-1} a^5$ einsetzen. Starten wir lieber mit $x := a$. Wir erhalten also $a^2=1$. Genauso erhalten wir $b^2=1$. Jetzt könnte man noch weiter probieren mit $x := a^k$ oder $x := b^k$, aber letztlich wollen wir ja eine Gleichung ($ab=ba$) erhalten, in der $a$ und $b$ vorkommen. Das bekommen wir nur hin, wenn auch $x$ beide Elemente enthält. Die offenbar einfachste Wahl dafür ist $x := ab$. Wir erhalten damit $(ab)^2 = 1$, also $abab = 1$. Wir wollen etwas über $ab$ herausfinden, also bringen wir es auf eine Seite, indem wir von rechts mit $b^{-1}$ und dann von rechts mit $a^{-1}$ multiplizieren: $ab = b^{-1} a^{-1}$. Wir hatten aber bereits $a^2=1$ und $b^2=1$ herausgefunden, was gerade $a^{-1} = a$ und $b^{-1} = b$ bedeutet per Definition des inversen Elementes. Damit gilt also $ab = b^{-1} a^{-1} = ba$ und wir sind fertig. Hier noch die Kurzform: Seien $a,b \in G$. Nach Annahme gilt $a^2=1$ und $b^2=1$, also $a^{-1}=a$ und $b^{-1}=b$. Nach Annahme gilt weiterhin $(ab)^2=1$, also $abab=1$ und damit $ab = b^{-1} a^{-1} = ba$. QED

Beispiel 14

Sei $\Sigma_0 \subseteq \Sigma_1 \subseteq \Sigma_2 \subseteq \cdots$ eine aufsteigende Folge von Formelmengen, sodass jedes $\Sigma_n$ erfüllbar ist. Zeige mit dem Kompaktheitssatz, dass dann auch $\bigcup_{n \geq 0} \Sigma_n$ erfüllbar ist.
Der entscheidende, bereits vorgegebene Tipp ist hier, dass man den Kompaktheitssatz anwenden muss. Also wiederholt man zunächst einmal, was dieser Satz aussagt: eine Formelmenge ist erfüllbar, wenn jede endliche Teilmenge erfüllbar ist. Und weil wir zeigen wollen, $\bigcup_{n \geq 0} \Sigma_n$ erfüllbar ist, wenden wir das natürlich auf diese Menge ein. Wir müssen demnach nur zeigen, dass jede endliche Teilmenge von $\bigcup_{n \geq 0} \Sigma_n$ erfüllbar ist. Und dabei muss natürlich die Voraussetzung eingehen, dass jedes $\Sigma_n$ erfüllbar ist. Wir müssen also einen Zusammenhang zwischen den endlichen Teilmengen von $\bigcup_{n \geq 0} \Sigma_n$ und den Teilmengen von $\Sigma_n$ herstellen. Schauen wir uns also an, was diese endlichen Teilmengen sind! Sie haben die Form $\{x_1,\dotsc,x_k\}$ mit $x_i \in \bigcup_{n \geq 0} \Sigma_n$, und o.B.d.A. $k \geq 1$. Spätestens jetzt drängt es sich auf, die Definition der Vereinigung zu benutzen. Es gibt also jeweils ein (von $i$ abhängiges) $n_i \geq 0$ mit $x_i \in \Sigma_{n_i}$. Nun haben wir endlich viele natürliche Zahlen, und können ihr Maximum bilden: $n := \max(n_1,\dotsc,n_k)$. Es gilt also $n_i \leq n$ für alle $i$ und daher auch $\Sigma_{n_i} \subseteq \Sigma_n$, also $x_i \in \Sigma_n$. Wir sehen damit, dass jede endliche Teilmenge von $\bigcup_{n \geq 0} \Sigma_n$ bereits in einem der $\Sigma_n$ enthalten ist. Aber $\Sigma_n$ ist nach Annahme erfüllbar, also auch jede Teilmenge davon. Das schließt den Beweis ab. Ich hoffe, ich habe ihn so aufgeschrieben, dass klar wird, dass jeder Schritt erzwungen ist.

Schluss

Natürlich ist es bei weitem nicht immer so, dass sich Beweise wie bei den genannten Beispielen ohne Mühe systematisch hinschreiben lassen. Je weiter man in der Mathematik kommt, desto schwieriger werden die Beweise. Man sammelt außerdem immer mehr Wissen und Methoden an, sodass man ein gutes Auge dafür entwickeln muss, was davon nützlich sein kann. Für manche Beweise muss man wahrlich einen genialen Einfall haben, oder gleich mehrere davon. Dafür braucht es viel Übung. Man hat es dann aber immer noch mit einigen Beweisschritten zu tun, die man systematisch erledigen kann.

\(\endgroup\)
Get link to this article Get link to this article  Printable version Printer-friendly version -  Choose language     Kommentare zeigen Comments  
pdfFür diesen Artikel gibt es keine pdf-Datei


Arbeitsgruppe Alexandria Dieser Artikel ist im Verzeichnis der Arbeitsgruppe Alexandria eingetragen:
: Beweistechnik :: Beweistechniken :: Grundstudium Mathematik :
Wie man einfache Beweise ohne Mühe finden kann [von Triceratops]  
@import url('dl.php?id=2308');Wenn man mit dem Studium der Mathematik beginnt, kommt es einem manchmal so vor, als ob Beweise sehr schwierig zu finden sind und ein hohes Maß an Kreativität und Talent erfordern. Selbst wenn man die Musterlösung sieht,
[Die Arbeitsgruppe Alexandria katalogisiert die Artikel auf dem Matheplaneten]
 


 
 
Aufrufzähler 6580
 
Aufrufstatistik des Artikels
Insgesamt 403 externe Seitenaufrufe zwischen 2017.10 und 2023.03 [Anzeigen]
DomainAnzahlProz
https://google.com4410.9%10.9 %
https://matheplanet.com61.5%1.5 %
https://matheplanet.de20.5%0.5 %
https://google.de26866.5%66.5 %
https://matheplanet.at10.2%0.2 %
https://sso.uni-muenster.de368.9%8.9 %
https://www.startpage.com143.5%3.5 %
https://www.gutefrage.net82%2 %
https://www.reddit.com61.5%1.5 %
https://de.superprof.ch41%1 %
https://out.reddit.com30.7%0.7 %
http://google.de30.7%0.7 %
https://www.ecosia.org20.5%0.5 %
https://de.search.yahoo.com10.2%0.2 %
https://deref-gmx.net10.2%0.2 %
https://webmail.uni-paderborn.de10.2%0.2 %
https://duckduckgo.com10.2%0.2 %
https://google.ch10.2%0.2 %
https://www.bing.com10.2%0.2 %

Aufrufer der letzten 5 Tage im Einzelnen
Insgesamt 7 Aufrufe in den letzten 5 Tagen. [Anzeigen]
DatumAufrufer-URL
2023.03.06-2023.03.25 (7x)https://google.com/

Häufige Aufrufer in früheren Monaten
Insgesamt 360 häufige Aufrufer [Anzeigen]
DatumAufrufer-URL
2020-2023 (203x)https://google.de/
2020-2022 (63x)https://google.de
2020-2022 (37x)https://google.com/
202103-03 (17x)https://sso.uni-muenster.de/
2020-2023 (14x)https://www.startpage.com/
202103-03 (10x)https://sso.uni-muenster.de
202208-10 (4x)https://www.gutefrage.net/frage/hilfe-fuer-mathe-an-der-uni
202203-11 (4x)https://www.reddit.com/
202108-10 (4x)https://de.superprof.ch/
2022-2023 (4x)https://www.gutefrage.net/


[Top of page]



von: am: Do. 01. Januar 1970 01:00:00
\(\begingroup\) \(\endgroup\)
 
"Stern Mathematik: Wie man einfache Beweise ohne Mühe finden kann" | 7 Comments
The authors of the comments are responsible for the content.

Re: Wie man einfache Beweise ohne Mühe finden kann
von: xiao_shi_tou_ am: Sa. 07. Oktober 2017 19:01:37
\(\begingroup\)Schoener Artikel. Ich wuenschte ich koennte schwere Beweise mit Muehe finden.^^ EDIT: Da ist noch etwas das ich nicht unerwaehnt lassen will. Meine Mutter (Mathematiklehrerin am Gymnasium) versucht immer wieder die Schueler fuer ein Mathematikstudium zu motivieren und vorzubereiten. Eine grosse Huerde ist es fuer sie, den Schuelern die Angst vor Beweisen zu nehmen. Dieser Artikel kommt deshalb wie gerufen. Sehr hilfreich. Vielen Dank dafuer. lg Daniel\(\endgroup\)
 

Re: Wie man einfache Beweise ohne Mühe finden kann
von: salomeMe am: So. 08. Oktober 2017 22:46:51
\(\begingroup\)Hallo Triceratops, habe gerade begonnen Deinen bestimmt sehr hilfreichen Artikel zu lesen. Dabei bin ich an der Formulierung der zweiten zu beweisenden Aufgabe etwas hängengeblieben, weil ich statt eines Pfeils eigentlich ein + erwartet hätte - $lim_{n\to\infty}(a_n \to b_n)$ . Beste Grüße salomeMe\(\endgroup\)
 

Re: Wie man einfache Beweise ohne Mühe finden kann
von: Kezer am: Di. 10. Oktober 2017 21:56:25
\(\begingroup\)Bravo! Ich habe zwar erst einige der Motivationen gelesen, aber besser hätte man es nicht sagen können - leichtere Beweise folgen fast schon unmittelbar, wenn man Definitionen sinnvoll benutzt. Das ist Mathematik! Aufgeschriebene Beweise fallen zwar oft vom Himmel, aber man sollte sich dann überlegen, woher die einzelnen Schritte fallen! Wenn man nur die Argumentation versteht, aber überhaupt nicht sieht, wo es herkommt, sollte man sich die Argumentation nochmal genauer angucken. Ein Problem des Artikels könnte sein, dass es sich an neue Mathestudenten richtet, aber diese zu Beginn des Studiums noch nicht mit Begriffen der linearen Algebra, etc. vertraut sind und somit die meisten Beispiele nicht verstehen können. Aber sicher wäre es ein hilfreicher Text vor der 1. Klausur 😄 EDIT: Ich hab gerade gemerkt, dass ich es hier auch mal anführen könnte: In diesem Artikel versuche ich auch dem Leser zu zeigen, wie man einen Beweis findet.\(\endgroup\)
 

Re: Wie man einfache Beweise ohne Mühe finden kann
von: Triceratops am: Fr. 17. November 2017 16:11:44
\(\begingroup\)[Beispiel 11 wurde im Artikel ergänzt]\(\endgroup\)
 

Re: Wie man einfache Beweise ohne Mühe finden kann
von: Diophant am: Sa. 02. März 2019 23:08:02
\(\begingroup\)Ein wunderschöner Artikel eines sehr kreativen Autors. Deshalb ist ihm vielleicht aus Bescheidenheit entgangen, wie viel Kreativität in seinen strategischen Tipps steckt. 😉 Gruß, Diophant\(\endgroup\)
 

Re: Wie man einfache Beweise ohne Mühe finden kann
von: Triceratops am: Mo. 21. Oktober 2019 08:23:24
\(\begingroup\)[Beispiel 12 wurde im Artikel ergänzt]\(\endgroup\)
 

Re: Wie man einfache Beweise ohne Mühe finden kann
von: easymathematics am: Sa. 30. Januar 2021 00:39:50
\(\begingroup\)Sehr schöner Artikel. Gerade bei, ich sage mal, Vererbungen von Eigenschaften, laufen die Beweise stets analog ab. Solche Übungen sind sinnvoll, da sie ein, ich sage mal, zielstrebiges Auseinandersetzen mit elementaren Begriffen erzwingen.\(\endgroup\)
 

 
All logos and trademarks in this site are property of their respective owner. The comments are property of their posters, all the rest © 2001-2023 by Matroids Matheplanet
This web site was originally made with PHP-Nuke, a former web portal system written in PHP that seems no longer to be maintained nor supported. PHP-Nuke is Free Software released under the GNU/GPL license.
Ich distanziere mich von rechtswidrigen oder anstößigen Inhalten, die sich trotz aufmerksamer Prüfung hinter hier verwendeten Links verbergen mögen.
Lesen Sie die Nutzungsbedingungen, die Distanzierung, die Datenschutzerklärung und das Impressum.
[Seitenanfang]