Funktionalanalysis

3. Auflage

Vorrede

Die Funktionalanalysis liefert ein mächtiges Hilfsmittel sowohl zum abstrakten Beschreiben, als auch zum Lösen einer Vielzahl von Problemstellungen der angewandten Mathematik. Ziel der Vorlesung soll neben einer Einführung in die grundlegenden Konzepte wie Banach- und Hilberträume, Algebren beschränkter Operatoren und dualer Räume die Behandlung abstrakter Operatorgleichungen und die Anwendung der Resultate auf Integralgleichungen zweiter Art sein.

Abschluß der Vorlesung bildet eine Einführung in die Spektraltheorie beschränkter Operatoren auf Banach- und Hilberträumen, die Grundlage für weitere Betrachtungen sein kann und sollte.

Weitere Anwendungen und Bezüge zur Behandlung partieller Differentialgleichungen oder singulärer Integralgleichungen können nur am Rande erwähnt werden, für Aspekte nichtlinearer Funktionalanalysis sei auf weiterführende Vorlesungen verwiesen.

Der Autor bedankt sich bei allen die geholfen haben, das Skript korrekturzulesen und zu verbessern. Besonderer Dank gebührt dabei Jonas Hetz.

(Weiterführende) Literatur

D. Werner, Funktionalanalysis
Springer-Verlag Berlin Heidelberg 2002

H. Heuser, Funktionalanalysis
B.G.Teubner, Stuttgart 1992

M. Dobrowolski, Angewandte Funktionalanalysis
Springer-Verlag Berlin-Heidelberg 2006

F. Hirzebruch, W. Scharlau, Einführung in die Funktionalanalysis
Spektrum 1996

K. Yosida, Functional Analysis
Springer-Verlag New York 1980

W. Rudin, Real and Complex Analysis
McGraw-Hill 1970

Sh. Kantorovitz, Introduction to Modern Analysis
Oxford University Press 2006

F. Riesz, B. Sz.-Nagy, Functional Analysis
Frederick Ungar Publishing Co. New York 1955 (Reprint: Dover 1990)

M. Reed, B. Simon, Methods of Mathematical Physics I (Functional Analysis)
Academic Press 1981

R. Kress, Linear Integral Equations
Springer-Verlag Berlin Heidelberg 1989

R.G. Douglas, Banach Algebra Techniques in Operator Theory
Springer-Verlag New York 1998

J. Lindenstrauss, L. Tzafriri, Classical Banach Spaces I and II
Springer-Verlag New York 1996

I. Gohberg, M. Krein, Introduction to the Theory of Linear Nonselfadjoint Operators in a Hilbert Space
American Mathematical Society, 1969

Notation

Im folgenden bezeichne

\(\mathbb N = \{0,1,...\}\) die Menge der natürlichen Zahlen (mit Null);

\(\mathbb Z\), \(\mathbb Q\), \(\mathbb R\), \(\mathbb C\) die Mengen der ganzen, rationalen, reellen und komplexen Zahlen;

\(\aleph_0\) die Kardinalität der natürlichen Zahlen; und \(\aleph_1\) die Kardinalität von \(\mathbb R\);1

\(\overline{\mathbb R} = \mathbb R\cup \{\pm\infty\}\) die (ordnungserhaltende) Kompaktifizierung von \(\mathbb R\);

\(\widehat{\mathbb C} = \mathbb C\cup \{\infty\}\) die Kompaktifizierung von \(\mathbb C\) (Riemannsche Zahlenkugel);

\(\mathrm i\) die imaginäre Einheit, \(\mathrm e\) die eulersche Konstante, \(\log\) den natürlichen Logarithmus;

\(\mathbb K\) einen der Körper \(\mathbb R\) oder \(\mathbb C\);

\(\mathbb K^{m\times n}\) den Vektorraum der \(m\times n\)-Matrizen über \(\mathbb K\);

\(\mathop{\mathrm{span}}U\) bzw. \(\mathop{\mathrm{span}}_\mathbb KU\) die lineare Hülle von \(U\subseteq V\) für einen \(\mathbb K\)-Vektorraum \(V\);

\(\mathop{\mathrm{conv}}U\) die konvexe Hülle von \(U\) in \(V\);

\(\overline{\mathop{\mathrm{span}}} \;U\) und \(\overline{\mathop{\mathrm{conv}}} \;U\) die abgeschlossene lineare/konvexe Hülle einer Menge \(U\subseteq V\);

\(\boldsymbol{|}X\boldsymbol{|}\) das Lebesguemaß einer lebesguemeßbaren Teilmenge \(X\subseteq \mathbb R^n\)
(oder \(X\subseteq \mathbb C^n\equiv\mathbb R^{2n}\));

\(\int f(x) \,\mathrm dx\) das Lebesgueintegral einer lebesguemeßbaren Funktion \(f:\mathbb R^n\to\mathbb C\);

\(\int\limits_{\to-\infty}^{\to\infty} f(x)\,\mathrm dx\) das uneigentliche Riemann(-Lebesgue-)integral von \(f:\mathbb R\to \mathbb C\);

\(\|x\|\) Norm eines Elements in einem normierten Raum;

\({\pmb(x,y\pmb)}\) Skalarprodukt zweier Elemente eines Innenproduktraumes;

\(\langle \phi,x\rangle\) Anwendung der Linearform \(\phi\) auf das Element \(x\).

1 Grundkonzepte: Räume und Algebren

Alles ist Raum.

1.1 Normierte Räume und Banachräume

Normen

Ein erster Schritt in die Funktionalanalysis besteht darin, Strukturen der linearen Algebra mit denen der Topologie, also mit Konvergenzbegriffen und Vorstellungen von Nähe und Umgebung, zu verbinden.

Wir beginnen damit, Vektorräume mit einer Norm zu versehen, die anschaulich gesprochen, den Abstand zum Nullvektor mißt. Sei im folgenden \(\mathbb K\) einer der Körper \(\mathbb R\) oder \(\mathbb C\).

Definition 1.1. Ein normierter Raum über \(\mathbb K\) ist ein Paar \((V,\|\cdot\|)\) bestehend aus einem \(\mathbb K\)-Vektorraum \(V\) und einer Normfunktion \(\|\cdot\|:V\to\mathbb R\), welche die folgenden Bedingungen erfüllt:

  1. Es gilt \(\|x\|\geq0\) für alle \(x\in V\).

  2. Es gilt \(\|x\|=0\) genau dann, wenn \(x=0\) gilt.

  3. Für alle \(\lambda\in\mathbb K\) und alle \(x\in V\) gilt \(\|\lambda x\|=|\lambda|\;\|x\|\).

  4. Für \(x,y\in V\) gilt die Dreiecksungleichung \(\|x+y\|\leq\|x\|+\|y\|\).

Es gibt viele Möglichkeiten einen gegebenen Vektorraum mit einer Norm zu versehen.

Beispiel 1.2. Auf dem Vektorraum \(\mathbb R^n\) betrachten wir die \(p\)-Normen, die für Vektoren \(x=(x_1,\ldots,x_n)\in\mathbb R^n\) durch \[\|x\|_p:={\left(\sum_{i=1}^n {|x_i|}^p\right)}^{1/p},\qquad p\in[1,\infty)\] und \[\|x\|_\infty:=\max_{i=1,\ldots n}|x_i|\] definiert sind. Es gilt für alle \(p\in[1,\infty]\) und alle \(x\in\mathbb R^n\) \[\|x\|_\infty\leq \|x\|_p\leq \|x\|_1 \leq n\,\|x\|_\infty.\]

Proposition 1.3. Jeder normierte Raum \((V,\|\cdot\|)\) ist durch Einführen der zugeordneten Metrik \[\mathop{\mathrm{dist}}(x,y)=\|x-y\|=\mathop{\mathrm{dist}}(x-y,0)\] ein metrischer Raum.

Insbesondere übertragen sich damit alle für metrische Räume eingeführten Begriffe und gezeigten Sätze unmittelbar auf normierte Räume. So heißt eine Teilmenge \(U\) eines normierten Raumes \(V\)

Abbildungen zwischen normierten Räumen heißen , falls Urbilder offener Mengen offen sind. Wir wollen das hier nicht weiter im Detail ausführen, werden aber gelegentlich auf diese von der metrischen Struktur abgeleiteten Begriffe zurückkommen.

Definition 1.4. Zwei verschiedene Normen \(\|\cdot\|_A\) und \(\|\cdot\|_B\) auf \(V\) heißen äquivalent, falls es eine Konstante \(C>0\) gibt, so daß für alle \(x\in V\) \[C^{-1} \|x\|_A\leq\|x\|_B\leq C\|x\|_A.\]

Satz 1.5. Sei \(V\) endlichdimensional. Dann sind auf \(V\) alle Normen äquivalent.

Proof. Sei \(\dim V=n\) und \(\{e_1,\ldots, e_n\}\) eine Basis von \(V\). Wir zeigen, daß jede Norm \(\|\cdot\|\) zur \(1\)-Norm oder Summennorm \[\left\|\sum_{k=1}^n \alpha_k e_k\right\|_1=\sum_{k=1}^n|\alpha_k|\] äquivalent ist. Aus der Dreiecksungleichung folgt zunächst \[\|x\|= \left\|\sum_{k=1}^n \alpha_k e_k\right\| \leq \sum_{k=1}^n |\alpha_k| \| e_k\|\leq C_2 \|x\|_1\] mit \(C_2=\max\| e_k\|\). Betrachtet man umgekehrt die Abbildung \[N : V\ni x\mapsto\|x\|\in\mathbb R,\] so ist diese wegen \(|N(x)-N(y)|=|\,\|x\|-\|y\|\,|\leq\|x-y\|\leq C_2\|x-y\|_1\) stetig auf \((V,\|\cdot\|_1)\). Die Einheitssphäre \[S:=\{x\in V\;|\;\|x\|_1=1\}\] ist als Urbild von \(\{1\}\) unter \(x\mapsto\|x\|_1\) abgeschlossen und (wegen der kanonischen Identifikation von \((V,\|\cdot\|_1)\) mit \((\mathbb K^n,\|\cdot\|_1)\)) kompakt. Nach dem Satz von Weierstraß ist also \(N\) auf \(S\) nach (oben und) unten beschränkt. Da die Extremwerte angenommen werden, existiert ein \(C_1>0\) mit \[\|x\|=\|x\|_1\;\left\|\frac x{\|x\|_1}\right\|\geq\|x\|_1\,C_1.\] Damit ist die Äquivalenz gezeigt. ◻

Im folgenden sollen im wesentlichen nur noch unendlichdimensionale Vektorräume betrachtet werden, die endlichdimensionalen sind durch den vorhergehenden Satz auf die euklidischen Räume \((\mathbb R^n,\|\cdot\|_2)\) beziehungsweise die unitären Räume \((\mathbb C^n,\|\cdot\|_2)\) zurückgeführt und damit (im Sinne dieser Vorlesung) trivial.

Beispiele 1.6. Es sei \(\mathfrak c_0\) die Menge der komplexen Nullfolgen \((z_n)\). Bezeichnet man nun zur Nullfolge \((z_n)\) ihr Supremum mit \(\|(z_n)\|:=\sup_n |z_n|\), so wird damit \(\mathfrak c_0\) zu einem normierten Raum. Mit derselben Definition kann man auch die Menge \(\mathfrak c\) der konvergenten Folgen und die Menge \(\ell^\infty\) der beschränkten Folgen zu einem normierten Raum machen. Man weise die Normeigenschaften nach.

Beispiel 1.7. Sei \(X\) ein kompakter metrischer Raum und sei weiter \(\mathrm C(X)\) der Vektorraum der stetigen komplexwertigen Funktionen auf \(X\). Dann wird \(\mathrm C(X)\) durch die Supremumsnorm \(\|f\|:=\sup_{x\in X}|f(x)|\) zu einem normierten Raum.

Beispiel 1.8. Sei \(\mathbb D=\{\zeta\in\mathbb C: |\zeta|<1\}\) die offene Einheitskreisscheibe in \(\mathbb C\) und bezeichne \(\mathfrak A(\mathbb D)\) den Vektorraum der auf \(\mathbb D\) analytischen Funktionen. Dieser wird für jedes \(\gamma\in(0,1)\) durch die Norm \(\|f\|_{(\gamma)} = \sup_{|\zeta|=\gamma} |f(\zeta)|\) zu einem normierten Raum. Man weise wiederum die Normeigenschaften nach und zeige, daß die so definierten Normen nicht äquivalent sind.

Konvergenz

Da jeder normierte Raum ein metrischer Raum ist, übertragen sich Begriffe wie Konvergenz und Stetigkeit. Sei also im Raum \((V,\|\cdot\|)\) eine Folge \(x_n\in V\) gegeben. Die Folge konvergiert gegen \(x\in V\), falls die Folge der Normen \(\|x_n-x\|\) eine Nullfolge bildet. Wir schreiben dafür kurz \(x_n\to x\) für \(n\to\infty\). Elementare Eigenschaften konvergenter Folgen übertragen sich unmittelbar von reellen Zahlenfolgen auf Folgen in normierten Räumen.

Proposition 1.9.

  1. \(x_n\to x\) impliziert \(\|x_n\|\to\|x\|\) und \(\sup_n \|x_n\|<\infty\).

  2. \(x_n\to x\) und \(y_n\to y\) impliziert \(x_n+y_n\to x+y\).

  3. \(x_n\to x\) und \(\alpha_n\to\alpha\) für \(\alpha_n,\alpha\in\mathbb K\) impliziert \(\alpha_nx_n\to\alpha x\).

Der Beweis verbleibt als Übungsaufgabe.

Vollständigkeit

Unmittelbar aus der Dreiecksungleichung für Normen ergibt sich, daß jede konvergente Folge in \(V\) eine Cauchyfolge2 ist, d.h. \[\forall\varepsilon>0:\exists N\in\mathbb N:\forall m,n>N:\quad \|x_m-x_n\|\leq \varepsilon.\] Die Umkehrung dieser Aussage gilt nur in vollständigen metrischen Räumen. Angewandt auf normierte Räume legt das folgende Definition nahe.

Definition 1.10. Ein normierter Raum heißt Banachraum3, falls er (als metrischer Raum) vollständig ist.

Analog zur Konstruktion von \(\mathbb R\) aus \(\mathbb Q\), kann man jeden normierten Raum durch Hinzunehmen von Elementen vervollständigen. Dies soll als nächstes gezeigt werden.

Satz 1.11. Jeder normierte Raum läßt sich auf eindeutige Weise zu einem Banachraum vervollständigen.

Proof. Der Beweis ergibt sich ähnlich dem für metrische Räume. Bezeichne \(V\) den normierten Raum und \(\mathcal C(V)\) die Menge der Cauchyfolgen aus Elementen von \(V\). Zwei Cauchyfolgen \((x_n)\) und \((y_n)\) wollen wir als äquivalent bezeichnen, \((x_n)\sim(y_n)\), falls die Differenz \((x_n-y_n)\) eine Nullfolge bildet. Ist die Folge \((x_n)\) in \(V\) konvergent, so damit auch \((y_n)\) und wir können die Elemente von \(V\) mit den konvergenten Folgen aus \(\mathcal C(V)/_\sim\) identifizieren. Dies liefert eine Einbettung \[V\hookrightarrow \mathcal C(V)/_\sim.\] Als nächsten Schritt wollen wir auf \(\mathcal C(V)/_\sim\) eine Norm definieren, welche die aus \(V\) fortsetzt. Dazu setzen wir für \((x_n)\in\mathcal C(V)\) \[\|(x_n)\|:=\lim_{n\to\infty} \|x_n\|\] die Existenz des Grenzwertes folgt aus der umgekehrten Dreiecksungleichung zusammen mit der Cauchyfolgeneigenschaft.

Diese Norm ist auf Äquivalenzklassen konstant und stimmt für konvergente Folgen mit der Norm in \(V\) überein (insbesondere ist \(V\) in \(\mathcal C(V)/_\sim\) eingebettet). Als letzten Schritt zeigen wir, daß \(\mathcal C(V)/_\sim\) versehen mit dieser Norm ein Banachraum ist. Sei dazu \((x_m)_n=(x_{m,n})\) eine Cauchyfolge aus \(\mathcal C(V)/_\sim\). Wir konstruieren eine mögliche Grenzfolge. Für jedes \(n\) sei \(m_n\) so groß gewählt, daß \[\|x_{m,n}-x_{m_n,n}\|\leq n^{-1},\qquad\qquad m>m_n.\] Betrachtet man jetzt die Diagonalfolge \((x_{m_n,n})\) so gilt \[\|(x_m)_n-x_{m_n,n}\|=\lim_{m\to\infty} \|x_{m,n}-x_{m_n,n}\|\leq n^{-1}\to0\] (wobei wir \(V\) mit seinem Bild in \(\mathcal C(V)\) identifiziert haben) und damit \[\begin{split} \|x_{m_n,n}-x_{m_k,k}\|&\leq\| x_{m_n,n}-(x_m)_n \| + \| (x_m)_n-(x_m)_k \| + \|(x_m)_k-x_{m_k,k}\| \\ &\leq n^{-1}+\| (x_m)_n-(x_m)_k \| + k^{-1}, \end{split}\] wobei der zweite Summand wegen der Cauchyfolgenbedingung in \(\mathcal C(V)/_\sim\) beliebig klein wird. Also ist die Diagonalfolge \((x_{{m_n},n})\) Cauchyfolge. Weiter gilt \[\begin{split} \| (x_{{m_k},k}) - (x_k)_n \| &\le \| (x_{{m_k},k}) - x_{{m_n},n} \| + \| x_{{m_n},n} - (x_k)_n \| \\& \le \| (x_{{m_k},k}) - x_{{m_n},n} \| + n^{-1}\\ &\le \lim_{k\to\infty} \| x_{{m_k},k} - x_{{m_n},n} \| + n^{-1} \\&\le \lim_{k\to\infty} \| (x_m)_k - (x_m)_n \| + 2 n^{-1} \end{split}\] Und damit konvergiert \((x_m)_n\) in \(\mathcal C(V)/_\sim\) gegen \((x_{{m_n},n})\). Damit haben wir eine Grenzfolge konstruiert und der Existenzbeweis ist beendet.

Für die Eindeutigkeit betrachten wir die Einbettung eines normierten Raumes \(V\) in eine seiner Vervollständigungen \(W\). Insbesondere ist \(V\) dicht in \(W\). Wendet man nun auf \(V\) den obigen Prozeß an und konstruiert \(\mathcal C(V)/_\sim\), so kann man \(\mathcal C(V)/_\sim\) in \(\mathcal C(W)/_\sim=W\) einbetten. Da \(\mathcal C(V)/_\sim\) vollständig ist, ist er in \(\mathcal C(W)/_\sim=W\) abgeschlossen. Dichtheit liefert Gleichheit beider Räume. ◻

Beispiele 1.12. Beispiele zu Banach-Räumen zu formulieren bedeutet in der Regel schwerwiegende mathematische Sätze zu zitieren. Einfachste Beispiele sind alle endlichdimensionalen Räume. Daneben haben wir bereits die Folgenräume

  1. \(\mathfrak c_0\) versehen mit der Maximumnorm,

  2. \(\mathfrak c\) versehen mit der Supremumsnorm,

  3. \(\ell^\infty\) versehen mit der Supremumsnorm,

kennengelernt, deren Vollständigkeit als Übungsaufgabe gezeigt werden kann. Weitere Folgenräume ergeben sich als Beispiele der lebesgueschen Integrationstheorie

  1. \(\ell^p:=\{\;(z_n)\;|\; \sum_{n} |z_n|^p<\infty\;\}\) versehen mit der \(p\)-Norm, welcher als \(L^p(\mathbb N,\#)\), \(\mathbb N\) versehen mit dem Zählmaß \(\#\), verstanden werden kann.

Beispiel 1.13. Der oben erwähnte Raum der stetigen Funktionen \(\mathrm C(X)\) auf einem kompakten metrischen Raum \(X\) ist vollständig. Konvergenz in der Supremumsnorm entspricht gleichmäßiger Konvergenz.

Beispiel 1.14. Das oben ebenso erwähnte Beispiel eines Raumes analytischer Funktionen auf der Einheitskreisscheibe \(\mathbb D\) ist nicht vollständig. Jede Potenzreihe mit Konvergenzradius \(>1/2\) konvergiert in der Norm \(\|\cdot\|_{(1/2)}\), die Grenzfunktion liegt also nicht unbedingt in \(\mathfrak A(\mathbb D)\).

Beispiel 1.15. Eine wichtige Klasse von Banachräumen sind die Lebesgueräume4 \({\mathrm{L}}^p(\mathbb R^n)\) versehen mit der \({\mathrm{L}}^p\)-Norm \[\|f\|_p:=\left(\int |f(x)|^p\mathrm d x\right)^{1/p},\qquad \|f\|_\infty=\mathop{\mathrm{ess\,sup}}_x |f(x)|.\] Sie sind ein Spezialfall der allgemeinen Lebesgueräume \({\mathrm{L}}^p(X,\Omega,\mu)\), \(\Omega\) eine \(\sigma\)-Algebra auf \(X\) und \(\mu:\Omega\to\mathbb R\) ein Maß.

Beispiel 1.16. Ein letztes Beispiel soll die Konstruktion eines neuen Raumes aus zwei normierten Räumen sein, der Produktraum. Seien dazu \((V_1,\|\cdot\|_1)\) und \((V_2,\|\cdot\|_2)\) normierte Räume. Dann definiert \[\|(x,y)\|_{1\times 2}:=\|x\|_1+\|y\|_2\] auf dem Vektorraum der geordneten Paare, \(V_1\times V_2\), eine Norm. Der Produktraum ist ein Banachraum, wenn beide Faktoren welche sind. Neben der oben angegebenen Norm kann man auf dem Produktraum auch die (dazu äquivalenten) Normen \[\begin{aligned} \left( \|x\|_1^p+\|y\|_2^p\right)^{1/p},\qquad\text{oder}\qquad \max( \|x\|_1,\|y\|_2)\end{aligned}\] verwenden. Das Beispiel überträgt sich unmittelbar auf alle endlichen Produkte.

In Banachräumen gelten alle Sätze, die man als Folgerung des Cauchykriteriums für Folgen erhält. Insbesondere ergeben sich wichtige Konvergenzkriterien für Reihen.

Satz 1.17 (Majorantenkriterium). Sei \((x_n)_{n\in\mathbb N}\) eine Folge in einem Banachraum \(V\) mit \(\|x_n\|\leq\alpha_n\). Gilt dann \(\sum_n\alpha_n<\infty\), so konvergiert die Reihe \[\sum_{n=0}^\infty x_n\] unbedingt in \(V\), das heißt es existiert ein \(x\in V\) und die Reihe sowie jede ihrer Umordnungen sind konvergent und streben gegen den Grenzwert \(x\).

Proof. Wir zeigen zuerst die Konvergenz. Sei \(s_n = \sum_{k=0}^n x_k\) die \(n\)-te Partialsumme der Reihe. Dann gilt für alle \(n\le m\) \[\| s_m - s_n \| = \left\| \sum_{k=n+1}^m x_k \right\| \le \sum_{k=n+1}^m \| x_k\| \le \sum_{k=n+1}^m \alpha_k.\] Da \(\sum_k \alpha_k\) konvergiert, existiert also zu jedem \(\varepsilon>0\) ein \(N_\varepsilon\), so daß für alle \(m,n > N_\varepsilon\) der letzte Ausdruck kleiner \(\varepsilon\) ist. Damit ist aber die Folge \((s_n)_{n\in\mathbb N}\) Cauchy-Folge und somit im Banachraum \(V\) konvergent. Also konvergiert die Reihe.

Sei nun \(\pi : \mathbb N\to\mathbb N\) eine beliebige Permutation der natürlichen Zahlen. Sei weiter \(\tilde s_n\) die \(n\)-te Partialsumme der umgeordneten Reihe \(\tilde s_n = \sum_{k=0}^n x_{\pi(k)}\). Betrachtet man nun die Differenz \(s_n-\tilde s_n\), so gilt \[\| s_n -\tilde s_n \| \le \sum_{k\in \{0..n\}\setminus \pi(\{0..n\})} \|x_k\| + \sum_{k\in \pi(\{0..n\})\setminus \{0..n\}} \|x_{k}\| \le \sum_{k>n} \alpha_{\pi(k)} + \sum_{k>n} \alpha_k\] und da sowohl die Reihe \(\sum{\alpha_k}\) als auch die Reihe \(\sum\alpha_{\pi(k)}\) konvergieren existiert zu jedem \(\varepsilon>0\) ein \(N_\varepsilon\), so daß für \(n>N_\varepsilon\) beide Reihenreste kleiner \(\varepsilon/2\) sind. Also haben Reihe und Umordnung denselben Grenzwert in \(V\) und der Satz ist bewiesen. ◻

Es gilt auch eine Umkehrung der gerade gezeigten Aussage. Diese liefert ein einfaches (aber nützliches) Kriterium zur Vollständigkeit eines normierten Raumes. Es gilt

Proposition 1.18. Sei \(V\) normierter Raum. Angenommen für jede Folge \((x_n)_{n\in\mathbb N}\) mit \(\sum_{n=0}^\infty \|x_n\|<\infty\) existiert ein \(x\in V\) mit \(x=\sum_{n=0}^\infty x_n\). Dann ist \(V\) Banachraum.

Der Beweis verbleibt als Übungsaufgabe.

1.2 Beschränkte Operatoren und Banachalgebren

Lineare Abbildungen und Stetigkeit

Seien \((V_1,\|\cdot\|_1)\) und \((V_2,\|\cdot\|_2)\) normierte Räume. Um (uninteressante) Sonderfälle auszuschließen sei auch \(V_1\ne\{0\}\). Wir wollen zuerst der Frage nachgehen, wann eine lineare Abbildung \(A:V_1\to V_2\) bezüglich der durch die Normen induzierten Topologie stetig ist.

Satz 1.19. Für eine lineare Abbildung \(A:V_1\to V_2\) sind äquivalent:

  1. \(A\) ist stetig.

  2. \(A\) ist an der Stelle \(0\in V_1\) stetig.

  3. Für \(A\) ist der Quotient \(\|Ax\|_2/\|x\|_1\) auf \(V_1\setminus\{0\}\) beschränkt.

  4. \(A\) ist beschränkt, das heißt \(A\) bildet beschränkte Teilmengen auf beschränkte Teilmengen ab.

Proof. (1)\(\Rightarrow\)(2) ist klar. \(\bullet\qquad\) (2)\(\Rightarrow\)(3) Angenommen (3) gilt nicht. Dann existiert eine Folge \(x_n\), so daß \(\|Ax_n\|_2\geq n^2\|x_n\|_1\) gilt. Betrachtet man nun die Nullfolge \(y_n=x_n/n\|x_n\|_1\), so folgt \(\|Ay_n\|_2\geq n\), \(A\) ist also in \(0\) nicht stetig. \(\bullet\qquad\) (3)\(\Rightarrow\)(4) Sei \(C=\sup_{x\ne0} \|Ax\|_2/\|x\|_1\) und \(M\subseteq V_1\) eine beschränkte Menge. Dann gibt es ein \(R>0\), so daß \[M\subseteq B_R:=\{x\in V_1\;|\;\|x\|_1\leq R\}.\] Weiter folgt, daß \(A(B_R)\subseteq B_{CR}\) gilt, also \(A(M)\subseteq B_{CR}\) beschränkt ist. \(\bullet\qquad\) (4)\(\Rightarrow\)(3) Anwendung auf die Einheitskugel in \(V_1\). \(\bullet\qquad\) (3)\(\Rightarrow\)(1) Sei \(x_n\to x\) eine konvergente Folge in \(V_1\). Dann gilt mit \(C=\sup_{x\ne0} \|Ax\|_2/\|x\|_1\) \[\|Ax_n-Ax\|_2=\|A(x_n-x)\|_2\leq C\|x_n-x\|_1.\] ◻

Definition 1.20. Sei \(A:V_1\to V_2\) beschränkt. Dann bezeichnet \[\|A\|:=\sup_{x\neq0}\frac{\|Ax\|_2}{\|x\|_1}=\sup_{\|x\|_1=1} \|Ax\|_2\] die Operatornorm von \(A\). Die Menge der beschränkten linearen Abbildungen \(\mathcal L(V_1,V_2)\) wird damit zu einem normierten Raum, dem Raum der beschränkten Operatoren.

Proposition 1.21.

  1. \(\|A\|=0\) impliziert \(A=0\).

  2. \(\|\alpha A\|=|\alpha|\,\|A\|\)

  3. \(\|A+B\|\leq\|A\|+\|B\|\)

Satz 1.22. Sei \(V_2\) ein Banachraum. Dann ist auch \(\mathcal L(V_1,V_2)\) ein Banachraum.

Proof. Sei \(A_k\) eine Cauchyfolge aus \(\mathcal L(V_1,V_2)\). Dann ist wegen \[\|A_kx-A_lx\|\leq\|A_k-A_l\|\,\|x\|\] \((A_kx)\) für jedes \(x\in V_1\) eine Cauchyfolge aus \(V_2\). Sei ihr Grenzwert mit \(Ax\) bezeichnet. Dann ist \(A\) offenbar linear und wegen \[\|Ax\|=\lim_{k\to\infty}\|A_k x\|\le \|x\|\lim_{k\to\infty}\|A_k\|<\infty\] beschränkt. Insbesondere gilt \(\|A_kx-Ax\|=\lim_{l\to\infty} \|A_kx-A_lx\| \le \varepsilon\|x\|\), \(k > {N}(\varepsilon)\) und damit auch \(\| A -A_k\|\to 0\). ◻

Beispiele

Beispiel 1.23. Sind \(V_1\) und \(V_2\) beide endlichdimensional, so kann man den Raum der beschränkten Operatoren mit dem Vektorraum der Matrizen identifizieren, insbesondere gilt \(\mathcal L(\mathbb K^n,\mathbb K^m)=\mathbb K^{m\times n}\).

Beispiel 1.24. Beschränkte Operatoren zwischen Folgenräumen lassen sich als unendliche Matrizen verstehen. Wir betrachten einen einfachen Fall. Sei dazu \(A:\ell^1\to\ell^1\) beschränkt. Sei weiter \({\mathbf e}_m\) die Folge \((0,0,\ldots,1,0,\ldots)\), die nur an der \(m\)-ten Stelle den Eintrag \(1\) besitzt. Bezeichnet man \(A{\mathbf e}_m=(\alpha_{n})_m=(\alpha_{n,m})\). Dann kann man die Anwendung des Operators \(A\) als Matrix-Vektor-Multiplikation verstehen \[(y_n)=A(x_m) = A \sum_m x_m {\mathbf e}_m = \sum_m x_m (\alpha_n)_m, \qquad\text{also}\qquad y_n=\sum_m \alpha_{n,m} x_m.\] Die auftretenden Reihen konvergieren. Es stellt sich die Frage nach Bedingungen an die Koeffizienten \(\alpha_{m,n}\), so daß der entstehende Operator beschränkt ist. Hinreichende Bedingungen sind einfach zu formulieren, da sie nur auf die Anwendung der Dreiecksungleichung hinauslaufen. So ist wegen \[\|(y_n)\|_1=\sum_n |y_n| = \sum_n\left| \sum_m \alpha_{n,m} x_m\right| \leq \left(\sum_n \max_m |\alpha_{n,m}| \right)\sum_m|x_m|=C \|(x_m)\|_1\] der Operator \(A\) beschränkt, falls \[C=\sum_n \max_m |\alpha_{n,m}|<\infty\] gilt. An dieser Stelle müssen wir offenlassen, ob die Umkehrung dieser Aussage richtig ist.

Beispiel 1.25. Seien \(X,Y\subseteq\mathbb R^n\) der Abschluß beschränkter Gebiete und \(k\in \mathrm C(X\times Y)\) eine auf dem Produkt definierte stetige Funktion. Dann kann man vermittels \(k\) durch das Integral \[Kf(y)=\int_X k(x,y)f(x)\mathrm dx\] einen Operator \(K:\mathrm C(X)\to \mathrm C(Y)\) definieren. Dieser ist beschränkt, da \[\|Kf\|=\sup_{y\in Y} \left|\int_X k(x,y)f(x) \mathrm dx\right|\leq \boldsymbol{|}X\boldsymbol{|}\;\|k\|\;\|f\|\] gilt. Insbesondere ist auch die Zuordnung \[\mathrm C(X\times Y)\ni k\mapsto K\in\mathcal L(\mathrm C(X),\mathrm C(Y))\] selbst ein beschränkter Operator. Man bezeichnet \(K\) als den Integraloperator mit stetiger Kernfunktion \(k(x,y)\).

Beispiel 1.26. Sei für \(1\le p< \infty\) der Hardyraum5 \[\mathcal H^p(\mathbb D) = \{ f\in\mathfrak A(\mathbb D) \;|\; \sup_{0<r<1} \int_0^{2\pi} |f(r{\mathrm e}^{\mathrm i\theta})|^p\,\mathrm d\theta < \infty \}\] definiert. Dieser ist ein Banachraum (Übung!) mit der Eigenschaft, daß die für jedes \(z\in\mathbb D\) und jedes \(k\in\mathbb N\) die Auswertung \[\mathcal H^p(\mathbb D) \ni f \mapsto f^{(k)}(z) = \frac{k!}{2\pi\mathrm i} \oint \frac{f(\zeta)}{(\zeta-z)^{k+1}}\,\mathrm d\zeta \in \mathbb C\] der \(k\)-ten Ableitung an der Stelle \(\zeta\) stetig ist. Dies folgt direkt aus der Hölderungleichung angewandt auf die Cauchysche Integralformel.

Produktstruktur. Ist \(A\in\mathcal L(V_1,V_2)\) und \(B\in\mathcal L(V_2,V_3)\), so kann man die Verkettung \(BA\) betrachten. Für die Operatornorm von \(BA\) erhält man wegen \[\|BAx\|\leq \|B\|\,\|Ax\|\leq \|B\|\,\|A\|\,\|x\|\] die Abschätzung der Submultiplikativität der Operatornorm \[\|BA\|\leq\|B\|\,\|A\|.\]

Definition 1.27. Eine lineare Abbildung \(A\in\mathcal L(V_1,V_2)\) heißt ein Isomorphismus der normierten Räume \(V_1\) und \(V_2\), falls \(A\) (stetig) invertierbar ist, das heißt falls ein \(B\in\mathcal L(V_2,V_1)\) mit \(AB=I\) und \(BA=I\) existiert. Ein Isomorphismus \(A\) heißt isometrisch, falls er die Norm erhält, \[\|Ax\|_2=\|x\|_1,\qquad \forall x\in V_1.\]

Von spezieller Bedeutung sind die beschränkten Operatoren eines normierten Raumes in sich, das heißt die Menge \(\mathcal L(V):=\mathcal L(V,V)\). Neben der Vektorraumstruktur ist auf dieser Menge auch die Verkettung von Operatoren definiert, die man als Multiplikation in einer Algebra auffassen kann. Die invertierbaren Elemente in dieser Algebra werden als Automorphismen bezeichnet.

Banachalgebren

Definition 1.28. Eine normierte Algebra ist ein Paar \((\mathcal A,\|\cdot\|)\) bestehend aus einer \(\mathbb K\)-Algebra \((\mathcal A,+,\cdot)\) und einer Norm \(\|\cdot\|\), die neben den Eigenschaften (V0) – (V3) noch die Eigenschaft

  1. Für \(x,y\in\cal A\) gilt \(\|xy\|\leq\|x\|\,\|y\|\).

erfüllt. Ist eine normierte Algebra vollständig, so heißt sie Banachalgebra.

Beispiel 1.29. Standardbeispiel einer Banachalgebra ist die Algebra \(\mathcal L(V)\) der beschränkten Endomorphismen eines Banachraumes. Vollständigkeit folgt aus Satz Satz 1.22.

Beispiel 1.30. Sei \(X\) kompakter metrischer Raum. Dann ist \(\mathrm C(X)\) versehen mit der (punktweisen) Multiplikation von Funktionen wegen \[|f(x)g(x)|\leq|f(x)|\,|g(x)|\leq \|f\|\,\|g\|\] eine normierte Algebra, wegen der Vollständigkeit also eine Banachalgebra. Invertierbare Elemente sind alle Funktionen, die keine Nullstellen besitzen.

Beispiel 1.31. Auf dem Raum \(L^1(\mathbb R^n)\) kann vermittels der Faltung \[f*g(x):=\int f(x-y)g(y)\mathrm d y\] die Struktur einer Banachalgebra definiert werden. Man beweise dazu die Youngsche Ungleichung6 \[\|f*g\|_1\leq \|f\|_1\,\|g\|_1.\]

Während die Algebren \(\mathrm C(X)\) und \({\mathrm L}^1(\mathbb R^n)\) kommutativ sind, ist die Algebra der beschränkten Operatoren \(\mathcal L(V)\) (falls \(\dim V>1\)) nicht kommutativ. Die Algebra \({\mathrm L}^1(\mathbb R^n)\) enthält kein Einselement.

Zum Schluß eine erste Anwendung. Ein Operator \(A\in\mathcal L(V)\) heißt kontrahierend oder eine Kontraktion, falls \(\|A\|<1\) gilt. Betrachtet man nun Operatorgleichungen der Form \[x-Ax=y\] zu gegebenem \(y\in V\), \(V\) ein Banachraum, so kann man deren Lösung explizit hinschreiben. Es gilt \[x=\left(I+\sum_{k=1}^\infty A^k\right)y=(I-A)^{-1}y.\] Um das zu zeigen, muß die Konvergenz der Reihe nachgewiesen werden. Da \(V\) Banachraum ist, ist \(\mathcal L(V)\) eine Banachalgebra. Da \(\|A^k\|\leq\|A\|^k\) gilt, ist die geometrische Reihe \(\sum_k \|A\|^k\) eine konvergente Majorante, die Ausgangsreihe also in \(\mathcal L(V)\) unbedingt konvergent. Einsetzen liefert \[(I-A)\left(I+\sum_{k=1}^\infty A^k\right)=I+\sum_{k=1}^\infty A^k-A-\sum_{k=1}^\infty A^{k+1}=I.\] Insbesondere ist für kontrahierendes \(A\) der Operator \(I-A\) invertierbar. Die Aussage ist ein Spezialfall des Banachschen Fixpunktsatzes, die Reihendarstellung heißt Neumannreihe7.

Beispiel 1.32. Sei \(\ell^1(\mathbb Z)\) die Menge aller Folgen \((x_n)_{n\in\mathbb Z}\) komplexer Zahlen mit \(\sum_{n\in\mathbb Z} |x_n| < \infty\). Dann wird \(\ell^1(\mathbb Z)\) durch die Faltung \[(x_n)*(y_n)=(z_n),\qquad\text{mit}\quad z_n=\sum_{k\in\mathbb Z} x_{n-k} y_k\] zu einer Banachalgebra. Diese hängt eng mit Fourierreihen zusammen. Wir bezeichnen zu \(x=(x_n)\in\ell^1(\mathbb Z)\) mit \[\mathcal F x (\theta) = \sum_{k\in\mathbb Z} x_k {\mathrm e}^{2\pi \mathrm ik \theta}\] die zugeordnete (komplexe) Fourierreihe. Diese definiert eine stetige \(1\)-periodische Funktion. Bezeichne \({\mathrm C}_{\rm per} [0,1]\) die Menge aller solchen Funktionen, dann ist \(\mathcal F : \ell^1(\mathbb Z) \to {\mathrm C}_{\rm per}[0,1]\) ein Algebrenhomomorphismus, \(\mathcal F[x*y] = \mathcal F[x] \mathcal F[y]\). Dieser ist stetig, injektiv aber nicht surjektiv.

Satz 1.1 (Wiener8-Lemma). Ein Element \(x\in\ell^1(\mathbb Z)\) ist invertierbar in der Banachalgebra \(\ell^1(\mathbb Z)\) genau dann, wenn \(\mathcal Fx (\theta)\ne0\) für alle \(\theta\in[0,1]\) gilt.

Proof. Es bezeichne \(\mathcal A\subset {\mathrm C}_{\rm per}[0,1]\) das Bild von \(\mathcal F\) versehen mit der induzierten Norm, \[\| f\|_{\mathcal A} = \| (x_n) \|_1,\qquad f = \mathcal Fx.\] Damit wird \(\mathcal A\) zu einer Banachalgebra unter Multiplikation und \(\|f\|_\infty\le \|f\|_{\mathcal A}\). Jedes invertierbare Element in \(\mathcal A\) muß in \({\mathrm C}_{\rm per}[0,1]\) invertierbar sein und damit ist \(f(\theta)\ne0\) für alle \(0\le\theta\le1\) notwendig für Invertierbarkeit. Es bleibt zu zeigen, daß das auch hinreichend ist.

Sei dazu \(f\in\mathcal A\). Dann ist auch \(\overline f\in\mathcal A\) (man ersetze die Folge \((x_n)\) durch \((x_{-n})\)) und damit \(|f|^2=f\overline f\in \mathcal A\). Da \[\frac1{f(\theta)} = \frac{\overline {f(\theta)}}{|f(\theta)|^2}\] gilt, genügt es die Invertierbarkeit der positiven Funktion \(|f|^2\) in \(\mathcal A\) zu zeigen. Durch Skalieren kann man weiter annehmen, daß nur Werte zwischen \(0\) und \(1\) angenommen werden. Sei also im weiteren \(f\in\mathcal A\) und gelte \(0<f(\theta)<1\) für alle \(0\le \theta\le 1\). Die multiplikative Inverse kann nun durch die geometrische Reihe \[\frac1{f(\theta)} = \sum_{k=0}^\infty g(\theta)^k ,\qquad g(\theta)=1-f(\theta)\] ausgedrückt werden. Jeder Summand gehört zu \(\mathcal A\) und die Aussage ist gezeigt, wenn wir Konvergenz der Reihe in \(\mathcal A\) zeigen können. Dazu schätzen wir \(\|g^k\|_{\mathcal A}\) ab. Da \(g\in \mathcal A\) ist, existiert eine Folge \(y=(y_n)\in \ell^1(\mathbb Z)\) mit \(g=\mathcal Fy\) und somit zu jedem \(\varepsilon>0\) ein \(N\), so daß \(\sum_{k>N} |y_n|<\varepsilon\), also \[\left\| g(\theta) - \sum_{n=-N}^N y_n {\mathrm e}^{\mathrm in\theta} \right\|_{\mathcal A} < \varepsilon.\] Wir bezeichnen das so definierte trigonometrische Polynom als \(p(\theta) = \sum_{n=-N}^N y_n {\mathrm e}^{\mathrm in\theta}\). Dann gilt mit der Dreiecksungleichung in \(\mathcal A\) und dem binomischen Satz \[\| g^k \|_{\mathcal A} \le \sum_{l=0}^k \binom k l \|p^l\|_{\mathcal A} \varepsilon^{k-l}.\] Für das trigonometrische Polynom \(p\) vom Grad \(N\) gilt mit der Parseval-Identität \[\| p \|_{\mathcal A} = \sum_{n=-N}^N |y_n| \le \|(y_n)\|_2 \sqrt{2N+1} = \| p \|_2 \sqrt{2N+1} \le \sqrt{2N+1}\; \|p\|_\infty,\] und damit entsprechend für seine Potenzen als trigonometrische Polynome vom Grad \(kN\) \[\| p^k \|_{\mathcal A} \le \sqrt{2kN+1} \; \|p\|^k_\infty.\]

Es bleibt die Wahl von \(\varepsilon\). Sei dazu \(\delta=\min_\theta f(\theta)\). Dann gilt \[\|p\|_\infty = \|g- (g-p)\|_\infty \le \|g\|_\infty + \|g-p\|_\infty \le 1-\delta+\|g-p\|_{\mathcal A} \le 1-\delta+\varepsilon\] und \[\begin{split} \|g^k\|_{\mathcal A} &\le \sqrt{2kN+1} \sum_{l=0}^k \binom{k}{l} \|p\|_\infty^l \varepsilon^{k-l} \\& \le \sqrt{2kN+1} (\|p\|_\infty + \varepsilon)^k \le \sqrt{2kN+1} (1-\delta+2\varepsilon)^k. \end{split}\] Wir wählen \(\varepsilon\) so klein, daß \(1-\delta+2\varepsilon<1\). Dann folgt \[\sum_{k=0}^\infty \|g^k\|_{\mathcal A} \le \sum_{k=0}^\infty \sqrt{2kN+1} (1-\delta+2\varepsilon)^k < \infty\] und mit Majorantenkriterium die Behauptung \(1/f\in\mathcal A\). ◻

1.3 Unterräume und Approximationsaufgaben

Definition und Beispiele

Sei \((V,\|\cdot\|)\) ein normierter Raum. Dann ist auch jeder (algebraische) Teilraum \(U\subseteq V\) ein normierter Raum. Ist \((V,\|\cdot\|)\) Banachraum, so sind alle abgeschlossenen Unterräume selbst wieder Banachräume.

Beispiele 1.33. Um Beispiele zu konstruieren, betrachten wir wieder einen linearen Operator \(A\in\mathcal L(V_1,V_2)\) zwischen zwei normierten Räumen \((V_1,\|\cdot\|_1)\) und \((V_2,\|\cdot\|_2)\). Dann ist das Bild (engl. range) des Operators \[\mathop{\mathrm{ran}}(A):=\{\;Ax\;|\;x\in V_1\,\}\subseteq V_2\] ein Teilraum von \(V_2\). Ebenso ist der Nullraum oder Kern des Operators \[\mathop{\mathrm{ker}}(A):=\{\;x\in V_1\;|\;Ax=0\;\}\] ein Teilraum. Wie man leicht sieht, ist der Nullraum stets abgeschlossen. Man beweise dies! Ebenso gebe man ein Beispiel eines beschränkten Operators an, dessen Bild nicht abgeschlossen ist.

Beispiel 1.34. Sei \(A\in\mathcal L(V_1,V_2)\). Dann ist der Graph \[\mathrm{graph}\;A:=\{\;(x,Ax)\;|\;x\in V_1\;\}\] ein abgeschlossener Teilraum von \(V_1\times V_2\).

Seien nun \(U_1\) und \(U_2\) zwei Unterräume von \(V\). Dann bezeichnen wir mit \[U_1+U_2=\mathop{\mathrm{span}}(U_1\cup U_2 )\] die Summe der Unterräume \(U_1\) und \(U_2\). Oft ist es hilfreich, einen (Unter-) Raum in eine Summe kleinerer Teilräume zu zerlegen. Optimal ist es dabei, wenn deren Durchschnitt trivial ist, also \(U_1\cap U_2=\{0\}\) gilt. In diesem Falle spricht man von einer direkten Summe der Unterräume und bezeichnet sie als \[U_1\dotplus U_2 = \mathop{\mathrm{span}}(U_1\cup U_2),\qquad \text{falls $U_1\cap U_2=\{0\}$}.\] Die direkte Summe abgeschlossener Unterräume muß selbst nicht abgeschlossen sein.

Beispiel 1.35. Um ein Beispiel anzugeben, betrachten wir den Raum \({\mathrm L}^1(\mathbb R)\) und darin die Unterräume \[\begin{aligned} {\mathrm L}^1_g(\mathbb R)&=\{\;f\in{\mathrm L}^1(\mathbb R)\;|\; f(x)=f(-x)\;\}\\ {\mathrm L}^1_u(\mathbb R)&=\{\;f\in{\mathrm L}^1(\mathbb R)\;|\; f(x)=-f(-x)\;\}\end{aligned}\] der geraden bzw. ungeraden Funktionen. Beide sind offenbar abgeschlossen und man kann jede Funktion \(f\in{\mathrm L}^1(\mathbb R)\) vermittels \(f_g(x)=(f(x)+f(-x))/2\) und \(f_u(x)=(f(x)-f(-x))/2\) in ihren geraden und ungeraden Anteil zerlegen. Weiterhin muß jede Funktion, die zugleich gerade und ungerade ist, die (fast-überall-) Nullfunktion sein.

Es gilt also \({\mathrm L}^1(\mathbb R)={\mathrm L}^1_g(\mathbb R)\dotplus{\mathrm L}^1_u(\mathbb R)\).

Quotientenräume. Ist \(U\subset V\) ein abgeschlossener Unterraum des normierten Raumes \(V\), so kann man auf dem Quotientenraum \(V/_U = \{ [x] = x+U \;:\; x\in V\}\) durch \[\| [x] \| = \inf_{y\in U} \|x+y\|\] eine Norm definieren. Diese besitzt alle Normeigenschaften. Aus \(\|[x]\| = 0\) folgt, daß eine Folge \(y_n\in U\) mit \(\|x-y_n\|\to0\) existiert. Damit gilt \(y_n\to x\), also \(x\in U\) und \([x]=x+U=0+U=[0]\). Die Normeigenschaften (V2) und (V3) sind einfach zu zeigen. Ist \(V\) Banachraum, so ist der Quotientenraum ebenso ein Banachraum. Sei dazu \([x_k]\in V/_U\) Cauchyfolge (und nach Übergang zu einer Teilfolge) \(\| [x_{k+1}] - [x_k]\|<2^{-k-1}\). Wir wählen \(\tilde x_0\in [x_0]\) beliebig. Da \[\inf_{\tilde x_1\in[x_1]} \| \tilde x_0- \tilde x_1\| = \inf_{y\in U} \| \tilde x_0 - x_1 + y \| = \|[x_0-x_1]\|\le 2^{-1}\] gilt, finden wir insbesondere ein \(\tilde x_1\in[x_1]\) mit \(\|\tilde x_0-\tilde x_1\|< 2^{-0}\). Auf diese Weise erhält man rekursiv eine Folge \(\tilde x_k\in[x_k]\) mit \(\| \tilde x_{k-1} - \tilde x_k \| < 2^{1-k}\). Damit konvergiert aber \[\tilde x_n = \tilde x_0 + \sum_{k=1}^n \tilde x_k-\tilde x_{k-1} \to \tilde x_0 + \sum_{k=1}^\infty \tilde x_k-\tilde x_{k-1} = x\] nach dem Majorantenkriterium absolut und nach Konstruktion gilt \([x_k]\to [ x]\).

Approximation

Oft stellt sich die Frage, inwieweit es möglich ist, Elemente von \(V\) durch Elemente von \(U\) zu approximieren. Zum einen kann dazu \(U\) ein dichter Teilraum sein, das heißt zu jedem \(x\in V\) und jedem \(\varepsilon>0\) existiert ein \(y\in U\), so daß \(\|x-y\|<\varepsilon\) gilt.

Beispiel 1.36. Der Vektorraum der Stufenfunktionen, das heißt die Menge der meßbaren Funktionen im \(\mathbb R^n\), die nur auf einer beschränkten Menge von Null verschiedene Werte annehmen und auch nur einen endlichen Wertebereich haben, ist dicht in \({\mathrm{L}}^p(\mathbb R^n)\) für alle \(p\in[1,\infty)\).

Beispiel 1.37. Im Raum \(\mathrm C[a,b]\) der stetigen Funktionen auf einem kompakten Intervall ist die Menge aller Polynome ein dichter Teilraum. (Approximationssatz von Weierstraß9)

Proof. Wir betrachten nur das Intervall \([0,1]\) und darauf die Familie der Bernsteinpolynome10 \[\beta_{n,k}(t) = \binom{n}{k}t^k (1-t)^{n-k},\qquad k\in\{0,...,n\}, \quad n\in\mathbb N_0.\] Dann gilt \(0\le \beta_{n,k}(t) \le 1\) für \(t\in[0,1]\) und \(\sum_{k=0}^n \beta_{n,k}(t) =1\). Ebenso leicht zeigt man, daß \[\sum_{k=0}^n \beta_{n,k} (t) (t-k/n)^2=\frac{t(1-t)}n\] gilt. Sei nun \(f\in\mathrm C[0,1]\) und bezeichne \[B_n (t) = \sum_{k=0}^n f(k/n) \beta_{n,k}(t),\] so gilt \[B_n(t) - f(t) = \sum_{k=0}^n \beta_{n,k}(t) ( f(k/n) - f(t) )\] und da \(f\) auf \([0,1]\) gleichmäßig stetig ist, existiert zu jedem \(\varepsilon\) ein \(\delta\), so daß \(|f({k/n}) - f(t) | \le \varepsilon\) für alle \(t\) mit \(|t-k/n|\le \delta\) gilt. Damit folgt die Behauptung, indem man die Summe entsprechend in zwei Teile aufspaltet \[|B_n(t)-f(t)| \le \varepsilon\sum_{k=0}^n \beta_{n,k}(t) + \frac{2M}{\delta^2}\sum_{k=0}^n \beta_{n,k} (t) (t-k/n)^2 \le \varepsilon+ \frac{M}{2n \delta^2}\] und ausnutzt, dass \(M=\sup_t |f(t)|<\infty\). ◻

Von anderer Natur ist die Frage nach Bestapproximationen aus abgeschlossenen Unterräumen. Sei dazu \(V\) ein normierter Raum und \(U\) ein abgeschlossener Teilraum. Unter einer/der Bestapproximation eines Elementes \(x\in V\) aus \(U\) verstehen wir ein \(y\in U\), so daß der Approximationsfehler \(\|x-y\|\) minimal wird. Im Unendlichdimensionalen muß eine solche Bestapproximation nicht immer existieren, aber wir können uns an eine solche annähern. Umgekehrt müssen Bestapproximationen nicht eindeutig sein.

Beispiel 1.38. Der Raum der Nullfolgen \(\mathfrak c_0\) ist ein abgeschlossener Teilraum des Raumes der konvergenten Folgen \(\mathfrak c\). Versucht man nun die konstante Folge \((1)\in\mathfrak c\) durch eine Nullfolge zu approximieren, so haben z.b. sämtliche positiven Nullfolgen den Minimalabstand \(1\), Abstände kleiner \(1\) kommen gar nicht vor. Die Bestapproximierende ist also nicht eindeutig bestimmt.

Beispiel 1.39. Wir bleiben im Raum \(\mathfrak c_0\). Betrachtet man den Unterraum \[M=\{ (x_k)\in\mathfrak c_0 \;|\; \sum_{k=0}^\infty 2^{-k-1}x_k=0\},\] so ist dieser abgeschlossen (Übung!) und für keine Folge \((y_n)\in\mathfrak c_0\setminus M\) existiert eine Bestapproximation aus \(M\).

Proof. Sei \(\lambda=\sum_k 2^{-k-1}y_k\). Dann ist \[(z_n)_k=-\frac{2^k}{2^k-1}(\underbrace{\lambda,\lambda,\ldots,\lambda}_{\text{$k$ mal}},0\ldots)+(y_n)\] für jedes \(k\) ein Element von \(M\). Weiterhin gilt \(\|(z_n)_k-(y_n)\|\to|\lambda|\). Also ist der Abstand von \((y_n)\) zu \(M\) höchstens \(|\lambda|\). Wir zeigen, daß trotzdem kein \((x_n)\in M\) mit \(\|(x_n)-(y_n)\|\leq|\lambda|\) existiert. Angenommen es existiert eins. Dann gilt \[\begin{gathered} |\lambda|=|\sum_k 2^{-k-1}y_k|=|\sum_k 2^{-k-1}(y_k-x_k)|\leq \sum_k 2^{-k-1}|x_k-y_k| \\\leq |\lambda| \sum_{k<n}2^{-k-1} +\frac12 |\lambda|\sum_{k\geq n}2^{-k-1}<|\lambda| \end{gathered}\] wobei \(n\) so groß gewählt wird, daß für \(k\geq n\) stets \(|x_k-y_k|\leq\frac12|\lambda|\) gilt (Nullfolgen!). Das ist aber ein Widerspruch zur Definition von \(\lambda.\) ◻

Das Rieszsche Lemma

Verbunden mit der Frage nach Approximationen ist das umgekehrte Problem, Punkte zu finden, die von einem Unterraum besonders weit weg liegen. Ein Beispiel dazu ist das Rieszsche11 Lemma von der Fastsenkrechten.

Lemma 1.40 (Riesz). Sei \(U\) ein abgeschlossener echter Teilraum von \((V,\|\cdot\|)\). Dann gibt es zu jedem \(\varepsilon>0\) ein \(x\in V\setminus U\) mit \(\|x\|=1\) und \[\mathrm{dist}\,(x,U)=\inf\{\|x-y\|\,|\,y\in U\}\geq1-\varepsilon.\]

Proof. Die Aussage gilt offenbar für \(U=\{0\}\), deshalb genügt es den Beweis für nichttriviales \(U\) zu führen. Sei \(y\in V\setminus U\). Da \(U\) abgeschlossen ist, ist \(d:=\mathrm{dist}\,(y,U)>0\). Dies folgt indirekt, angenommen \(\mathrm{dist}\,(y,U)=0\). Dann gilt für eine Minimalfolge \((x_n)\) aus \(U\) \(\|x_n-y\|\to0\) und damit \(x_n\to y\). Da \(U\) abgeschlossen ist, wäre also \(y\in U\).

Dann gibt es also ein \(z\in U\) mit \[0<\|y-z\|<d/(1-\varepsilon).\] Setzt man nun \(x=(y-z)/\|y-z\|\), so ist \(\|x\|=1\) und für alle \(u\in U\) \[\|u-x\|=\bigl\|u-(y-z)/\|y-z\|\bigr\|=\bigl\|(u\|y-z\|+z)-y\bigr\|/\|y-z\|\geq d/\|y-z\|>1-\varepsilon.\] ◻

Damit können wir nun folgenden Satz beweisen.

Satz 1.41. Sei \(V\) normierter Raum. Dann sind äquivalent:

  1. \(V\) ist endlichdimensional.

  2. Jede abgeschlossene und beschränkte Teilmenge von \(V\) ist (folgen-) kompakt.

Proof. (1)\(\Rightarrow\)(2) Ist eine Formulierung des Satzes von Bolzano–Weierstraß im \(\mathbb R^n\). \(\bullet\qquad\)(2)\(\Rightarrow\)(1) Sei dazu \(V\) unendlichdimensional. Wir zeigen, daß dann die abgeschlossene Einheitskugel \[B:=\{x\in V\;|\;\|x\|\leq1\}\] nicht folgenkompakt ist. Dazu wählen wir \(x_1\) mit \(\|x_1\|=1\) beliebig und setzen \(F_1=\mathop{\mathrm{span}}\{x_1\}\) und konstruieren rekursiv eine Folge \(F_i\) und \(x_i\). Weil \(F_i\neq V\) ist existiert nach dem Rieszschen Lemma ein \(x_{i+1}\) mit \(\|x_{i+1}\|=1\) und \(\mathrm{dist}\,(x_{i+1},F_i)>\frac12\). Setzen \(F_{i+1}=\mathop{\mathrm{span}}\{x_1,\ldots,x_{i+1}\}\). Insbesondere erhalten wir damit eine Folge \((x_k)\subseteq B\) mit \(\|x_j-x_k\|\geq\frac12\) für \(j\neq k\). Diese Folge kann also keine konvergente Teilfolge enthalten, also ist die abgeschlossene und beschränkte Menge \(B\) nicht kompakt. ◻

1.4 Der Bairesche Kategoriensatz und seine Folgerungen

Verbunden mit dichten Teilmengen ist der nachfolgende tiefliegende Satz. Seine Grundidee ist verwandt mit der Konstruktion der rationalen Zahlen und der reellen Zahlen. Während sich die rationalen Zahlen als abzählbare Vereinigung der Stammbrüche mit festem Nenner schreiben lassen und keine dieser Teilmengen dicht in \(\mathbb Q\) ist, enthalten die reellen Zahlen “wesentlich mehr Elemente”.

Definition 1.42. Eine Teilmenge \(A\) eines metrischen Raumes heißt von erster Kategorie, wenn sie sich als abzählbare Vereinigung nirgends dichter Teilmengen schreiben läßt. Existiert keine solche Darstellung, so heißt sie von zweiter Kategorie.

Lemma 1.43. Eine Menge \(M\) ist genau dann von zweiter Kategorie, wenn aus \(M=\bigcup_{k=1}^\infty A_k\) stets folgt, daß die Abschließung wenigstens einer Menge \(A_k\) innere Punkte enthält.

Satz 1.44 (Baire12scher Kategoriensatz). Jeder vollständige metrische Raum (insbesondere also jeder Banachraum) M ist von zweiter Kategorie.

Proof. Gegenannahme: Es existieren nirgends dichte Teilmengen \(A_k\) von \(M\) mit \(M=\bigcup_{k=1}^\infty A_k\). Da \(A_1\) nirgends dicht ist gibt es ein \(x_1\in M\setminus\overline A_1\). Weil \(\overline A_1\) abgeschlossen und \(M\) offen ist, existiert zu \(x_1\) eine offene Kugel \(B_1=B(x_1,r_1)\) mit Radius \(r_1<1\), so daß \(\overline B_1\cap\overline A_1=\varnothing\) gilt. Weil \(A_2\) nirgends dicht ist, gibt es nun \(x_2\in B_1\setminus\overline A_2\). Weil \(B_1\) offen und \(\overline A_2\) abgeschlossen ist, gibt es nun eine Kugel \(B_2=B(x_2,r_2)\) mit Radius \(r_2<\frac12\), so daß \(B_2\subset B_1\) und \(\overline B_2\cap\overline A_2=\varnothing\). Induktiv konstruiert man nun eine Folge ineinandergeschachtelter Kugeln \(B_k\) mit Mittelpunkt \(x_k\) und Radien \(r_k<\frac1k\), so daß \[B_{k}\subset B_{k-1},\qquad \overline B_k\cap\overline A_k=\varnothing.\] Weil alle Mittelpunkte \(x_k,x_{k+1},\ldots\) in \(B_k\) liegen, folgt für \(m\geq k\) somit \(d(x_k,x_m)\leq2/k\) und die Folge \((x_k)\) ist Cauchyfolge, konvergiert also gegen ein \(x\in M\). Dieses \(x\) liegt aber für alle \(k\) in \(\overline B_k\) und deshalb für kein \(k\) in \(\overline A_k\). Widerspruch. ◻

Korollar 1.45. Für jeden Banachraum \(V\) gilt entweder \(\dim V<\aleph_0\) oder \(\dim V\ge \aleph_1\).

Proof. Angenommen, \(\dim V=\aleph_0\). Dann gibt es abzählbar unendlich viele Basisvektoren \(x_n\in V\), \(n\in\mathbb N\), mit \(\mathop{\mathrm{span}}\{x_n : n\in\mathbb N\}=V\). Sei \(V_k= \mathop{\mathrm{span}}\{x_0,\ldots,x_k\}\). Dann ist \(V_k\) endlichdimensional, also abgeschlossen und (mit Lemma Lemma 1.40) nirgends dicht. Damit ist der Raum \(V=\bigcup_k V_k\) aber von erster Kategorie und nach dem Satz von Baire kein Banachraum. ◻

Als Folgerungen des Baireschen Kategoriensatzes ergeben sich einige der wichtigsten Sätze der Funktionalanalysis, die im folgenden zusammengestellt werden sollen. Hauptproblem ist, Bedingungen anzugeben, unter denen die Inverse eines injektiven Operators stetig ist. Beantwortet wird es im wesentlichen durch folgenden Satz.

Satz 1.46 (Banach, Satz von der offenen Abbildung). Seien \(V_1\) und \(V_2\) Banachräume und sei \(A\in\mathcal L(V_1,V_2)\) surjektiv. Dann ist die Bildmenge \(A(U)\) jeder offenen Menge \(U\subseteq V_1\) offen in \(V_2\).

Proof. Sei \(B_k:=\{x\in V_1\;|\;\|x\|_1<k\}\). Dann ist wegen der Surjektivität von \(A\) offenbar \[\bigcup_k A(B_k) = V_2,\] es gibt nach dem Satz von Baire also ein \(k\), so daß \(\overline{A(B_k)}\) innere Punkte enthält. Durch Skalieren sieht man, dass dies damit auch für alle \(k\) gilt. Es gibt also insbesondere ein \(y\in \overline{A(B_1)}\) und ein \(\delta>0\), so daß \(y+\tilde B_\delta\subset \overline{A(B_1)}\), \(\tilde B_\delta :=\{x\in V_2\;|\;\|x\|_2<\delta\}\). Da \(A\) linear ist und \(-B_1=B_1\) gilt, folgt \(-y-\tilde B_\delta \subset \overline{A(B_1)}\). Weiter ist \(B_1\) und somit auch \(A(B_1)\) konvex, also \[\tilde{B_\delta} \subset \mathop{\mathrm{conv}}((y+\tilde B_\delta ) \cup (-y-\tilde B_\delta )) \subset \overline{A(B_1)}.\]

In einem zweiten Schritt zeigen wir \(\overline{A(B_1)}\subset A(B_2)\). Sei dazu \(y\in\overline{A(B_1)}\). Dann existiert \(x_1\in B_1\) mit \[y-Ax_1\in\tilde B_{\delta/2}\subset\overline{A(B_{1/2})} .\] Rekursiv konstruieren wir nun \(x_k\in B_{2^{1-k}}\) mit \[y-Ax_1-Ax_2-\cdots-Ax_k\in\tilde B_{\delta 2^{-k}}\subset\overline{A(B_{2^{-k}})} .\] Die Reihe \(\sum x_k\) konvergiert wegen \(\|x_k\|<2^{1-k}\) nach dem Majorantenkriterium absolut gegen ein Element \(x\in B_2\) und wegen der Stetigkeit von \(A\) folgt \(Ax=y\). Somit ist \(y\in A(B_2)\), also \(\overline{A(B_1)}\subset A(B_2)\).

Sei nun \(U\subseteq V_1\) offen. Wir zeigen, daß \(A(U)\) offen ist. Sei dazu \(y\in A(U)\) und \(Ax=y\). Dann existiert ein \(\varepsilon>0\) so daß \(x+B_\varepsilon\subset U\) und somit \(A(x+B_\varepsilon)=y+A(B_\varepsilon)=y+\frac{\varepsilon}2 A(B_2)\subset A(U)\) und nach Schritt 1 und 2 enthält \(A(B_2)\) eine Nullumgebung, \(A(U)\) muß damit offen sein. ◻

Korollar 1.47 (Banach, Satz über den inversen Operator). Sind \(V_1\) und \(V_2\) Banachräume und \(A\in\mathcal L(V_1,V_2)\) bijektiv. Dann ist \(A\) (stetig) invertierbar.

Korollar 1.48. Seien \(\|\cdot\|_1\) und \(\|\cdot\|_2\) zwei Normen auf dem linearen Raum \(V\). Sind beide Räume \((V,\|\cdot\|_1)\) und \((V,\|\cdot\|_2)\) vollständig und gibt es ein \(C\) so daß \(\|x\|_1\leq C\|x\|_2\) für alle \(x\in V\) gilt, so sind beide Normen äquivalent.

Eine weitere Anwendung ist der nachfolgende Satz, er beschreibt die Umkehrung einer vorher schon gemachten Aussage.

Satz 1.49 (Banach, Satz vom abgeschlossenen Graphen). Seien \(V_1\) und \(V_2\) Banachräume und ist der Graph \(\mathrm{graph}\;A\) der linearen Abbildung \(A:V_1\to V_2\) abgeschlossene Teilmenge von \(V_1\times V_2\). Dann ist \(A\) beschränkt.

Proof. Der Unterraum \(\mathrm{graph}\;A\subseteq V_1\times V_2\) wird mit der Norm \(\| (x,Ax) \|_{1\times2} = \|x\|_1 + \|Ax \|_2\) zu einem Banachraum. Damit kann man auf die Bijektion \(\mathrm{graph}\;A\ni(x,Ax) \mapsto x\in V_1\) den Satz über den inversen Operator anwenden. Also existiert \(C>1\) mit \(\|x\|_1 + \|Ax\|_2 \le C \|x\|_1\). ◻

1.5 Hilberträume

Innenprodukte

Jetzt wollen wir den Begriff des Vektorraums mit Geometrie ergänzen. Dazu messen wir nicht nur Abstände zwischen Punkten, sondern auch Winkel zwischen Vektoren.

Definition 1.50. Ein Innenprodukt- oder Prähilbertraum ist ein Vektorraum \(H\) zusammen mit einem Skalarprodukt \({\pmb(\cdot,\cdot\pmb)}:H\times H\to\mathbb K\), welches die folgenden Bedingungen erfüllt:

  1. Symmetrie13: Für alle \(x,y\in H\) gilt \({\pmb(x,y\pmb)}=\overline{{\pmb(y,x\pmb)}}\).

  2. Positiv-Definitheit: Für alle \(x\in H\) ist \({\pmb(x,x\pmb)}\geq0\) und \({\pmb(x,x\pmb)}=0\) gilt genau dann, wenn \(x=0\).

  3. Homogenität: Für \(x,y\in H\) und \(\lambda\in\mathbb K\) gilt \({\pmb(\lambda x,y\pmb)}=\lambda{\pmb(x,y\pmb)}\).

  4. Linearität: Für \(x,y,z\in H\) gilt \({\pmb(x+y,z\pmb)}={\pmb(x,z\pmb)}+{\pmb(y,z\pmb)}\).

Mit der Vereinbarung \[\label{eq:normdef} \|x\|=\sqrt{{\pmb(x,x\pmb)}}\] kann man in jedem Innenproduktraum eine Norm definieren und damit die Struktur eines normierten Raumes erzeugen. (Übungsaufgabe: Man zeige die Normeigenschaften mit Hilfe der Aussagen (H1)(H4)!) Eine wichtige Eigenschaft des Skalarproduktes ist, daß es bezüglich der Norm stetig ist. Dies folgt aus

Satz 1.51 (Schwarzsche14 Ungleichung). Es gilt für \(x,y \in H\) \[|{\pmb(x,y\pmb)} |\leq\|x\|\,\|y\|.\]

Proof. Für \(y=0\) folgt \({\pmb(x,y\pmb)}=0\) und die Ungleichung ist korrekt. Weiter gilt \[\begin{gathered} 0\leq{\pmb(x+\alpha y,x+\alpha y\pmb)}={\pmb(x,x\pmb)}+\alpha{\pmb(y,x\pmb)}+\overline\alpha{\pmb(x,y\pmb)}+|\alpha|^2{\pmb(y,y\pmb)}\\={\pmb(x,x\pmb)}-{\pmb(x,y\pmb)} {\pmb(y,x\pmb)}/{\pmb(y,y\pmb)} \end{gathered}\] mit \(\alpha=-{\pmb(x,y\pmb)}/{\pmb(y,y\pmb)}\) und die Behauptung folgt. ◻

Korollar 1.52. Seien \((x_n)\) und \((y_n)\) in \(H\) konvergente Folgen mit Grenzwerten \(x\) und \(y\). So gilt \({\pmb(x_n,y_n\pmb)}\to{\pmb(x,y\pmb)}\).

Proof. Es gilt \({\pmb(x_n,y_n\pmb)} -{\pmb(x,y\pmb)} = {\pmb(x_n-x,y_n\pmb)} + {\pmb(x,y_n-y\pmb)}\). Wir betrachten beide Summanden separat. Für den ersten gilt \(|{\pmb(x_n-x,y_n\pmb)}|\le \| x_n-x\|\,\|y_n\| \to 0\), da \(\|y_n\|\) beschränkt ist. Ebenso gilt \(|{\pmb(x,y_n-y\pmb)}|\le \|x\|\,\|y_n-y\|\to0\). ◻

Satz 1.53 (Satz des Pythagoras). Gilt \({\pmb(x,y\pmb)}=0\), so folgt \(\|x+y\|^2=\|x\|^2+\|y\|^2\).

Proof. Es gilt \(\|x+y\|^2 = {\pmb(x+y,x+y\pmb)} = \|x\|^2 + 2 \Re {\pmb(x,y\pmb)} + \|y\|^2=\|x\|^2+\|y\|^2\). ◻

Es stellt sich umgekehrt die Frage, welche Eigenschaften eine Norm in einem normierten Raum haben muß, um aus einem Skalarprodukt hervorzugehen. Die Antwort liefert folgender Satz; der Beweis dazu verbleibt als Übungsaufgabe.

Satz 1.54. In jedem Innenproduktraum erfüllt die Norm [eq:normdef] die Parallelogrammgleichung \[\|x+y\|^2+\|x-y\|^2= 2(\|x\|^2+\|y\|^2)\] für alle \(x,y\in H\). Erfüllt umgekehrt eine Norm die Parallelogrammgleichung, so läßt sich durch \[{\pmb(x,y\pmb)} := \begin{cases} \left\|\frac{x+y}2\right\|^2-\left\|\frac{x-y}2\right\|^2,&\qquad \text{falls $\mathbb K=\mathbb R$},\\ &\\ \left\|\frac{x+y}2\right\|^2-\left\|\frac{x-y}2\right\|^2 +\mathrm i \left\|\frac{x+\mathrm iy}2\right\|^2-\mathrm i\left\|\frac{x-\mathrm iy}2\right\|^2,&\qquad \text{falls $\mathbb K=\mathbb C$}, \end{cases}\] ein Skalarprodukt definieren, welches diese Norm induziert.

Definition 1.55. Ein Innenproduktraum wird als Hilbertraum15 bezeichnet, falls er (als normierter Raum) vollständig ist.

Beispiel 1.56. Standardbeispiel ist der Raum \({\mathrm L}^2(\mathbb R^n)\) versehen mit dem Innenprodukt \[{\pmb(f,g\pmb)}=\int f(x)\overline{g(x)}\mathrm d x.\] Die zugeordnete Norm ist die \(2\)-Norm.

Beispiel 1.57. Ein weiteres Beispiel erhält man, wenn man den Folgenraum \[\ell^2=\left\{\;(x_n)\in\mathbb C^\mathbb N\;\bigg|\; \sum_{n=0}^\infty |x_n|^2<\infty \;\right\},\] versehen mit dem Skalarprodukt \[{\pmb((x_n),(y_n)\pmb)}=\sum_{n=0}^\infty x_n\overline{y_n}\] betrachtet.

Beispiel 1.58. Die Menge der analytischen Funktionen mit quadratsummierbaren Taylorkoeffizienten, \[\mathcal H^2(\mathbb D) = \{ f\in\mathfrak A(\mathbb D) : f(\zeta) = \sum_{n=0}^\infty \alpha_n \zeta^n,\quad (\alpha_n)\in\ell^2\},\] ist ein Hilbertraum. Die Zuordnung \(\ell^2\ni (\alpha_n) \mapsto f\in\mathcal H^2(\mathbb D)\) ist linear bijektiv und definiert die Hilbertraumstruktur des \(\mathcal H^2(\mathbb D)\). Er wird als der Hardyraum auf der Kreisscheibe \(\mathbb D\) bezeichnet. Man zeige, daß \[{\pmb(f,g\pmb)} {}_{\mathcal H^2} = {\pmb((\alpha_n),(\beta_n)\pmb)} {}_{\ell^2} = \sum_{n=0}^\infty \alpha_n\overline{\beta_n} = \lim_{r\to1} \frac1{2\pi\mathrm i} \int_{|\zeta|=r} f(\zeta)\overline{g(\zeta)} \frac{\,\mathrm d\zeta}{\zeta}\] für die Hardyfunktionen \[f(\zeta) = \sum_{n=0}^\infty \alpha_n \zeta^n, \qquad g(\zeta) = \sum_{n=0}^\infty \beta_n \zeta^n\] gilt.

Der Projektionssatz und Bestapproximationen

Nun soll die geometrische Struktur, die durch ein Innenprodukt induziert wird in den Mittelpunkt gestellt werden. Sei dazu \(H\) ein Hilbertraum und \(U\subseteq H\) ein Teilraum. Dann definiert man durch \[U^\perp=\{\;x\in H\;|\; \forall y\in U:\,{\pmb(x,y\pmb)}=0\;\}\] das orthogonale Komplement von \(U\) in \(H\). Weiter bezeichne \(U\oplus V\) die direkte Summe paarweise orthogonaler Unterräume, \[U\oplus V = \mathop{\mathrm{span}}(U\cup V),\qquad \text{falls $U\perp V$},\] also falls \(U\subseteq V^\perp\) bzw. \(V\subseteq U^\perp\).

Wir greifen die Frage nach der Bestapproximation eines Elementes in einem abgeschlossenen Unterraum erneut auf und beantworten sie (zumindest innerhalb der Struktur eines Hilbertraumes).

Satz 1.59 (Projektionssatz). Sei \(U\) abgeschlossener Teilraum eines Hilbertraumes \(H\). Dann gilt \[H=U\oplus U^\perp.\] Sei weiter \(x\in H\) zerlegt in seine Komponenten \(x=y+(x-y)\) mit \(y\in U\) und \((x-y)\in U^\perp\). Dann ist \(y\) die Bestapproximation an \(x\) aus \(U\), das heißt \[\forall z\in U:\; \|x-z\|\geq\|x-y\|\] und Gleichheit tritt genau für \(y=z\) ein.

Proof. Sei \(x\in H\) und \(y_n\in U\) eine Minimalfolge, so daß \[\lim_{n\to\infty}\|x-y_n\|=d=\inf_{y\in U}\|x-y\|\] gilt. Sei nun \(u_n=x-y_n\) und \(v_n=x-y_m\), also \(u_n-v_n=y_m-y_n\) und \(u_n+v_n=2(x-(y_n+y_m)/2)\). Dann gilt mit der Parallelogrammgleichung \[\begin{gathered} \|y_m-y_n\|^2=2( \|x-y_n\|^2+\|x-y_m\|^2)-4\|x-(y_n+y_m)/2\|^2\notag\\\leq 2( \|x-y_n\|^2+\|x-y_m\|^2)-4d^2\to0 \end{gathered}\] für \(m,n\to\infty\). Die Folge \(y_n\) ist also Cauchyfolge in \(U\), wegen der Abgeschlossenheit von \(U\) existiert der Grenzwert \(y\). Dieses \(y\) löst die Bestapproximationsaufgabe und erfüllt damit für alle \(z\in U\), \(\alpha\in\mathbb K\) \[\|x-y\|^2\leq\|x-(y+\alpha z)\|^2=\|x-y\|^2-\overline\alpha{\pmb(x-y,z\pmb)}-\alpha{\pmb(z,x-y\pmb)}+|\alpha|^2\|z\|^2,\] speziell mit \(\alpha={\pmb(x-y,z\pmb)} /\|z\|^2\) also \(|{\pmb(x-y,z\pmb)}|^2\leq0\), das heißt \(x-y\perp z\).

Damit folgt \(H=U+ U^\perp\), wegen \(U\cap U^\perp=\{0\}\) die Behauptung. ◻

Zu einem Unterraum \(U\) eines Hilbertraums \(H\) kann man also den Projektionsoperator \[P_U : H\to U\] definieren, der jedem \(x\in H\) seine Bestapproximation \(P_Ux\in U\) zuordnet.

Korollar 1.60. \(P_U\) ist linear und beschränkt und erfüllt \(P_U^2=P_U\) sowie \(P_{U^\perp}=I-P_U\).

Proof. Wir zeigen die Linearität. Sei \(x_i= y_i+(x_i-y_i)\), \(i=1,2\), mit \(y_i\in U\) und \(x_i-y_i\in U^\perp\), die Zerlegung von \(x_i\in H\) in die entsprechenden Komponenten. Da \(U\) und \(U^\perp\) Unterräume sind, ist für jedes \(\alpha\in\mathbb K\) auch \(y_1+\alpha y_2\in U\), \(x_1+\alpha x_2 -( y_1+\alpha y_2) \in U^\perp\) und damit \(P_U x_1 + \alpha P_U x_2 = y_1+\alpha y_2 = P_U (x_1+\alpha x_2)\) linear. Weiter ist nach dem Satz des Pythagoras \[\|x\|^2 = \|P_U x\|^2 + \| x- P_Ux\|^2\] und somit \(\|P_U\|\le 1\). ◻

Proposition 1.61. Sei \(U\) Teilraum von \(H\).

  1. \(U^\perp\) ist abgeschlossener Unterraum von \(H\).

  2. \((U^\perp)^\perp\) ist der Abschluß von \(U\) in \(H\).

  3. \(U\) ist dicht in \(H\) genau dann, wenn \(U^\perp=\{0\}\) ist.

Proof. (1) Sei \(x_n\in U^\perp\) und gelte \(x_n\to x\). Dann folgt \(0={\pmb(x_n,y\pmb)}\to {\pmb(x,y\pmb)}\) für alle \(y\in U\). \(\bullet\qquad\) (2) Es gilt \(U\subseteq (U^\perp)^\perp\), also liegt der Abschluß von \(U\) in \((U^\perp)^\perp\). Für alles weitere nutzt man den Projektionssatz Satz 1.59, \((U^\perp)^\perp = \overline U \oplus (\overline U^\perp \cap (U^\perp)^\perp) \subseteq \overline U \oplus ( U^\perp \cap (U^\perp)^\perp) = \overline U\). \(\bullet\qquad\) (3) \(U\) ist dicht in \(H\) genau dann, wenn \((U^\perp)^\perp=H\) und damit \(U^\perp = ((U^\perp)^\perp)^\perp=H^\perp=\{0\}\) gilt. ◻

Beispiel 1.62. Es gilt \[{\mathrm L}^2(\mathbb R^n)={\mathrm L}^2_g(\mathbb R^n)\oplus{\mathrm L}^2_u(\mathbb R^n),\] wobei die Unterräume der geraden Funktionen \({\mathrm L}^2_g(\mathbb R^n)\) und der ungeraden Funktionen \({\mathrm L}^2_u(\mathbb R^n)\) paarweise orthogonal sind, \[{\mathrm L}^2_u(\mathbb R^n)=({\mathrm L}^2_g(\mathbb R^n))^\perp.\] Die Bestapproximation einer Funktion \(f\in{\mathrm L}^2(\mathbb R^n)\) durch eine gerade Funktion aus \({\mathrm L}^2_g(\mathbb R^n)\) ist durch den geraden Anteil \[f_g(x)=\frac{f(x)+f(-x)}2\] gegeben.

Beispiel 1.63. Sei \(A:H_1\to H_2\) ein beschränkter Operator mit abgeschlossenem Bild. Dann kann man zu \(A\) die Pseudoinverse oder Moore-Penrose-Inverse16 \(A^\sharp\) durch das Bestapproximationsproblem \[A^\sharp y=x \qquad\Longleftrightarrow\qquad \|Ax-y\|_2 \to \min \quad\text{und dabei}\quad \|x\|_1\to\min\] definieren. Die Konstruktion der Abbildung \(A^\sharp\) erfolgt in mehreren Schritten. Zuerst betrachten wir die (rein algebraisch) definierte induzierte Abbildung \[\tilde A : H_1/_{\mathop{\mathrm{ker}}(A)}\to \mathop{\mathrm{ran}}(A).\] Diese ist bijektiv. Da \(A\) ein abgeschlossenes Bild besitzt ist \(\mathop{\mathrm{ran}}(A)\) ein Hilbertraum. Der Quotientenraum \(H_1/_{\mathop{\mathrm{ker}}(A)}\) kann durch \[\| x+\mathop{\mathrm{ker}}(A) \|_{H_1/_{\mathop{\mathrm{ker}}(A)}} = \inf \{ \|y\|_1 \;|\;y\in x+\mathop{\mathrm{ker}}(A)\} = \|P_{\mathop{\mathrm{ker}}(A)^\perp} x \|_1\] zu einem (mittels \(P_{\mathop{\mathrm{ker}}(A)^\perp}\) zu \(\mathop{\mathrm{ker}}(A)^\perp\) isomorphen) Hilbertraum gemacht werden. Auf diesem ist \(\tilde A\) stetig, also nach dem Satz über den inversen Operator auch stetig invertierbar.

Nun gilt \[A^\sharp=P_{\mathop{\mathrm{ker}}(A)^\perp} \tilde A^{-1} P_{\mathop{\mathrm{ran}}(A)}.\] Insbesondere ist \(A^\sharp\) selbst ein beschränkter Operator mit abgeschlossenem Bild. Für diesen gilt \[A^\sharp A= P_{\mathop{\mathrm{ker}}(A)^\perp} \tilde A^{-1}A=P_{\mathop{\mathrm{ker}}(A)^\perp}\] und \[AA^\sharp=A(I-P_{\mathop{\mathrm{ker}}(A)})\tilde A^{-1}P_{\mathop{\mathrm{ran}}(A)} = P_{\mathop{\mathrm{ran}}(A)}-A P_{\mathop{\mathrm{ker}}(A)} \tilde A^{-1}P_{\mathop{\mathrm{ran}}(A)} =P_{\mathop{\mathrm{ran}}(A)}.\]

Beispiel 1.64. Das tatsächliche Berechnen der Projektoren ist mitunter schwierig. Eine Ausnahme sind Projektoren auf endlichdimensionale Teilräume. Sei \(\mathbf e\in H\) mit \(\|\mathbf e\|=1\), so gilt \[P_{\mathop{\mathrm{span}}\{\mathbf e\}} x = {\pmb(x,\mathbf e\pmb)} \mathbf e ,\qquad\qquad P_{\mathop{\mathrm{span}}\{\mathbf e\}} = \mathbf e\otimes\mathbf e.\] Das ist leicht nachzurechnen. Offenbar gilt \(P_{\mathop{\mathrm{span}}\{\mathbf e\}} x\in\mathop{\mathrm{span}}\{\mathbf e\}\) und \[{\pmb(x- P_{\mathop{\mathrm{span}}\{\mathbf e\}} x,\mathbf e\pmb)} ={\pmb(x- {\pmb(x,\mathbf e\pmb)} \mathbf e,\mathbf e\pmb)} = {\pmb(x,\mathbf e\pmb)} - {\pmb(x,\mathbf e\pmb)}\|\mathbf e\|^2=0.\] Projektoren auf endlichdimensionale Teilräume kann man sich damit zusammensetzen. Es gilt \[P_{U\oplus V} = P_U + P_V,\] da \(U\perp V\) und damit \(P_UP_V=0=P_VP_U\).

Separabilität und Orthogonalbasen

Wir wollen einen Hilbertraum als separabel bezeichnen, falls er eine abzählbare dichte Teilmenge besitzt.

Beispiel 1.65. Der Hilbertraum \({\mathrm L}^2(G)\), \(G\subseteq\mathbb R^n\) ein Gebiet, ist separabel. Dies folgt daraus, daß die Teilmenge der Stufenfunktionen mit rationalen Funktionswerten und über Quadern mit rationalen Koordinaten dicht in \({\mathrm L}^2(G)\) ist.

Separable Hilberträume sind durch eine einfache Eigenschaft gekennzeichnet, sie sind isometrisch isomorph zum Folgenraum \(\ell^2\). Um dies zu zeigen, konstruieren wir eine sogenannte Orthonormalbasis des separablen Hilbertraums \(H\).

Definition 1.66. Eine Folge \(({\mathbf e}_n)\) von Elementen des Hilbertraums \(H\) heißt Orthonormalsystem von \(H\), falls \({\pmb({\mathbf e}_i,{\mathbf e}_j\pmb)}=0\) für \(i\neq j\) und \(\|{\mathbf e}_i\|=1\) für alle \(i\) gilt. Ist zusätzlich \(\mathop{\mathrm{span}}\{\;{\mathbf e}_n\;|\;n\in\mathbb N\;\}\) dicht in \(H\), so spricht man von einer Orthonormalbasis.

Wir konstruieren eine Orthonormalbasis von \(H\), indem wir auf die abzählbare dichte Teilmenge das Verfahren der Gram-Schmidt17-Orthogonalisierung anwenden. Bezeichne dazu \((x_n)\) eine Abzählung der dichten Teilmenge. Dann definieren wir \(({\mathbf e}_n)\) rekursiv durch \({\mathbf e}_0=x_0/\|x_0\|\) und \[\tilde x_{n+1}=x_{n+1}-\sum_{i=0}^n {\pmb(x_{n+1},{\mathbf e}_i\pmb)}{\mathbf e}_i=x_{n+1}-P_{\mathop{\mathrm{span}}\{{\mathbf e}_0,\ldots,{\mathbf e}_n\}} x_{n+1},\] falls \(\tilde x_{n+1}=0\) streichen wir das entsprechende Element \(x_{n+1}\) aus der Liste, andernfalls setzen wir \(e_{n+1}=\tilde x_{n+1}/\|\tilde x_{n+1}\|\).

Weiter folgt aus dem Projektionssatz die Besselsche Ungleichung18 \[\sum_{i=0}^\infty |{\pmb(x,{\mathbf e}_i\pmb)}|^2 = \sup_N \sum_{i=0}^N |{\pmb(x,{\mathbf e}_i\pmb)}|^2\leq \|x\|^2\] für jedes \(x\in H\) und jedes Orthonormalsystem \(({\mathbf e}_n)\). Angewandt auf eine Orthonormalbasis ergibt sich daraus die Parsevalsche Gleichung19 und folgender Satz.

Satz 1.67 (Fischer20–Riesz). Sei \(H\) ein separabler Hilbertraum und \(({\mathbf e}_n)\) eine Orthonormalbasis. Dann gilt für alle \(x\in H\) \[\label{eq:1.5:parseval} \sum_{n=0}^\infty |{\pmb(x,{\mathbf e}_n\pmb)}|^2 = \|x\|^2.\] Insbesondere ist die Abbildung \[H\ni x\mapsto ({\pmb(x,{\mathbf e}_n\pmb)})\in\ell^2\] ein isometrischer Isomorphismus der Hilberträume \(H\) und \(\ell^2\).

Proof. Sei \(x\in H\). Dann gilt \(P_{\mathop{\mathrm{span}}\{{\mathbf e}_0,...,{\mathbf e}_n\}} x = \sum_{i=0}^n {\pmb(x,{\mathbf e}_i\pmb)} {\mathbf e}_i\) und nach dem Satz des Pythagoras folgt \[\|P_{\mathop{\mathrm{span}}\{{\mathbf e}_0,...,{\mathbf e}_n\}} x\|^2 = \sum_{i=0}^n | {\pmb(x,{\mathbf e}_i\pmb)}|^2 = \|x\|^2 - \|x-P_{\mathop{\mathrm{span}}\{{\mathbf e}_0,...,{\mathbf e}_n\}} x\|^2 \le \|x\|^2\] und damit die Besselsche Ungleichung. Da \(\mathop{\mathrm{span}}\{{\mathbf e}_n : n\in\mathbb N\}\) dicht in \(H\) ist, strebt für jedes \(x\in H\) die Norm \(\|x-P_{\mathop{\mathrm{span}}\{{\mathbf e}_0,...,{\mathbf e}_n\}} x\|\) gegen Null und es folgt die Parseval-Identität [eq:1.5:parseval].

Die Zuordnung \(H\ni x \mapsto ({\pmb(x,{\mathbf e}_n\pmb)} )\in \ell^2\) ist linear und isometrisch, es bleibt zu zeigen, dass sie auch surjektiv ist. Sei dazu \((\alpha_n)\in\ell^2\) beliebig und \(s_n\) die Partialsumme \[s_n = \sum_{i=0}^n \alpha_i {\mathbf e}_i\in H,\qquad \|s_n\|^2 = \sum_{i=0}^n |\alpha_i|^2.\] Da die Reihe \(\sum_i |\alpha_i|^2\) konvergiert, existiert zu jedem \(\varepsilon>0\) ein \(N_\varepsilon\), so daß für \(m\ge n>N_\varepsilon\) \[\| s_m-s_n \|^2 = \sum_{i=n+1}^m |\alpha_i|^2 \le \sum_{i=N_\varepsilon}^\infty|\alpha_i|^2 \le \varepsilon^2\] und die Folge \(s_n\) ist Cauchy. Damit konvergiert aber die Reihe \(\sum_n \alpha_n {\mathbf e}_n\) gegen ein Element \(x\in H\). Für dieses gilt nach Konstruktion \({\pmb(x,{\mathbf e}_n\pmb)}=\alpha_n\). ◻

Wie im Beweis von Satz Satz 1.17 zeigt man, daß die Reihe \(\sum_n \alpha_n {\mathbf e}_n\) für beliebiges \((\alpha_n)\in\ell^2\) unbedingt konvergiert. Wir überlassen das als Übungsaufgabe.

Beispiel 1.68. Standardbeispiel einer Orthonormalbasis ist die Basis der trigonometrischen Polynome im \({\mathrm L}^2(0,1)\), in komplexer Form gegeben durch die Funktionen \({\mathrm e}^{2\pi \mathrm ikx}\) zu \(k\in\mathbb Z\). Die Darstellungen bezüglich dieser Basis sind gerade die Fourierreihen.

Sei \(f\in{\mathrm L}^2(0,1)\). Dann gilt \[f(x) = \sum_{k\in\mathbb Z} c_k {\mathrm e}^{2\pi\mathrm ikx} ,\qquad\qquad c_k={\pmb(f,{\mathrm e}^{2\pi\mathrm ik\cdot}\pmb)}=\int_0^1 f(x) {\mathrm e}^{-2\pi\mathrm ikx}\,\mathrm dx\] als in \({\mathrm L}^2(0,1)\) konvergente Reihe. Die Reihe ist unbedingt konvergent.

Beispiel 1.69. Nach Konstruktion des Raumes bilden die Monome \(\zeta^n\), \(n\in\mathbb N\), eine Orthonormalbasis des Hardyraumes \(\mathcal H^2(\mathbb D)\).

Beispiel 1.70. Wendet man in \({\mathrm L}^2(-1,1)\) auf die Folge der Polynome \(x^n\), \(n=0,1,\ldots\) das Gram-Schmidt-Verfahren an, so ergibt sich eine Folge spezieller Orthogonalpolynome, die sogenannten Legendrepolynome21. Die ersten der Legendrepolynome ergeben sich wie folgt, \[p_0(x) = \frac{\sqrt2}2,\qquad p_1(x) = \frac{\sqrt 6}2 \;x,\qquad p_2(x) = \frac{\sqrt {10}}4 (3x^2-1), \qquad \ldots\] Nach dem Weierstraßschen Approximationssatz, Beispiel Beispiel 1.37, sind die Polynome dicht in \(\mathrm C[-1,1]\). Ebenso sind die stetigen Funktionen dicht in \({\mathrm L}^2(-1,1)\). Zu gegebenem \(\varepsilon>0\) und \(f\in {\mathrm L}^2(-1,1)\) existieren also eine stetige Funktion \(g\in \mathrm C[-1,1]\) mit \(\|f-g\|_2< \varepsilon/2\). Weiter existiert zu diesem \(g\) ein Polynom \(p\) und \(\|g-p\|_\infty<\varepsilon/4\) und damit \[\|f-p\|_2 \le \|f-g\|_2+\|g-p\|_2\le \|f-g\|_2+\sqrt 2\|g-p\|_\infty < \varepsilon.\] Also sind Polynome dicht in \({\mathrm L}^2(-1,1)\) und die Folge der Legendrepolynome bildet eine Orthonormalbasis.

Beispiel 1.71. Dasselbe kann man auch in gewichteten \({\mathrm L}^2\)-Räumen machen, dabei ergeben sich spezielle Systeme von Orthogonalpolynomen. Genannt seien hier nur die Tschebyscheff-Polynome22 \(T_n(t)\), die durch die Eigenschaften \[T_0(t)=1,\qquad T_{n}(\cos\phi)=\cos(n\phi)\] charakterisiert sind. Für sie gilt \[\int_{-1}^1T_m(t)T_n(t)\frac{\mathrm dt}{\sqrt{1-t^2}}=0,\qquad m\neq n,\] normiert man sie entsprechend entsteht wiederum eine Orthonormalbasis.

1.6 Ausblick: Lokalkonvexe Vektorräume

Bis jetzt haben wir eine Norm genutzt, um in einem Vektorraum Begriffe wie Nähe oder Konvergenz zu definieren. Verzichtet man auf eine Quantifizierung des Begriffs Nähe, so kann man auch anders vorgehen und einen Vektorraum nur mit einer Topologie versehen.

Ein erster Schritt dazu wären Vektorräume, in denen die Konvergenz durch ein System von Seminormen beschrieben wird.

Definition 1.72. Ein Paar bestehend aus einem Vektorraum \(V\) und einem System von Seminormen \(p_\alpha:V\to\mathbb R\), \(\alpha\in I\), welches die Eigenschaften

  1. Jede Seminorm \(p_\alpha\), \(\alpha\in I\), erfüllt die Eigenschaften (V0), (V2) und (V3).

  2. Gilt \(p_\alpha(x)=0\) für alle \(\alpha\in I\), so folgt \(x=0\).

erfüllt, wird als lokalkonvexer Raum bezeichnet.

Konvergenz einer Folge \((x_n)\) gegen \(x\) in einem lokalkonvexen Raum bedeutet, daß für alle \(\alpha\in I\) die Folge \(p_\alpha(x-x_n)\) eine Nullfolge ist. Ein solcher lokalkonvexer Raum heißt folgenvollständig, falls jede Folge \(x_n\) mit \[\forall \alpha\in I : \forall \varepsilon>0: \exists N\in\mathbb N : \forall m,n> N : p_\alpha(x_n-x_m)<\varepsilon\] gegen ein \(x\in V\) konvergent ist.

Beispiele lokalkonvexer Vektorräume werden uns bei der Betrachtung schwächerer Konvergenzbegriffe begegnen. Trotz allem ein (nicht triviales) Beispiel anderer Bauart.

Beispiel 1.73. Sei \(V_k\) eine Folge von Banachräumen mit Norm \(\|\cdot\|_k\) und gelte weiter \(V_i \subset V_j\) als stetige Einbettung für \(i > j\). Dann kann auf dem Schnitt \(V = \bigcap_k V_k\) durch das System der Normen \(\|\cdot\|_k\) eine lokalkonvexe Struktur definiert werden. Der so konstruierte Raum ist folgenvollständig, aber im allgemeinen kein Banachraum.

Man kann noch wesentlich schwächere Strukturen definieren. Das Allgemeinste, was wir hier betrachten wollen, ist der sogenannte topologische Vektorraum.

Definition 1.74. Ein Vektorraum \(V\) zusammen mit einer Topologie \(\mathcal O\) wird als topologischer Vektorraum bezeichnet, wenn \(\{0\}\subset V\) abgeschlossen ist und die Operationen \(+:V\times V\to V\) und \(\cdot:\mathbb K\times V\to V\) beide bezüglich der (entsprechenden Produkt-) Topologie stetig sind.

Jeder lokalkonvexe Raum ist als topologischer Vektorraum zu verstehen. Dabei wird die Topologie gerade durch die Subbasis bestehend aus den Mengen \[\mathcal U_{\alpha,\varepsilon}(x) = \{ y\in V : p_\alpha(x-y)<\varepsilon\} ,\qquad x\in V, \alpha\in I, \varepsilon>0\] erzeugt. Man zeige, daß die erzeugte Topologie mit der Vektorraumstruktur verträglich ist und den oben angegebenen Konvergenzbegriff impliziert.

1.7 Die Topologie der starken Operatorkonvergenz

Das erste Kapitel soll damit abgeschlossen werden, daß wir den Raum \(\mathcal L(V_1,V_2)\), den wir als normierten Raum kennengelernt haben, mit einer schwächeren lokalkonvexen Struktur versehen.

Definition 1.75. Sei \(A_n:V_1\to V_2\) eine Folge von Operatoren. Dann konvergiert \(A_n\) stark, falls für alle \(x\in V_1\) die Folge \(A_nx\) in \(V_2\) konvergiert. Insbesondere bestimmt dann der Grenzwert \(Ax:=\lim_{n\to\infty}A_nx\) eine lineare Abbildung \(A:V_1\to V_2\), in Zeichen \[A=\mathop{\mathrm{s-lim}}_{n\to\infty}A_n.\]

Starke Konvergenz enstpricht der Konvergenz in einem lokalkonvexen Raum, der durch das (nicht abzählbare) System der Seminormen \[p_x(A)=\|Ax\|_2,\qquad x\in V_1\] beschrieben wird. Ein erstes, überaschendes Resultat ist

Satz 1.76 (Satz über die gleichmäßige Beschränktheit). Sei \(V_1\) ein Banachraum und \(V_2\) normierter Raum. Ist dann die Folge \(A_n\in\mathcal L(V_1,V_2)\) punktweise beschränkt, \(p_x(A_n)\leq\alpha_x\), so ist die Folge der Operatornormen \(\|A_n\|\) beschränkt.

Proof. Der Beweis beruht auf dem Baireschen Kategoriensatz, angewandt in \(V_1\). Dazu betrachten wir die Mengen \[B_k=\{x\in V_1\;|\; \sup_n\|A_nx\|\leq k \}.\] Dann ist nach Vorrausetzung \(\bigcup_kB_k=V_1\). Weiter ist jedes der \(B_k\) als Durchschnitt \[B_k=\bigcap_n B_k^n=\bigcap_n \{x\in V_1\;|\;\|A_nx\|\leq k\}\] darstellbar. Die Stetigkeit aller \(A_n\) impliziert, daß alle \(B_k^n\) und damit auch \(B_k\) abgeschlossene Mengen sind. Also enthält eine der Mengen \(B_k\) einen inneren Punkt \(x_0\). Folglich gibt es ein \(\varepsilon>0\) so daß für \(\|x\|\leq\varepsilon\) und alle \(n\) \[\|A_nx\|=\|A_n(x+x_0)-A_nx_0\|\leq \|A_n(x+x_0)\|+\|A_nx_0\|\leq 2k\] gilt, insbesondere folgt \(\|A_n\|\leq2k/ \varepsilon\). ◻

Es stellt sich die Frage, ob der Raum \(\mathcal L(V_1,V_2)\) auch bezüglich der starken Konvergenz folgenvollständig ist. Daß dies wirklich der Fall ist, ergibt ich aus dem Satz über die gleichmäßige Beschränktheit. Wesentlich ist die Linearität der Abbildungen und daß beide Räume \(V_1\) und \(V_2\) Banachräume sind.

Korollar 1.77. Sei \(V_1\) Banachraum und \(V_2\) normierter Raum. Konvergiert dann eine Folge \(A_n\in\mathcal L(V_1,V_2)\) stark gegen die Abbildung \(A:V_1\to V_2\), so ist \(A\) stetig und erfüllt \[\|A\|\leq\sup_n\|A_n\|.\]

Proof. Starke Konvergenz impliziert Linearität von \(A\), \[A (x+\lambda y) = \lim_{n\to\infty} A_n(x+\lambda y) = \lim_{n\to\infty} A_n x + \lambda \lim_{n\to\infty} A_n y = Ax + \lambda Ay.\] Es bleibt die Beschränktheit zu zeigen. Diese ergibt sich direkt aus Satz Satz 1.76, \[\| A x\| = \lim_{n\to\infty} \| A_n x\| \le \limsup_{n\to\infty} \|A_n\|\,\|x\|.\] ◻

Satz 1.78 (Banach–Steinhaus23). Sei \(A_n\in\mathcal L(V_1,V_2)\) eine Folge von Operatoren zwischen zwei Banachräumen \(V_1\) und \(V_2\) Dann sind äquivalent:

  1. \(A_n\) konvergiert stark gegen ein \(A\in\mathcal L(V_1,V_2)\),

  2. die Folge der Operatornormen \(\|A_n\|\) ist beschränkt und für alle \(x\) aus einer dichten Teilmenge \(M\) von \(V_1\) ist \((A_nx)\) Cauchyfolge in \(V_2\).

Proof. (1)\(\Rightarrow\)(2) folgt unmittelbar aus dem Satz über die gleichmäßige Beschränktheit. \(\bullet\qquad\) (2)\(\Rightarrow\)(1) Sei dazu \(y\in V_1\) gegeben. Wir wählen \(\varepsilon>0\) und \(\gamma:=\sup_n\|A_n\|\). Sei weiter \(x\in M\) mit \(\|x-y\|\leq\varepsilon/(3\gamma)\). Dann konvergiert \((A_nx)\), es gibt also ein \(n_0\), so daß für \(m,n\geq n_0\) stets \(\|A_mx-A_nx\|\leq\varepsilon/3\). Für diese Indizes gilt dann \[\begin{gathered} \|A_ny-A_my\|\leq\|A_ny-A_nx\|+\|A_nx-A_mx\|+\|A_mx-A_my\| \\ \leq \gamma\varepsilon/(3\gamma)+\varepsilon/3+ \gamma\varepsilon/(3\gamma)\leq\varepsilon,\end{gathered}\] \(A_ny\) ist Cauchyfolge und somit konvergent. Die Behauptung folgt aus dem vorigen Satz. ◻

2 Dualitätstheorie

Alles kann man von zwei Seiten betrachten.

2.1 Dualräume

Definition

In diesem Abschnitt soll ein spezieller Raum beschränkter Operatoren, der Dualraum \[V'=\mathcal L(V,\mathbb K)\] im Zentrum stehen. Elemente des Dualraumes werden kurz als beschränkte Linearformen oder beschränkte lineare Funktionale bezeichnet, wir verwenden dafür griechische Buchstaben. Für \(\phi\in V'\) schreiben wir statt \(\phi(x)\) (oder, was als Operator ja auch sinnvoll wäre \(\phi x\)) kurz \(\langle \phi,x \rangle\). Die formale Analogie in der Schreibweise zu einem Skalarprodukt wird später noch durch entsprechende Resultate untermauert.

Beispiele 2.1. Beispiele linearer Funktionale auf Räumen stetiger Funktionen sind

Es sei noch an die Norm in \(V'\) erinnert \[\|\phi\|=\sup_{x\neq0}\frac{|\langle \phi,x\rangle|}{\|x\|}=\sup_{\|x\|=1}|\langle \phi,x\rangle |,\] \(V'\) ist also ein normierter Raum. Es gilt als Folgerung aus Satz Satz 1.22:

Satz 2.2. Der Dualraum \(V'\) eines normierten Raumes \(V\) ist ein Banachraum.

Beispiel 2.3. Wir wollen ein erstes Beispiel betrachten, den Folgenraum \(\ell^1\). Sei dazu \((x_n)\in\ell^1\) und \((y_n)\in\ell^\infty\). Dann kann durch \[\langle\phi,(x_n)\rangle=\langle (y_n),(x_n) \rangle = \sum_n x_ny_n\] eine Linearform \(\phi\in(\ell^1)'\) mit \[| \langle\phi,(x_n)\rangle | \leq \|(x_n)\|_1\,\|(y_n)\|_\infty ,\qquad \|\phi\|\leq\|(y_n)\|_\infty\] definiert werden. Sei umgekehrt \(\phi\in(\ell^1)'\) und bezeichne \({\mathbf e}_k\) die Folge \((0,0,\ldots,1,0,\ldots)\) die genau an der \(k\)-ten Stelle eine \(1\) besitzt. Dann kann man die Folge \((y_n)\) mit \[y_n=\langle\phi,{\mathbf e}_n\rangle,\qquad |y_n|\leq\|\phi\|,\qquad (y_n)\in\ell^\infty\] betrachten. Wegen der Linearität und Stetigkeit von \(\phi\) folgt \[\langle\phi,(x_n)\rangle= \left \langle\phi,\sum x_n {\mathbf e}_n \right\rangle = \sum x_n \langle\phi, {\mathbf e}_n\rangle=\sum x_ny_n= \langle (y_n),(x_n) \rangle\] und wir haben eine Isometrie zwischen \(\ell^\infty\) und \((\ell^1)'\) konstruiert, wir identifizieren beide Räume und schreiben kurz \[(\ell^1)'=\ell^\infty .\]

Beispiele 2.4. In vollkommener Analogie kann man mit Ausnutzung der Hölderschen25 Ungleichung \[\sum_n |x_ny_n| \leq \left(\sum_n |x_n|^p\right)^{1/p} \left(\sum_n |y_n|^{q}\right)^{1/q}\] für \(pq=p+q\) zeigen, daß \((\ell^p)'=\ell^{q}\) für alle \(p\in[1,\infty)\) gilt.

Proof. Jede Folge aus \(\ell^{q}\) bestimmt nach der Hölderschen Ungleichung \[| \langle (y_n),(x_n)\rangle| \le \|(x_n)\|_p \|(y_n)\|_q\] eine Linearform auf \(\ell^p\). Was bleibt, ist zu zeigen, daß umgekehrt auch jede Linearform durch so eine Folge dargestellt werden kann. Sei also \(\phi\in(\ell^p)'\) und sei weiter \(y_n = \langle\phi,{\mathbf e}_n\rangle\). Dann ist die Folge \((y_n)\) beschränkt, \(|y_n|\le\|\phi\|\), und es gilt für die endliche Folge \((x_n)\) \[x_n = \begin{cases} \overline y_n |y_n|^{q-2} ,\qquad &n\le N,\\ 0,\qquad &n>N\end{cases}\] die Ungleichung \[\begin{aligned} \sum_{n=0}^N |y_n|^{q} = |\langle (y_n),(x_n)\rangle| \le \| \phi\| \left(\sum_{n=0}^N |x_n|^p\right)^{1/p} = \|\phi\| \left(\sum_{n=0}^N |y_n|^{p(q-1)}\right)^{1/p} ,\end{aligned}\] also wegen \(p(q-1)=q\) auch \(\left(\sum_{n=0}^N |y_n|^{q}\right)^{1/q} \le \|\phi\|.\) Mit \(N\to\infty\) folgt die Behauptung. ◻

Beispiele 2.5. Es gilt sowohl \(\mathfrak c_0'=\ell^1\) als auch \(\mathfrak c'=\ell^1\) (im Sinne einer isometrisch-isomorphen Identifikation).

Der Fortsetzungssatz von Hahn–Banach

Ist \(\phi\in V'\), so bestimmt \(\phi\) durch die Gleichung \(\langle\phi,x\rangle=0\) den abgeschlossenen Unterraum \(\mathop{\mathrm{ker}}(\phi)\). Da \(\phi:V\to\mathbb K\) abbildet, hat dieser (rein algebraisch) die Codimension \(1\), ist also eine Hyperebene. Daß sich jeder abgeschlossene Unterraum als Durchschnitt von (abgeschlossenen) Hyperebenen schreiben läßt, daß es also hinreichend viele Linearformen gibt, ist eine Folgerung des Fortsetzungssatzes von Hahn26-Banach.

Die Hauptaussage des Satzes steckt in folgendem Lemma. Sei \(\wp\) eine auf \(V\) definierte positiv-homogene und sublineare Abbildung, also eine Funktion \(\wp:V\to \mathbb R\) mit \[\wp(\lambda x) = \lambda \wp(x), \qquad\qquad \wp(x+y) \le \wp(x) + \wp(y)\] für \(x,y\in V\) und \(\lambda>0\). Wir sagen eine lineare Abbildung \(\phi: V \to \mathbb K\) ist \(\wp\)-beschränkt, falls \[\Re \langle\phi,x\rangle \le \wp(x)\] für alle \(x\in V\) gilt. Wir betrachten vorerst nur reelle Vektorräume.

Lemma 2.6 (Hahn–Banach). Sei \(U\) Teilraum des reellen Raumes \(V\) und \(\phi_0 : U\to \mathbb R\) eine \(\wp\)-beschränkte lineare Abbildung auf \(U\). Dann existiert eine \(\wp\)-beschränkte Fortsetzung \(\phi:V\to\mathbb R\) von \(\phi_0\) mit \(\langle\phi,y\rangle=\langle\phi_0,y\rangle\) für \(y\in U\).

Proof. Schritt 1: Wir wenden in der Menge aller möglichen \(\wp\)-beschränkten Fortsetzungen geordnet durch Inklusion das Zornsche Lemma an um eine maximale Fortsetzung zu erhalten. Sei dazu \[\mathcal F = \{ (W,\psi) \;:\; W\subseteq V,\text{ W Unterraum}, \psi:W\to\mathbb R\text{ $\wp$-beschränkt und linear}\}\] geordnet durch \((W_1,\psi_1) \ll (W_2,\psi_2)\) falls \(W_1\subseteq W_2\) und \(\psi_1=\psi_2|_{W_1}\). Bezeichne weiter \[\mathcal F_{\gg} = \{(W,\psi)\in\mathcal F \;:\; (U,\phi_0)\ll(W,\psi)\}.\] Für jede aufsteigende Kette \[(W_1,\psi_1) \ll (W_2,\psi_2) \ll \cdots \ll (W_k,\psi_k) \ll \cdots\] von Elementen aus \(\mathcal F_{\gg}\) ist \((\bigcup_k W_k,\bigcup_k \psi_k)\in \mathcal F_{\gg}\) eine obere Schranke. Damit existiert nach dem Lemma von Zorn ein maximales Element in \(\mathcal F_{\gg}\). Sei dieses mit \((W_*,\psi_*)\) bezeichnet.

Schritt 2: Wir zeigen \(W_*=V\). Angenommen, es gibt ein \(x\in V\setminus W_*\). Setzt man dann für \(y\in W_*\) und \(\lambda\in\mathbb R\) \[\langle \tilde\psi,y+\lambda x \rangle =\langle\psi_*,y\rangle + \lambda c,\] so definiert dies eine lineare Abbildung von \(W_*+\mathop{\mathrm{span}}\{x\}\) nach \(\mathbb R\). Es bleibt die geeignete Wahl von \(c\). Dazu nutzen wir, daß für \(y,y'\in W_*\) \[\langle \psi_*, y\rangle + \langle\psi_*,y'\rangle = \langle\psi_*,y+y'\rangle \le \wp( y+y' ) \le \wp(y-x)+\wp(y'+x)\] und damit für alle \(y,y'\in U\) \[\langle \psi_*, y\rangle -\wp(y-x) \le \wp(y'+x) - \langle\psi_*,y'\rangle.\] Mit \[\sup_{y\in U} \big( \langle \psi_*, y\rangle -\wp(y-x)\big) \le c \le \inf_{y'\in U} \big(\wp(y'+x) - \langle\psi_*,y'\rangle\big)\] folgt \[\begin{aligned} \langle \tilde\psi,y+\lambda x \rangle &= \langle\psi_*,y\rangle + \lambda c \\ &\le \begin{cases} \langle\psi_*,y\rangle + \lambda (\wp(y/\lambda+x) - \langle\psi_*,y/\lambda\rangle),\qquad&\lambda>0 \\ \langle\psi_*,y\rangle + \lambda (\langle\psi_*,-y/\lambda\rangle-\wp(-y/\lambda-x)) ,\qquad&\lambda<0\end{cases} \\ &\le \wp(y+\lambda x) \end{aligned}\] und die konstruierte Fortsetzung ist \(\wp\)-beschränkt. Das ist ein Widerspruch zur Maximalität von \((W_*,\psi_*)\) und wir haben \(W_*=V\) gezeigt. ◻

Satz 2.7 (Hahn–Banach). Sei \(U\) Teilraum von \(V\) und \(\phi_0\in U'\) beschränkte Linearform auf \(U\). Dann existiert eine Fortsetzung \(\phi\in V'\) von \(\phi_0\) mit \(\langle\phi,y\rangle=\langle\phi_0,y\rangle\) für \(y\in U\) und \(\|\phi\|=\|\phi_0\|\).

Proof. Sei zuerst \(\mathbb K=\mathbb R\). Dann kann man Lemma Lemma 2.6 mit \(\wp(x) = \|\phi_0\|\|x\|\) anwenden und die konstruierte Fortsetzung ist beschränkt, \[\pm\langle\phi,x\rangle = \langle\phi,\pm x\rangle \le \wp(\pm x) = \|\phi_0\|\|x\|.\] Da die Norm beim Fortsetzen nicht kleiner werden kann, folgt \(\|\phi\|=\|\phi_0\|\).

Sei nun \(\mathbb K=\mathbb C\) und \(V_\mathbb R\) der zugeordnete \(\mathbb R\)-Vektorraum (der als Menge mit \(V\) übereinstimmt, aber nur Multiplikation mit reellen Skalaren kennt). Dann kann man \(\Re\phi_0\) zu einem Funktional \(\psi : V_\mathbb R\to \mathbb R\) fortsetzen, welches \[|\langle\psi,x\rangle| \le \|\Re\phi_0\| \|x\|\le \|\phi_0\| \|x\|\] erfüllt. Setzt man \(\langle\phi,x\rangle = \langle \psi,x\rangle -\mathrm i\langle\psi,\mathrm ix\rangle\), so erhält man eine komplex-lineare Fortsetzung, \[\langle\phi,\mathrm ix\rangle = \langle \psi,\mathrm ix\rangle -\mathrm i\langle\psi,- x\rangle = \mathrm i\langle\phi, x\rangle.\] Diese erfüllt \[|\langle\phi,x\rangle| = \omega \langle\phi,x\rangle = \langle\phi,\omega x\rangle = \langle \psi,\omega x\rangle \le \|\phi_0\| \|x\|\] mit einem entsprechenden \(\omega\in\mathbb C\), \(|\omega|=1\), und der Satz ist gezeigt. ◻

Insbesondere besagt diese Aussage, daß die Einschränkung der Funktionale aus \(V'\) auf Abbildungen der Form \(U\to\mathbb K\) surjektiv auf \(U'\) abbildet. Eine weitere Folgerung ist, daß beschränkte lineare Funktionale Punkte trennen.

Korollar 2.8. Sei \(V\) normierter Raum und \(x,y\in V\), \(x\neq y\) seien verschiedene Punkte. Dann gibt es ein \(\phi\in V'\) mit \(\langle\phi,x\rangle \neq \langle\phi,y\rangle\).

Proof. Auf \(U=\mathop{\mathrm{span}}\{x,y\}\) existiert ein lineares Funktional mit diesen Eigenschaften. Fortsetzung mit Hahn-Banach liefert die Behauptung. ◻

Äquivalent zeigen wir, daß es zu \(x\neq0\) ein \(\phi\in V'\) mit \(\langle\phi,x\rangle\neq0\) gibt.

Korollar 2.9. Sei \(V\) normierter Raum und \(0\neq x\in V\). Dann existiert ein \(\phi\in V'\) mit \(\langle\phi,x\rangle=\|x\|\) und \(\|\phi\|=1\).

Proof. Sei \(U=\mathop{\mathrm{span}}\{x\}\). Dann definieren wir \(\langle\phi,\alpha x\rangle=\alpha\|x\|\) auf \(U\). Es gilt \(\|\phi\|=1\). Das gesuchte Funktional ergibt sich durch Fortsetzung nach dem Satz von Hahn–Banach. ◻

Korollar 2.10. Gilt \(\langle\phi,x\rangle=0\) für ein \(x\in V\) und alle \(\phi\in V'\), so folgt \(x=0\).

Man kann das Hahn–Banach-Lemma ebenso nutzen um Punkte in einem normierten Raum \(V\) von konvexen Mengen zu trennen oder allgemeiner konvexe Mengen positiven Abstands voneinander zu trennen. Zur Vollständigkeit sei das Resultat hier angegeben.

Satz 2.11 (Trennungssatz von Hahn–Banach). Seien \(K,L \subseteq V\) nichtleere konvexe Teilmengen normierten Raumes \(V\) mit \[\mathop{\mathrm{dist}}(K,L) = \inf_{x\in K} \inf_{y\in L} \|x-y\| > 0.\] Dann existiert ein lineares Funktional \(\phi\in V'\) und eine Zahl \(\gamma\in\mathbb R\) mit \[\sup_{x\in K} \Re \langle\phi,x\rangle<\gamma< \inf_{y\in L}\Re\langle\phi,y\rangle.\]

Transponierte Operatoren

Eine wichtige Anwendung der letzten Folgerung ist die Definition des transponierten Operators.

Satz 2.12. Sei \(A\in\mathcal L(V_1,V_2)\). Dann existiert genau ein \(A^\dagger\in\mathcal L(V_2',V_1')\), für welches \[\langle\phi, Ax\rangle = \langle A^\dagger \phi,x\rangle\] für alle \(x\in V_1\) und \(\phi\in V_2'\) gilt. Dieser Operator ist beschränkt, \(\|A^\dagger \|=\|A\|\), und wird als zu \(A\) transponierter Operator bezeichnet.

Proof. Angenommen es gäbe zwei solcher Operatoren, \(B_1\) und \(B_2\). Dann würde für deren Differenz und jedes \(\phi\in V_2'\) sowie alle \(x\in V_1\) die Beziehung \(0=\langle (B_1-B_2)\phi,x\rangle\) gelten, also \((B_1-B_2)\phi=0\) sein. Dies bedeutet aber \(B_1=B_2\).

Die Existenz ist offensichtlich, es gilt \[A^\dagger \phi : x\mapsto\langle \phi,Ax\rangle.\] Die Linearität kann man unmittelbar nachrechnen. Wegen \(|\langle\phi, Ax\rangle|\leq \|A\|\,\|x\|\,\|\phi\|\) folgt \(\|A^\dagger \|\leq\|A\|\). Für die Gleichheit nutzen wir den Satz von Hahn–Banach in der Form von Folgerung Korollar 2.9. Es existiert also zu gegebenem \(x\) ein \(\phi\in V_2'\) mit \(\langle\phi,Ax\rangle = \|Ax\|\) und \(\|\phi\|=1\). Mit diesem \(\phi\) gilt \[\|Ax\| = \langle\phi,Ax\rangle = \langle A^\dagger \phi,x\rangle \le \|A^\dagger\| \|\phi\| \|x\| = \|A^\dagger\| \|x\|\] also \(\|A\|\le \|A^\dagger\|\). ◻

Proposition 2.13. Es gelten die Rechenregeln \[(A+B)^\dagger =A^\dagger +B^\dagger ,\qquad (\alpha A)^\dagger =\alpha A^\dagger ,\qquad (AB)^\dagger =B^\dagger A^\dagger\] und, falls \(A\) invertierbar war, gilt dies auch für \(A^\dagger\) \[(A^\dagger )^{-1}=(A^{-1})^\dagger .\]

Beispiel 2.14. Sei \(V\) ein normierter Raum und \(U\) ein Unterraum. Dann ist die Einbettung \(\mathrm{in}\;U\to V\) ein beschränkter Operator (mit Norm \(1\)). Sein Transponierter ist die Einschränkung \(V'\to U'\) eines lineare Funktionals auf \(V\) zu einem auf \(U\).

Beispiel 2.15. Auf dem Folgenraum \(\ell^1\) betrachten wir zu gegebenem \((\mu_n)\in\ell^\infty\) den Multiplikationsoperator \[M:(x_n)\mapsto(x_n\mu_n),\qquad M:\ell^1\to\ell^1,\qquad \|M\|=\|(\mu_n)\|_{\infty}.\] Wir fragen, wie \(M^\dagger :\ell^\infty\to\ell^\infty\) agiert. Dazu sei \((y_n)\in\ell^\infty\) und \((z_n)=M^\dagger (y_n)\). Wegen \[z_k= \langle M^\dagger (y_n),{\mathbf e}_k\rangle = \langle(y_n),M{\mathbf e}_k\rangle = \mu_ky_k\] gilt \(M^\dagger :(y_n)\to(y_n\mu_n)\).

Beispiel 2.16. Auf dem \(\ell^1\) kann man weiterhin den Shift-Operator \[S:\ell^1\ni(x_1,x_2,\ldots)\mapsto(x_2,\ldots)\in\ell^1\] betrachten. Sein Transponierter ist durch \[S^\dagger :\ell^\infty\ni(y_1,y_2,\ldots)\mapsto(0,y_1,y_2,\ldots)\in\ell^\infty\] gegeben. (Übung!)

2.2 Darstellungssätze

Sei nun \(H\) ein Innenproduktraum. Dann kann man das Innenprodukt nutzen, um lineare Funktionale darzustellen. Zu festem \(y\in H\) ist die Abbildung \[H\ni x\mapsto {\pmb(x,y\pmb)}\in\mathbb K\] linear und nach der Schwarzschen Ungleichung beschränkt.

Wenn man weiß, daß \(H\) vollständig ist, dann ist jedes lineare Funktional von dieser Form. Dies manifestiert sich in den Sätzen von Fréchet27–Riesz.

Satz 2.17 (Fréchet–Riesz). Sei \(H\) Hilbertraum und \(\phi\in H'\) ein beschränktes lineares Funktional. Dann existiert ein eindeutig bestimmtes Element \(y_\phi\in H\), so daß für alle \(x\in H\) \[\langle\phi,x\rangle={\pmb(x,y_\phi\pmb)}\] gilt.

Proof. Sei \(U=\mathop{\mathrm{ker}}(\phi)\). Dann existiert eine eindeutige Zerlegung \(x=x_1+x_2\) mit \(x_1\in U\) und \(x_2\in U^\perp\). Da \(\phi\) auf \(U^\perp\) injektiv sein muß, folgt \(\dim U^\perp\leq\dim\mathbb K=1\), \(\phi:U^\perp\to\mathbb K\) ist also bijektiv. Es existiert also genau ein \(y_\phi\in U^\perp\setminus\{0\}\) mit \(\langle\phi,y_\phi\rangle=\|y_\phi\|^2\) (nämlich die zweite Lösung dieser quadratischen Gleichung neben \(y_\phi=0\)). Für dieses gilt \[{\pmb(x,y_\phi \pmb)}={\pmb(x_2,y_\phi \pmb)}= \alpha \|y_\phi\|^2=\alpha \langle\phi,y_\phi \rangle =\langle\phi,x_2\rangle =\langle\phi,x\rangle\] mit \(x_2=\alpha y_\phi\). ◻

Korollar 2.18 (Fréchet–Riesz). Die Zuordnung \(\phi\mapsto y_\phi\) ist ein antilinearer isometrischer Operator \(H'\to H\). Antilinear heisst dabei \[\alpha\phi \mapsto \overline\alpha y_\phi ,\qquad (\phi+\psi)\mapsto y_\phi+y_\psi .\]

Proof. Es genügt die Isometrie zu zeigen. Einerseits folgt \[\|y_\phi\|^2= |\langle \phi ,y_\phi \rangle|\leq \|\phi\|\,\|y_\phi\|,\] also \(\|y_\phi\|\leq\|\phi\|\). Weiter gilt mit der Schwarzschen Ungleichung \[|\langle\phi,x\rangle|= |{\pmb(x,y_\phi\pmb)}|\leq\|x\|\,\|y_\phi\|\] und damit \(\|\phi\|\leq\|y_\phi\|\). ◻

Für Hilberträume nutzt man diese Isometrie um sie mit ihrem Dual zu identifizieren. In diesem Sinne ergeben sich also folgende Beispiele.

Beispiel 2.19. Es gilt \(({\mathrm L}^2(G))'={\mathrm L}^2(G)\) für jedes Gebiet \(G\subseteq\mathbb R^n\). Das heißt, zu jedem linearen Funktional \(\phi\in ({\mathrm L}^2(G))'\) existiert eine Funktion \(g\in {\mathrm L}^2(G)\), so daß \[\langle\phi,f\rangle ={\pmb(f,g\pmb)} = \int_G f(x)\overline{g(x)}\,\mathrm dx\] für alle \(f\in{\mathrm L}^2(G)\) gilt.

Insbesondere haben wir damit lineare Funktionale auf dem Raum \({\mathrm L}^2(G)\) analytisch dargestellt. Vergleichbare Darstellungen gibt es in allen \({\mathrm{L}}^p\)-Räumen, \(p\in[1,\infty)\). Wir geben das Resultat nur an, ohne es vollständig zu beweisen. Es geht ebenso auf Frigyes Riesz zurück.

Satz 2.20 (Riesz). Sei \(G\subseteq\mathbb R^n\) ein Gebiet, \(p\in[1,\infty)\) und \(q\) so, daß \(pq=p+q\). Dann gilt \[({\mathrm{L}}^p(G))'={\mathrm L}^q(G),\] speziell existiert zu jedem \(\phi\in({\mathrm{L}}^p(G))'\) ein \(g\in{\mathrm L}^q(G)\), so daß für alle \(f\in{\mathrm L}^p(G)\). \[\langle\phi,f\rangle = {\pmb(f,g\pmb)} = \int_G f(x)\overline{g(x)}\,\mathrm dx\] gilt.

Beweisskizze für beschränktes \(G\). Wir nehmen an, daß \(\boldsymbol{|}G\boldsymbol{|}<\infty\) gilt und in einem ersten Schritt auch, daß \(1< p\le 2\) gilt. Dann ist die Einbettung \({\mathrm L}^2(G)\hookrightarrow {\mathrm{L}}^p(G)\) stetig und jede Linearform \(\phi\in ({\mathrm{L}}^p(G))'\) bestimmt eine Linearform auf dem \({\mathrm L}^2(G)\). Es existiert also ein \(g\in{\mathrm L}^2(G)\), so daß für jedes \(f\in L^p(G)\cap L^2(G)\) \[\langle \phi,f \rangle = {\pmb(f,g\pmb)} = \int_G f(x)\overline{g(x)}\,\mathrm dx\] gilt. Um zu zeigen, daß \(g\in{\mathrm L}^{q}(G)\) gilt, betrachten wir für ein \(N>0\) die Funktion \[f(x) = \begin{cases} |g(x)|^{q-2}{g(x)} ,\qquad & |g(x)|\le N, \\ 0 ,\qquad & \text{sonst.} \end{cases}\] Bezeichne \(G_N = \mathop{\mathrm{supp}}f \subseteq \{ x\in G : |g(x)|\le N\}\). Damit gilt \[\begin{aligned} \int_{G_N} {|g(x)|^q}\,\mathrm dx = \langle \phi, f\rangle \le \|\phi\| \left(\int |f(x)|^p \,\mathrm dx\right)^{1/p} = \|\phi\| \left( \int_{G_N} |g(x)|^{p(q-1)} \,\mathrm dx\right)^{1/p}.\end{aligned}\] Unter Ausnutzung von \(p(q-1)=q\) und für \(N\to\infty\) folgt die Behauptung \(\|g\|_{q}\le\|\phi\|\). Umgekehrt bestimmt nach der Hölderschen Ungleichung jede Funktion \(g\in {\mathrm L}^q(G)\) eine Linearform mit \(\|\phi\|\le \|g\|_q\). \(\bullet\qquad\)

Für \(p=1\) gehen wir analog vor, zeigen die essentielle Beschränktheit aber indirekt. Angenommen, das wie oben konstruierte \(g\in{\mathrm L}^2(G)\) gehört nicht zu \({\mathrm L}^\infty(G)\). Dann existiert zu jedem \(N>0\) eine Menge \(G_N\) positiven Maßes mit \(|g(x)|>N\) auf \(G_N\). Speziell mit \[f(x) = \begin{cases} {\boldsymbol{|}G_N\boldsymbol{|}}^{-1} {\mathrm e}^{-\mathrm i\arg g(x)} ,\qquad & x\in G_N, \\0,&\text{sonst,}\end{cases}\] folgt dann \(\|f\|_1=1\) und damit der Widerspruch \[\|\phi\| = \|\phi\| \|f\|_1 \ge \langle\phi,f\rangle = \frac1{\boldsymbol{|}G_N\boldsymbol{|}} \int_{G_N} |g(x)| \,\mathrm dx \ge N.\] Also folgt \(g\in{\mathrm L}^\infty(G)\). \(\bullet\qquad\)

Für Gebiete nicht endlichen Maßes oder allgemeiner für \(\sigma\)-endliche Maßräume kann man obige Konstruktion für eine ausschöpfende Folge von Teilmengen endlichen Maßes anwenden.

Für \(p>2\) kann man den Beweis nicht direkt auf den Hilbertraumfall zurückführen; oft wird die Funktion \(g\) mit dem Satz von Radon–Nikodym konstruiert und danach die Beweisidee vom ersten Teil genutzt. Wir zeigen im nächsten Kapitel die Reflexivität direkt. ◻

Für \(p=\infty\) ist die Aussage falsch. Es existieren also Linearformen auf \({\mathrm L}^\infty(G)\), die nicht durch eine Funktion aus \({\mathrm L}^1(G)\) dargestellt werden können. Dies gilt schon, wenn man sich auf den abgeschlossenen Teilraum der stetigen Funktionen beschränkt; für diesen soll nachfolgend der Dualraum konstruiert werden.

Dafür benötigen benötigen wir noch einige Bezeichnungen. Sei \((X,d)\) metrischer Raum. Bezeichne weiter \(\mathbb M_+(X)\) die Menge aller positiven Radonmaße28 auf \(X\), also aller auf der Borel-Sigmaalgebra \(\mathcal B(X)\) definierten Funktionen \[\mu : \mathcal B(X) \to \mathbb R_+\cup\{\infty\}\] mit \(\mu(\varnothing)=0\) und \(\mu\left(\bigcup_j E_j\right) = \sum_j \mu(E_j)\) für jede abzählbare Familie \((E_j)\subset\mathcal B(X)\) paarweise disjunkter Mengen \(E_j\cap E_k=\varnothing\), \(i\ne k\), die zusätzlich

Weiter benötigen wir \(\mathbb K\)-wertige Maße. Es sei \(\mathbb M_\mathbb R(X)\) die Menge aller Differenzen positiver Maße, also \(\mathbb M_\mathbb R(X) = \{ \mu_+ - \mu_- \mid \mu_\pm \in \mathbb M_+(X)\}\) und für \(\mu = \mu_+-\mu_-\) sei \[|\mu| = \inf\{ \mu_+ + \mu_- : \mu=\mu_+-\mu_-, \; \mu_\pm\in \mathbb M_+(X)\}\in\mathbb M(X)\] die Totalvariation des Maßes. Daß das Infimum existiert und auch angenommen wird, folgt aus dem Beweis des nachfolgenden Darstellungssatzes. Weiter sei \(\mathbb M(X) = \mathbb M_\mathbb R(X)\otimes\mathbb C\). Wir werden ebenso zeigen, daß zu jedem \(\mu\in\mathbb M(X)\) ein eindeutig bestimmtes Maß \(|\mu|\in\mathbb M_+(X)\) und eine \(|\mu|\)-f.ü. eindeutig bestimmte meßbare Funktion \(\theta :X\to \mathbb R\) mit \[\mu = {\mathrm e}^{\mathrm i\theta(x)} |\mu|\] existiert. Das Maß \(|\mu|\) wird wieder als Totalvariation von \(\mu\) bezeichnet. Ist \((X,d)\) kompakt, so ist der Raum \(\mathbb M(X)\) ein normierter Raum mit der Norm \[\|\mu\| = \int_X \mathrm d |\mu|.\] Auch dies folgt aus dem Darstellungssatz.

Satz 2.21 (Rieszscher29 Darstellungssatz). Sei \((X,d)\) kompakter metrischer Raum. Dann existiert zu jeder stetigen Linearform \(\phi : \mathrm C(X)\to \mathbb K\) ein Radonmaß \(\mu\in\mathbb M(X)\) mit \[\langle\phi,f\rangle = \int_X f(x) \,\mathrm d\mu(x),\qquad f\in\mathrm C(X).\] Dabei gilt \(\|\phi\|=\|\mu\|\) und somit \((\mathrm C(X))'=\mathbb M(X)\).

Proof. Wir beweisen dies in mehreren Teilen. Zuerst definieren wir den Begriff der positiven Linearform und zeigen, daß diese durch positive Radonmaße dargestellt werden. Dann in einem zweiten Teil zerlegen wir reelle Linearformen als Differenz positiver und in einem dritten Teil betrachten wir komplexe Linearformen und zeigen die Isometrie.

Teil 1. Schritt 1. Eine Linearform \(\phi\in(\mathrm C(X))'\) heißt positiv, falls \(\langle \phi,f\rangle\ge0\) für alle stetigen und nichtnegativen Funktionen \(f\) gilt. Für positive Linearformen gilt \(\|\phi\|=\langle\phi,1\rangle\).

Ist \(\phi\) positiv, so kann man durch \[\mu (U) = \sup \{ \langle \phi, f\rangle \;|\; f\le 1,\; \mathop{\mathrm{supp}}f\subseteq U \}\] eine Funktion auf den offenen Teilmengen \(U\subseteq X\) definieren. Diese ist nichtnegativ, erfüllt \(\mu(\varnothing)=0\), ist monoton und subadditiv. Letzteres zeigt man wie folgt: Angenommen, \(U=U_1\cup\cdots\cup U_n\) und \(f\in \mathrm C(X)\) mit \(\mathop{\mathrm{supp}}f\subseteq U\). Sei weiter \(h_j\) eine Partition der Eins, \(\sum h_j(x) = 1\) auf \(\mathop{\mathrm{supp}}f\) und \(\mathop{\mathrm{supp}}h_j\subseteq U_j\). Dann gilt \[\langle\phi, f\rangle = \sum_j \langle \phi, h_jf\rangle \le \sum_j \mu(U_j)\] und nach Supremumsbildung über \(f\) folgt \(\mu(U)\le \sum_j \mu(U_j)\).

Wir zeigen, daß \(\mu\) ein Borelmaß bestimmt, sich \(\mu\) also (mindestens) auf die Borelalgebra fortsetzen läßt.

Schritt 2: \(\mu\) ist \(\sigma\)-subadditiv. Sei dazu \(U_j\) eine abzählbare Familie offener Mengen und \(U=\bigcup_j U_j\). Dann gibt es auf Grund der Kompaktheit von \(X\) für jede Funktion \(f\in \mathrm C(X)\) mit \(\mathop{\mathrm{supp}}f\subseteq U\) und \(f\le 1\) eine endliche Teilfamilie \(U_{j_1},\ldots, U_{j_n}\), welche schon \(\mathop{\mathrm{supp}}f\) überdeckt. Also folgt mit einer entsprechenden Partition der Eins \[\langle\phi, f\rangle = \sum_{k=1}^n \langle\phi, h_{j_k} f\rangle\le \sum_{k=1}^n \mu(U_{j_k}) \le \sum_j \mu(U_j)\] und nach Supremumsbildung über alle solchen \(f\) \[\mu\bigg(\bigcup_j U_j\bigg) \le \sum_{j} \mu(U_j).\] Damit ist \(\mu\) auf offenen Mengen \(\sigma\)-subadditiv.

Schritt 3: äußeres Maß. Mit Hilfe von \(\mu\) definiert man für beliebige Teilmengen \(E\subseteq X\) \[\mu^*(E) = \inf_{E\subseteq U,\;\text{$U$ offen}} \mu(U)\] und erhält dadurch ein äußeres Maß. Nach Konstruktion gilt \(\mu^*(\varnothing)=0\), ist \(\mu^*\) monoton und \(\sigma\)-subadditiv. Letzteres sieht man wie folgt. Sei \(E=\bigcup_j E_j\) für eine Folge \(E_j\subseteq X\). Dann existieren zu gegenem \(\varepsilon>0\) nach Konstruktion offene Mengen \(U_j\) mit \(E_j\subset U_j\) und \[\mu(U_j) \le \mu^*(E_j) + \varepsilon 2^{-j}.\] Also folgt mit \(U=\bigcup_j U_j\) \[\mu^*(E) \le \mu(U) \le \sum_{j=1}^\infty \mu(U_j) \le \varepsilon+ \sum_{j=1}^\infty \mu^*(E_j)\] und da \(\varepsilon\) beliebig war, folgt \(\sigma\)-Subadditivität.

Schritt 4: \(\mu^*\) ist auf Kompakta additiv. Seien \(K_1,K_2\subseteq X\) kompakt und \(K_1\cap K_2=\varnothing\). Dann existiert nach Konstruktion von \(\mu^*\) zu jedem \(\varepsilon>0\) und jeder offenen Menge \(W\supset K_1\cup K_2\) eine stetige Funktion \(f\in\mathrm C(X)\) mit \(0\le f(x) \le 1\), \(f(x)=1\) in einer Umgebung von \(K_1\cup K_2\), \(\mathop{\mathrm{supp}}f\subseteq W\) und \[\mu^*(K_1\cup K_2) \le \langle\phi,f\rangle\le \mu^*(K_1\cup K_2)+\varepsilon.\] Dabei kann \(W = U_1\cup U_2\) mit disjunkten offenen Umgebungen \(U_i\supset K_i\) gewählt werden. Schreibt man \(f=f_1+f_2\) mit \(\mathop{\mathrm{supp}}f_i\subseteq U_i\), so folgt \[\mu^*(K_i) \le \langle \phi,f_i\rangle\] und damit \[\mu^*(K_1) + \mu^*(K_2) \le \langle \phi, f_1+f_2) = \langle\phi,f\rangle \le \mu^*(K_1\cup K_2)+\varepsilon.\] Da \(\varepsilon\) beliebig war folgt die Additivität von \(\mu^*\) auf Kompakta.

Schritt 5: inneres Maß. Damit kann man sich nun ebenso ein inneres Maß \[\mu_*(E) = \sup_{K\subseteq E,\; \text{$K$ kompakt}} \mu^*(K)\] konstruieren. Für jede Teilmenge \(E\subseteq X\) gilt \(\mu_*(E)\le \mu^*(E)\). Bezeichne nun \[\mathcal M = \{ E \subseteq X\;|\; \mu_*(E)=\mu^*(E) \}.\]

Schritt 6: alle offenen Mengen gehören zu \(\mathcal M\). Sei \(U\subseteq X\) offen. Dann existiert zu jedem \(\varepsilon>0\) ein \(f\in\mathrm C(X)\), \(\mathop{\mathrm{supp}}f\subseteq U\) und \(f\le 1\), mit \[\mu(U) - \varepsilon\le \langle\phi,f\rangle.\] Sei nun \(K=\mathop{\mathrm{supp}}f\). Dann folgt \[\mu(U)-\varepsilon\le \langle\phi,f\rangle \le \inf_{K\subseteq V, \text{$V$ offen}} \mu(V) = \mu^*(K) \le \mu_*(U)\le \mu^*(U) = \mu(U).\] Da \(\varepsilon\) beliebig war, folgt \(\mu_*(U)=\mu^*(U)\) und \(U\in\mathcal M\).

Schritt 7: \(\mu^*\) ist \(\sigma\)-additiv auf \(\mathcal M\). Nach Konstruktion ist \(\mu^*\) schon \(\sigma\)-subadditiv. Es genügt damit, die umgekehrte Ungleichung zu beweisen. Sei \(E_j\in \mathcal M\) eine abzählbare Familie paarweise disjunkter Mengen. Sei weiter \(\varepsilon>0\). Dann existieren Kompakta \(H_j\) mit \(H_j\subseteq E_j\) und \[\mu^*(E_j) \le \mu^*(H_j) + 2^{-j} \varepsilon.\] Die Mengen \(H_j\) sind nach Konstruktion paarweise disjunkt und \[K_n = \bigcup_{j=1}^n H_j\] ist kompakt. Da \(K_n\subseteq E=\bigcup_j E_j\) gilt, folgt \[\sum_{j=1}^n \mu^*(E_j) \le \sum_{j=1}^n \mu^*(H_j) + \varepsilon= \mu^*(K_n) +\varepsilon\le \mu_*(E)+\varepsilon\] und damit zusammen mit der \(\sigma\)-Subadditivität des äußeren Maßes \[\sum_j \mu^*(E_j) \le \mu_*(E) \le \mu^*(E) \le \sum_j \mu^*(E_j).\] Damit ist \(E\in\mathcal M\) und \(\mu^*\) auch \(\sigma\)-additiv.

Schritt 8: \(\mu^*\) ist regulär. Sei \(E\in\mathcal M\) und sei \(\varepsilon>0\). Dann existiert nach Konstruktion eine offene Menge \(U\subseteq X\) mit \(E\subseteq U\) und eine kompakte Menge \(K\subseteq E\), so daß \[\mu^*(U) - \varepsilon/2 < \mu^*(E) < \mu^*(K) +\varepsilon/2.\] Insbesondere gilt also (da \(U\setminus K\) und \(K\) beide zu \(\mathcal M\) gehören und wir somit Additivität nutzen können) \[\label{eq:KEU-ineq} K\subseteq E\subseteq U,\qquad \mu^*(U\setminus K) = \mu^*(U) -\mu^*(K) < \varepsilon.\]

Schritt 9: \(\mathcal M\) ist \(\sigma\)-Algebra. Wir haben schon gezeigt, daß \(\mathcal M\) unter abzählbaren disjunkten Vereinigungen abgeschlossen ist. Weiter enthält \(\mathcal M\) nach Konstruktion alle kompakten Teilmengen und alle offenen Teilmengen von \(X\), speziall also auch \(\varnothing, X\in\mathcal M\). Es genügt damit zu zeigen, daß \(\mathcal M\) unter Differenzbildung abgeschlossen ist. Seien also \(E_1,E_2\in\mathcal M\). Dann finden wir zu gegebenem \(\varepsilon>0\) Kompakta \(K_i\) und offene Mengen \(U_i\) mit [eq:KEU-ineq]. Damit impliziert \[E_2\setminus E_1 \subseteq U_2\setminus K_1 \subseteq (U_2\setminus K_2) \cup (K_2\setminus U_1) \cup (U_1\setminus K_1)\] aber (da \(K_2\setminus U_1\) kompakt ist) \[\mu^*(E_2\setminus E_1) < \mu^*(K_2\setminus U_1) +2\varepsilon< \mu_*(E_2\setminus E_1) + 2\varepsilon.\] Da \(\varepsilon\) beliebig war, folgt \(\mu^*(E_2\setminus E_1)=\mu_*(E_2\setminus E_1)\) und \(E_2\setminus E_1\in\mathcal M\). Damit ist \(\mathcal M\) eine \(\sigma\)-Algebra, welche die Borelalgebra \(\mathcal B(X)\) enthält.

Schritt 10: \(\mu\) stellt \(\phi\) dar. Sei \(\mu\) definiert durch \(\mu(E)=\mu_*(E)=\mu^*(E)\) für alle \(E\in \mathcal B(X)\subseteq \mathcal M\). Nach Konstruktion gilt mit diesem Maß die Darstellung \[\langle\phi,f\rangle = \int_X f(x) \,\mathrm d\mu(x)\] für alle \(f\in \mathrm C(X)\). Nach Konstruktion des Integrals genügt es, dies für Funktionen \(f\ge0\) zu zeigen. Sei \(M=\max_{x\in X} f(x)\) und \(\varepsilon>0\). Seien weiter \(0=y_0<y_1<\cdots<y_m=M\) so gewählt, daß \(y_{j+1}-y_j < \varepsilon\) gilt. Dann sind die Mengen \[E_j = \{ x\in X : y_{j-1} < f(x) \le y_j \} \in \mathcal B(X) \subseteq \mathcal M, \qquad j=1,\ldots,m\] meßbar und es existieren Kompakta \(K_j\) und offene Mengen \(U_j\) mit \[K_j \subseteq E_j \subseteq U_j,\qquad \mu(U_j\setminus K_j) \le \varepsilon/m.\] Sei weiter \(h_j\) eine der Familie \(U_j\) untergeordnete Partition der Eins. Dann gilt \(h_j(x) f(x) \le (y_j+\varepsilon) h_j(x)\) und \(\mathop{\mathrm{supp}}h_j\subseteq U_j\) und somit \[\begin{aligned} \langle\phi, f\rangle &= \sum_{j=1}^m \langle \phi, h_j f\rangle \le \sum_{j=1}^m (y_j+\varepsilon) \langle\phi,h_j\rangle \\ &\le \sum_{j=1}^m (y_j+\varepsilon) \mu(U_j) \le \sum_{j=1}^m (y_j+\varepsilon) (\mu(E_j)+\varepsilon/m ),\qquad \text{und da $y_j\le f(x)+\varepsilon$ auf $E_j$}\\ &\le \int_{\mathop{\mathrm{supp}}f} f(x) \,\mathrm d\mu(x) +2\varepsilon\mu(\mathop{\mathrm{supp}}f) + \frac\varepsilon m \sum_{j=1}^m (y_j+\varepsilon) \\ & \le \int_{\mathop{\mathrm{supp}}f} f(x) \,\mathrm d\mu(x) + (M+\varepsilon)\varepsilon+ 2\varepsilon\mu(\mathop{\mathrm{supp}}f).\end{aligned}\] Da \(\varepsilon>0\) beliebig war, folgt \(\langle\phi,f\rangle\le \int_X f(x)\,\mathrm d\mu(x)\). Für die umgekehrte Ungleichung betrachtet man die Funktion \(g(x) = M-f(x)\). Diese erfüllt ebenso \(g(x)\ge0\) und damit \[\langle\phi,M\rangle- \langle\phi,f\rangle = \langle \phi,g\rangle \le \int_X g(x) \,\mathrm d\mu(x) =\langle\phi,M\rangle - \int_X f(x)\,\mathrm d\mu(x),\] also gilt \[\langle\phi,f\rangle = \int_X f(x)\,\mathrm d\mu(x)\] für alle \(f\in \mathrm C(X)\), \(f\ge0\), mit Linearität für alle \(f\in\mathrm C(X)\).

Weiter gilt \(\|\phi\| = \langle \phi,1\rangle = \mu(X)= \|\mu\|\).

Teil 2. Schritt 1: Totalvariation eines Funktionals. Sei nun \(\phi\in(\mathrm C(X))'\) beliebig und sei \(|\phi|\) definiert als \[\label{eq:RieszBew-TotVarPhi} |\phi| (f) := \sup \{ |\langle\phi,h\rangle| ; h\in\mathrm C(X),\; |h(x)| \le f(x) \},\qquad f\ge0 .\] Dann gilt \(|\phi|(1)=\|\phi\|\). Weiter ist \(|\phi|\) offenbar positiv homogen, \(|\phi|(cf) = c|\phi|(f)\) für \(c>0\), und wie wir noch zeigen additiv, \(|\phi|(f_1+f_2)= |\phi|(f_1)+|\phi|(f_2)\), auf nichtnegativen Funktionen. Das ist aber alles, was wir im ersten Teil genutzt haben, um \(|\phi|\) als Maß darzustellen. Es folgt also \(|\phi|\in (\mathrm C(X))'\) und \[|\phi|(f) = \int_X f(x) \,\mathrm d|\mu|(x)\] sowie \(\|\phi\|=|\mu|(X)\). Wir bezeichnen \(|\phi|\) als Totalvariation des Funktionals \(\phi\) und \(|\mu|\) als Totalvariation des Maßes \(\mu\).

Bleibt die Additivität. Seien für \(j=1,2\) stetige Funktionen \(f_j \ge0\) gegeben, \(\varepsilon>0\) und \(h_j\in\mathrm C(X)\) mit \(|h_j(x)|\le f_j(x)\) zusammen mit \(|\langle \phi,h_j\rangle|\ge |\phi|(f_j)-\varepsilon/2\). Dann folgt mit \(|\langle\phi,h_j\rangle| = {\mathrm e}^{\mathrm i\theta_j} \langle\phi,h_j\rangle\) \[\begin{split} 0 \le |\phi|(f_1)+|\phi|(f_2) &\le | \langle\phi, h_1\rangle| + |\langle\phi,h_2\rangle| + \varepsilon= {\mathrm e}^{\mathrm i\theta_1} \langle\phi, h_1\rangle + {\mathrm e}^{\mathrm i\theta_2} \langle\phi, h_2\rangle + \varepsilon\\ & = \langle\phi, {\mathrm e}^{\mathrm i\theta_1}h_1+ {\mathrm e}^{\mathrm i\theta_2}h_2\rangle \le |\phi|(f_1+f_2)+\varepsilon, \end{split}\] da \(| {\mathrm e}^{\mathrm i\theta_1}h_1(x)+ {\mathrm e}^{\mathrm i\theta_2}h_2(x) | \le |h_1(x)|+|h_2(x)| \le f_1(x)+f_2(x)\) gilt. Da \(\varepsilon>0\) beliebig war, folgt Superadditivität. Umgekehrt gilt für jedes \(h\in\mathrm C(x)\) mit \(|h(x)|\le f_1(x)+f_2(x)=:f(x)\) und \(V = \{x \mid f(x)\ne0\}\) für \[h_j(x) =\begin{cases} \frac{f_j(x)}{f(x)} h(x),\qquad &x\in V,\\ 0,&\text{sonst} \end{cases}\] stets \(h_j\in\mathrm C(X)\) (da \(h(x)=0\) auf \(\mathbb R\setminus V\) und ebenso für jeden Randpunkt von \(V\)) und \(|h_k(x)|\le f_k(x)\) (da \(|h(x)|\le f(x)\)). Also folgt aus \(h=h_1+h_2\) \[| \langle \phi,h\rangle | = |\langle\phi, h_1\rangle + \langle\phi,h_2\rangle| \le |\langle\phi, h_1\rangle| + |\langle\phi,h_2\rangle| \le |\phi|(f_1)+|\phi|(f_2)\] und die Additivität von \(|\phi|\) folgt.

Im reellen Fall folgt, daß \(\phi = |\phi| - (|\phi|-\phi)\) als Differenz zweier positiver Maße darstellbar ist.

Schritt 2: Isometrie. Sei nun \(f\in\mathrm C(X)\) beliebig. Da dann \(f\) (als \(h\)) in die Definition von \(|\phi|(|f|)\) eingesetzt werden kann, folgt \(| \langle\phi,f\rangle| \le \langle |\phi|, |f| \rangle\) und somit \[| \langle\phi,f\rangle | \le \int_X |f(x)| \,\mathrm d|\mu|(x).\] Damit ist \(\phi\) zu einer stetigen Linearform auf \({\mathrm L}^1(X,|\mu|)\) mit Norm \(\le 1\) fortsetzbar. Nach Satz Satz 2.20 (allerdings für Maßräume) existiert damit ein \(\rho\in{\mathrm L}^\infty(X,|\mu|)\) mit \(\|\rho\|_\infty\le 1\) und \[\langle\phi,f\rangle = \int_X f(x) \rho(x) \,\mathrm d|\mu|(x).\] Weiter ist \[\|\phi\| = |\phi|(1) = \sup_{|h(x)|\le 1} |\langle\phi,h\rangle| \le \int_X |\rho(x)| \,\mathrm d|\mu|(x) \le\int_X \,\mathrm d|\mu|(x) =|\mu|(X) = \|\phi\|\] und damit \(|\rho(x)|=1\) für \(|\mu|\)-fast alle \(x\). Sei \(\mu = \rho(x) |\mu| \in \mathbb M(X)\). Dann stellt \(\mu\) das Funktional \(\phi\) dar und \(\|\mu\|= |\mu|(X) = \|\phi\|\). ◻

Da damit für reelle Maße \(\rho(x) \in \{\pm1\}\) für \(|\mu|\)-fast alle \(x\) gilt, beweist Schritt 2 aus Teil 2 insbesondere die Hahn–Jordan30-Zerlegung reeller Maße. Dabei ist einfach \(\mu_\pm = 1_{\{\rho(x)=\pm 1\}}(x) \mu\).

Korollar 2.22 (Jordan–Hahn-Zerlegung). Sei \(\mu\in \mathbb M_\mathbb R(X)\). Dann existieren eindeutig bestimmte positive Maße \(\mu_+,\mu_-\in\mathbb M_+(X)\) mit stets \(\mu=\mu_+-\mu_-\), \(|\mu|=\mu_++\mu_-\) und \(\mu_+\perp\mu_-\).

Für komplexe Maße ergibt sich entsprechend die Polarzerlegung

Korollar 2.23 (Polarzerlegung). Sei \(\mu\in \mathbb M(X)\) beliebig. Dann existieren ein eindeutig bestimmtes positives Maß \(|\mu|\in\mathbb M_+(X)\) und eine \(|\mu|\)-fast überall eindeutig bestimmte \(|\mu|\)-meßbare Funktion \(\theta:X\to\mathbb R\mod 2\pi\) mit \(\mu = {\mathrm e}^{\mathrm i\theta} |\mu|\).

Ohne Voraussetzung der Kompaktheit an \((X,d)\) gelten schwächere Resultate. Auf allgemeinen metrischen Räumen sind der Raum der im im Unendlichen verschwindenden stetigen Funktionen \({\mathrm C}_0(X)\) (also der Abschluß der Menge der kompakt getragenen stetigen Funktionen in der Supremumsnorm) und der Raum der Radonmaße endlicher Totalvariation \(\mathbb M_b(X)\) zueinander dual.

2.3 Reflexivität

Im letzten Abschnitt haben wir gesehen, daß jeder Hilbertraum \(H\) isometrisch anti-isomorph zu seinem Dual \(H'\) ist, insbesondere also \(H\) und \(H''\) kanonisch isomorph sind, \[\label{eq:dual} \langle\phi,x\rangle = {\pmb(x,y_\phi\pmb)} = \langle x,\phi \rangle .\] Andererseits kann man für beliebige normierte Räume vermittels \(\langle\phi,x\rangle = \langle x,\phi \rangle\) eine Einbettung von \(V\) in sein doppeltes Dual \(V''\) definieren. Dabei ist offenbar \(\|x\|_{V''}\leq \|x\|\) und mit dem Satz von Hahn–Banach \(\|x\|_{V''}=\|x\|\).

Definition 2.24. Ein Banachraum \(V\) heißt reflexiv, falls die Einbettung \(V\hookrightarrow V''\) surjektiv und damit ein (isometrischer) Isomorphismus ist.

Die Voraussetzung der Vollständigkeit folgt aus der Darstellung als Dualraum. Die Bedingung die wirklich notwendig ist, ist die Surjektivität der Einbettung.

Beispiel 2.25. Jeder endlichdimensionale Raum ist reflexiv, da die Dimension von \(V\) und \(V'\) übereinstimmt, die Einbettung \(V\hookrightarrow V''\) also surjektiv sein muß.

Beispiel 2.26. Jeder Hilbertraum \(H\) ist reflexiv.

Beispiel 2.27. Die Folgenräume \(\ell^p\) mit \(1<p<\infty\) sind reflexiv.

Satz 2.28.

  1. Jeder abgeschlossene Teilraum eines reflexiven Raumes ist reflexiv.

  2. Entweder ist der Banachraum \(V\) reflexiv, oder jeder der Räume \[V,\quad V'',\quad V^{(4)},\quad\ldots\] ist ein echter Teilraum des nachfolgenden.

  3. Ein Banachraum \(V\) ist reflexiv genau dann, wenn sein Dual \(V'\) reflexiv ist.

Proof.  (1) Sei \(V\) reflexiv und \(U\subseteq V\) abgeschlossener Teilraum. Sei \(u''\in U''\). Dann ist die Abbildung \(V'\ni\phi\mapsto \langle u'',\phi|_U\rangle\) wegen \[|\langle u'',\phi|_U\rangle|\leq\|u''\|\,\|\phi|_U\|\leq\|u''\|\,\|\phi\|\] ein Element von \(V''\). Es existiert also ein \(x\in V\) mit \[\langle\phi,x\rangle = \langle u'',\phi|_U\rangle,\qquad\forall \phi\in V'.\] Wäre \(x\not\in U\), so gäbe es nach dem Satz von Hahn–Banach ein Funktional \(\psi\in V'\) mit \(\langle\psi,x\rangle=1\) und \(\psi|_U=0\). Widerspruch!

Sei nun \(u'\in U'\) und \(\phi\in V'\) eine Fortsetzung von \(u'\) auf \(V\). Dann gilt \[\langle u'',u'\rangle =\langle u'',\phi|_U\rangle =\langle\phi,x\rangle = \langle u',x\rangle\] und damit ist \(u''\) das Bild von \(x\) unter der Einbettung \(U\hookrightarrow U''\). \(\bullet\qquad\) (2) folgt direkt aus Aussage (1). \(\bullet\qquad\) (3) folgt aus Aussage (2). ◻

Beispiel 2.29. Der Raum \(\ell^1\) kann nicht reflexiv sein, da er sowohl Dual von \(\mathfrak c\) als auch von seinem abgeschlossenen Teilraum \(\mathfrak c_0\) ist, beide aber nicht isometrisch isomorph sind.

Zum Beweis des nachfolgenden Kriteriums für Reflexivität benötigen wir eine Hilfsaussage.

Lemma 2.30 (Helly31). Sei \(V\) normierter Raum und \(u''\in V''\) ein Element des Biduals. Sei weiter \(S\subseteq V'\) ein endlichdimensionaler Teilraum des Duals und \(\varepsilon>0\). Dann existiert ein \(x\in V\) mit \(\|x\|\le \|u''\|+\varepsilon\) und \[\langle \phi,x\rangle = \langle u'',\phi\rangle\] für alle \(\phi\in S\).

Proof. Der Satz ist im wesentlichen lineare Algebra: Da \(S\) endlichdimensional ist, ist der Quotientenraum \(V/T\) für \(T= \{ x\in V \;|\;\forall {\phi\in S}:\langle \phi,x\rangle=0\}\) (algebraisch isomorph zu \(S\) und damit) endlichdimensional. Also gilt \(V/T=(V/T)''\). Jedem \(\Phi\in (V/T)'\) ist durch \(\langle \phi,x\rangle =\langle \Phi, x+T\rangle\) ein \(\phi\in V'\) zugeordnet, man kann \(u''\) also ein Element \(U\in (V/T)''\) zuordnen. Dabei gilt \(\|U\|\le \|u''\|\). Damit gilt aber \(U = y+ T \in V/T\) und \(\|U\|=\inf_{z\in T} \|y+z \| \le \|u''\|\). Also existiert ein \(x=y+z\) mit \(\|x\| \le \|u''\|+\varepsilon\). ◻

Ein Banachraum \(V\) heißt gleichmäßig konvex, falls es zu jedem \(\varepsilon>0\) ein \(\delta>0\) gibt, so daß für alle \(x,y\in V\) \[\|x\|=\|y\|=1\quad\text{und}\quad \| \textstyle\frac12 (x+y) \| \ge 1-\delta \qquad\text{impliziert}\qquad \|x-y\|\le \varepsilon\] gilt.

Satz 2.31 (Milman32–Pettis33). Jeder gleichmäßig konvexe Banachraum ist reflexiv.

Proof. Sei \(V\) gleichmäßig konvex. Wir zeigen, daß die Einbettung \(V\hookrightarrow V''\) in sein Bidual surjektiv ist. Sei dazu \(u''\in V''\) mit \(\|u''\|=1\) sowie \(\phi_k\in V'\) eine Folge mit \(\|\phi_k\|=1\) und \(1-1/k < \langle u'',\phi_k\rangle \le 1\). Nach dem Lemma von Helly existiert damit zu jedem \(n\) ein \(x_n\in V\) mit \(\|x_n\|\le 1+1/n\) und \[\langle\phi_k, x_n\rangle = \langle u'',\phi_k\rangle ,\qquad k=1,\ldots,n.\] Insbesondere gilt also für \(n\le m\) \[\textstyle 2- 2/n \le \langle \phi_n, x_n+ x_m \rangle \le \|x_n + x_m \| \le 2 + 2/n\] und somit \(\|x_n+x_m\|\to 2\). Da ebenso \(\|x_n\|\to1\) gilt, folgt aus der gleichmäßigen Konvexität die Cauchyfolgeneigenschaft. Damit konvergiert \(x_n\to x\) in \(V\) und erfüllt \(\langle\phi_k, x\rangle=\langle u'',\phi_k\rangle\) für alle \(k\).

Das so konstruierte Element \(x\) ist eindeutig bestimmt. Wählt man andere \(x_n\) und bezeichnet den Grenzwert mit \(x_*\), so würde die Folge \(x,x_*,x,x_*,\ldots\) ebenso alle Bedingungen erfüllen. Damit ist sie konvergent und \(x=x_*\). Dies nutzt man nun, um \(\langle \phi,x\rangle=\langle u'',\phi\rangle\) für alle \(\phi\) zu zeigen. Dazu betrachtet man die Folge \(\phi,\phi_1,\phi_2,\ldots\) und wendet obige Konstruktion an. Dies liefert wiederum dasselbe \(x\in V\) und damit \(u''=x\). Also ist \(V\) reflexiv. ◻

Beispiel 2.32. Die Räume \({\mathrm{L}}^p(G)\) sind für \(1<p<\infty\) gleichmäßig konvex und damit reflexiv.

Proof. Dies folgt aus den Clarksonschen34 Ungleichungen für Funktionen \(u,v\in{\mathrm{L}}^p(G)\), \[\|u+v\|_p^q + \|u-v\|_p^q \le 2 ( \|u\|_p^p+\|v\|_p^p )^{q-1}\] für \(1<p\le 2\) und \(q\) dem zu \(p\) dualen Index, sowie \[\|u+v\|_p^p + \|u-v\|_p^p \le 2^{p-1} ( \|u\|_p^p+\|v\|_p^p )\] für \(2\le p<\infty\). Für einen Beweis siehe Hirzebruch–Scharlau, §17. ◻

Gleichmäßige Konvexität erlaubt das Studium von Bestapproximationen und impliziert die Normkonvergenz von Minimalfolgen. Beweise dafür sind ähnlich denen für Hilberträume und zum Beispiel im Buch von Heuser zu finden.

2.4 Schwache Konvergenz

Wir haben gesehen, daß die Elemente aus \(V'\) punktetrennend in \(V\) sind. Damit kann man durch die Seminormen \[p_\phi(x)=|\langle\phi,x\rangle|,\qquad \phi\in V'\] auf \(V\) eine lokalkonvexe Topologie definieren. Diese wird als Topologie der schwachen Konvergenz bezeichnet.

Definition 2.33. Sei \(x_n\in V\) eine Folge aus \(V\). Dann heißt \((x_n)\) schwach konvergent gegen \(x\in V\), in Zeichen \(x_n\rightharpoonup x\), falls für alle \(\phi\in V'\) \[\langle\phi,x_n\rangle \to \langle \phi,x\rangle\] konvergiert.

Proposition 2.34.

  1. \(x_n \rightharpoonup x\) und \(y_n\rightharpoonup y\) impliziert \(x_n+y_n\rightharpoonup x+y\).

  2. \(x_n \rightharpoonup x\) und \(\alpha_n\to\alpha\) impliziert \(\alpha_nx_n \rightharpoonup\alpha x\).

  3. \(x_n\to x\) impliziert \(x_n\rightharpoonup x\).

Beispiel 2.35. Sei \(V=\ell^2\). Dann gilt für \({\mathbf e}_n=(0,0,\ldots,1,0\ldots)\) und \(\phi\in(\ell^2)'\), dargestellt durch \((y_n)\) \[\langle \phi,{\mathbf e}_n \rangle = y_n \to 0\] für \(n\to\infty\). Also gilt \({\mathbf e}_n\rightharpoonup0\), obwohl \(\|{\mathbf e}_n\|=1\).

Satz 2.36. Sei \(H\) Hilbertraum und konvergiere \(x_n\rightharpoonup x\) schwach. Gilt dann \(\|x_n\|\to\|x\|\), so folgt \(x_n\to x\).

Proof. Es gilt \[\|x_n-x\|^2=(x_n-x,x_n-x)=\|x\|^2+\|x_n\|^2-2\Re{\pmb(x_n,x\pmb)}\to \|x\|^2+\|x\|^2-2\|x\|^2=0.\] ◻

Satz 2.37. Sei \(V\) normierter Raum. Dann ist jede Folge \((x_n)\), die schwach beschränkt ist, also \[\sup_n | \langle \phi,x_n\rangle | < \infty\] für alle \(\phi\in V'\) erfüllt, auch in der Norm beschränkt.

Proof. Wir betrachten die Operatorfolge \(A_n\phi = \langle\phi,x_n\rangle\). Diese ist nach Voraussetzung in \(\mathcal L(V',\mathbb K)\) punktweise beschränkt, nach dem Prinzip von der gleichmäßigen Beschränktheit (Satz Satz 1.76) also normbeschränkt. Es gilt aber \(\|A_n\|=\|x_n\|\). ◻

(Starke) Stetigkeit von linearen Operatoren impliziert schwache Folgenstetigkeit. Für Linearformen sind beide Stetigkeitsbegriffe äquivalent.

Proposition 2.38.

  1. Sei \(\phi : V \to \mathbb K\) linear. Dann gilt \(\phi\in V'\) genau dann, wenn \(\phi\) schwach folgenstetig ist.

  2. Sei \(A\in \mathcal L(V,W)\) und \(x_n\rightharpoonup x\) in \(V\). Dann gilt \(Ax_n\rightharpoonup Ax\) in \(W\).

Proof. (1) Ist \(\phi\in V'\), so ist die schwache Folgenstetigkeit von \(\phi\) gerade die Definition der schwachen Konvergenz. Umgekehrt impliziert starke Konvergenz \(x_n\to x\) schwache \(x_n\rightharpoonup x\), und damit schwache Folgenstetigkeit die Stetigkeit von \(\phi\). \(\bullet\qquad\) (2) Es gilt für alle \(\phi\in W'\) \[|\langle\phi,Ax-Ax_n\rangle|=|\langle A^\dagger \phi ,x-x_n\rangle |\to 0.\] ◻

Schwache Konvergenz hängt eng mit konvexen Mengen zusammen. Dies ergibt sich im wesentlichen aus den Trennungssätzen von Hahn–Banach.

Satz 2.39. Sei \(K\subseteq V\) eine abgeschlossene und konvexe Teilmenge des Banachraumes \(V\). Sei weiter \(x_n\in K\) eine schwach konvergente Folge mit Grenzwert \(x\in V\), \(x_n\rightharpoonup x\). Dann gilt \(x\in K\).

Proof. Angenommen, \(x\) ist kein Element von \(K\). Da \(K\) abgeschlossen ist, gilt \(\mathop{\mathrm{dist}}(x,K)>0\). Damit existiert nach Satz Satz 2.11 ein Funktional \(\phi\in V'\) mit \(\mathrm{Re}\,\langle\phi,x\rangle<\gamma<\inf_{y\in K}\mathrm{Re}\,\langle\phi,y\rangle\). Setzt man speziell als \(y\) die Folgenglieder \(x_n\), so ergibt sich ein Widerspruch zur schwachen Konvergenz. ◻

Korollar 2.40 (Satz von Mazur). Sei \(V\) Banachraum und konvergiere \(x_n\rightharpoonup x\) schwach. Dann existiert eine Folge \(y_n\) bestehend aus (endlichen) Konvexkombinationen der Glieder \(x_n\), so daß \(y_n\to x\) in der Norm konvergiert.

Proof. Man setzt \(K\) den Abschluß der konvexen Hülle der Menge \(\{x_n\}\) und wendet obigen Satz an. ◻

Korollar 2.41. Sei \(V\) Banachraum und konvergiere \(x_n\rightharpoonup x\) schwach. Dann gilt \[\|x\|\le \liminf_{n\to\infty} \|x_n\|.\]

Proof. Hier wählt man \(\varepsilon>0\) und dann \(n\) groß genug, um obigen Satz mit der abgeschlossenen Kugel mit Radius \(\liminf_{n\to\infty} \|x_n\| + \varepsilon\) als konvexer Menge und einer entsprechenden Teilfolge anzuwenden. ◻

2.5 Schwach-*-Konvergenz

Fortsetzen wollen wir unsere Untersuchungen mit der Betrachtung in \(V'\). Ist \(V\) ein normierter Raum, so ist \(V'\) Banachraum und in \(V'\) durch die Elemente von \(V\) eine schwächere lokalkonvexe Topologie definiert, die sogenannte schwach-*-Topologie.

Definition 2.42. Sei \(\phi_n\in V'\) eine Folge von Funktionalen. Man sagt \(\phi_n\) konvergiere schwach-* gegen \(\phi\in V'\), in Zeichen \(\phi_n\stackrel{*}{\rightharpoonup}\phi\), falls für alle \(x\in V\) \[\langle \phi_n-\phi ,x \rangle \to 0\] gilt.

Proposition 2.43.

  1. \(\phi_n \stackrel{*}\rightharpoonup \phi\) und \(\psi_n\stackrel{*}\rightharpoonup \psi\) impliziert \(\phi_n+\psi_n\stackrel{*}\rightharpoonup \phi+\psi\).

  2. \(\phi_n \stackrel{*}\rightharpoonup \phi\) und \(\alpha_n\to\alpha\) impliziert \(\alpha_n\phi_n \stackrel{*}\rightharpoonup\alpha \phi\).

  3. \(\phi_n \rightharpoonup \phi\) impliziert \(\phi_n\stackrel{*}\rightharpoonup \phi\).

  4. \(\phi_n\to \phi\) impliziert \(\phi_n\stackrel{*}\rightharpoonup \phi\).

Die schwach-* Topologie entspricht der starken Konvergenz im Operatorraum \(\mathcal L(V,\mathbb K)\). Insbesondere gilt also (als Folgerung des Prinzips der gleichmäßigen Beschränktheit)

Satz 2.44. Sei \(V\) Banachraum. Dann ist der Raum \(V'\) schwach-* folgenvollständig, d.h. zu jeder Folge \((\phi_n)\), die die schwache Cauchy-Bedingung \[\langle \phi_n-\phi_m,x\rangle \to 0 ,\qquad m,n\to\infty\] für jedes \(x \in V\) erfüllt, existiert genau ein \(\phi\in V'\) mit \(\phi_n\stackrel{*}{\rightharpoonup}\phi\).

Korollar 2.45. Jeder reflexive Raum ist schwach folgenvollständig.

Beispiel 2.46. \(\mathrm C[0,1]\) ist nicht schwach folgenvollständig. Dazu sei \(f_n\in \mathrm C[0,1]\) eine Folge stetiger Funktionen, die gleichmäßig beschränkt ist und punktweise gegen eine nichtstetige, aber meßbare Funktion \(f\) konvergiert. So eine Folge existiert. Sei nun \(\mu\) ein beschränktes Radonmaß. Dann gilt mit dem Satz über majorisierte Konvergenz \[\lim_{m,n\to\infty} \int_0^1 f_n(x) - f_m(x) \,\mathrm d\mu(x)= 0\] und somit ist \(f_n\) schwache Cauchyfolge. Da aber ein eventueller schwacher Grenzwert insbesondere punktweiser Grenzwert sein muß (man wähle einfach Diracmaße) und dieser als nichtstetig vorausgesetzt wurde, kann er nicht Element von \(\mathrm C[0,1]\) sein.

Beispiel 2.47. Sei \(x_n\) eine Folge aus einem Hilbertraum \(H\). Gilt für jedes \(y\in H\) die schwache Cauchy-Bedingung \[{\pmb( x_n-x_m,y\pmb)}\to0,\qquad m,n\to\infty,\] so existiert ein \(x\in H\) mit \(x_n\rightharpoonup x\). Die Cauchy-Bedingung ist essentiell um Konvergenzkriterien für Reihen zu beweisen. Damit gilt in jedem Hilbertraum \(H\) folgendes schwache Konvergenzkriterium

Satz 2.1. Sei \(H\) Hilbertraum. Dann konvergiert die Reihe \(\sum_{k=0}^\infty x_k\) genau dann schwach gegen ein \(x\in H\), wenn für jedes \(y\in H\) die Reihe \(\sum_{k=0}^\infty {\pmb(x_k,y\pmb)}\) in \(\mathbb K\) konvergiert.

Beispiele

Wir wollen nun einige Beispiele zu den Konvergenzbegriffen diskutieren.

Beispiel 2.48. Sei \((X,d)\) kompakter metrischer Raum. Dann hat \(\mathrm C(X)\) den Dualraum \(\mathbb M(X)\) der \(\mathbb K\)-wertigen Radon-Maße auf \(X\). Sei nun \(f_n\) eine Folge stetiger Funktionen. Diese konvergiert schwach gegen ein \(f\in\mathrm C(X)\), falls für jedes Maß \(\mu\in\mathbb M(X)\) \[\int f_n(x)-f(x) \,\mathrm d\mu(x) \to0, \qquad n\to\infty\] gilt.

Beispiel 2.49. Sei diesmal \(\mu_n\) eine Folge aus \(\mathbb M(X)\), so daß für alle \(f\in\mathrm C(X)\) \[\int f(x)\,\mathrm d(\mu_n-\mu_m) \to 0, \qquad m,n\to\infty\] gilt, so folgt die Existenz eines Maßes \(\mu\in\mathbb M(X)\) mit \(\mu_n\stackrel{*}{\rightharpoonup}\mu\), d.h. \[\int f(x)\,\mathrm d\mu_n\to\int f(x)\,\mathrm d\mu,\qquad n\to\infty\] für alle \(f\in\mathrm C(X)\). In der Maßtheorie / Stochastik sagt man \(\mu_n\) sei gegen \(\mu\) verteilungskonvergent.

Beispiel 2.50. Sei \(x_n\in X\) eine Folge von Punkten aus \(X\) und gelte \(x_n\to x\) in \(X\) und \(x_n\ne x\). Dann konvergieren die Punktmaße \(\delta_{x_n}\) schwach-* gegen \(\delta_x\), \[\delta_{x_n}\stackrel{*}{\rightharpoonup}\delta_x.\] Diese Folge konvergiert aber nicht schwach, da sonst für jede Borel-Menge \(A\in\mathcal B(X)\) \[\delta_{x_n}(A)\to\delta_x(A)\] gelten müßte (warum?), was aber für \(A=\{x\}\) offenbar falsch ist.

Beispiel 2.51. Für ein weiteres Beispiel betrachten wir die Räume \(\mathfrak c_0\), \(\ell^1\) und \(\ell^\infty\). Für Folgen \(x_k\in \ell^1\) mit Gliedern \(x_k=(x_{k,l})_{l=1,\ldots}\) kann man nun neben der Normkonvergenz in \(\ell^1\) sowohl schwache als auch Schwach-*-Konvergenz untersuchen.

Ein bekanntes Resultat von Schur besagt, daß in diesem Fall aus \(x_k\rightharpoonup x_\infty\) schon \(x_k\to x_\infty\) folgt. Der Raum \(\ell^1\) besitzt die Schur-Eigenschaft.

Beispiel 2.52. Die Folge der Basisfolgen \({\mathbf e}_k\in\ell^1\), wie vorher \({\mathbf e}_k=(0,\ldots,0,1,0,\ldots)\) mit der 1 an der \(k\)-ten Stelle, erfüllt \(\|{\mathbf e}_k\|=1\). Also kann \({\mathbf e}_k\) nicht in der Norm gegen Null konvergieren. Allerdings gilt für jede Nullfolge \((\xi_l)\in\mathfrak c_0\) \[\langle {\mathbf e}_k,(\xi_l)\rangle = \xi_k\to0,\qquad k\to\infty,\] also \({\mathbf e}_k\stackrel{*}{\rightharpoonup}0\). Die Folge ist in \(\ell^1\) nicht schwach konvergent, da \(\langle {\mathbf e}_k,(1)\rangle = 1\) nicht gegen Null strebt.

2.6 Schwache Folgenkompaktheit

Im folgenden interessieren uns Kriterien für die Existenz schwach-*-konvergenter Teilfolgen. Das für uns zentrale Resultat ist dazu der folgende Satz. Er basiert auf der Separabilität des Raumes \(V\) und dem Satz von Banach–Steinhaus.

Satz 2.53 (Banach–Alaoglu35). Ist \(V\) separabler Banachraum, so besitzt jede Folge \(\phi_n\in V'\) mit \(\|\phi_n\|\leq1\) eine schwach-* konvergente Teilfolge.

Proof. Sei dazu \(\{x_1,x_2,\ldots\}\) dicht in \(V\). Die Folge der Zahlen \(\langle\phi_n,x_1\rangle\) ist beschränkt. Nach dem Satz von Bolzano–Weierstraß existiert eine konvergente Teilfolge \(\langle\phi_{n_{k,1}},x_1\rangle\). Aus demselben Grund besitzt \(\langle\phi_{n_{k,1}},x_2\rangle\) wiederum eine konvergente Teilfolge \(\langle\phi_{n_{k,2}},x_2\rangle\). So fährt man fort. Die Diagonalfolge \(\phi_{n_{k,k}}\) liefert nach Konstruktion konvergente Folgen \(\langle\phi_{n_{k,k}},x_i\rangle\) für jedes \(x_i\).

Nach dem Satz von Banach–Steinhaus ist aber nun \(\phi_{n_{k,k}}\) schwach-* konvergent, es existiert also ein \(\phi\) mit \(\phi_{n_{k,k}}\stackrel{*}{\rightharpoonup}\phi\). ◻

Die Voraussetzung der Separabilität ist hier notwendig. Im Raum \((\ell^\infty)'\) ist die Folge der Funktionale \(\langle \phi_k, (x_n) \rangle = x_k\) in der Norm beschränkt, \(\|\phi_k\|=1\), aber keine Teilfolge ist schwach-*-konvergent. Für jede Teilfolge \(\phi_{k_j}\) liefert nämlich \((x_n)\in\ell^\infty\) mit \(x_{n} = (-1)^j\) für \(n=k_j\) schon \(\langle \phi_{k_j}, (x_n)\rangle = (-1)^j\).

Da Hilberträume reflexiv sind, stimmen auf ihnen schwache und schwach-* Konvergenz überein. In separablen Hilberträumen ist die Einheitskugel also schwach folgenkompakt. Separabilität ist hier allerdings unerheblich.

Korollar 2.54. Sei \(H\) Hilbertraum. Dann ist die abgeschlossene Einheitskugel von \(H\) schwach folgenkompakt.

Proof. Sei \(x_n\in H\), \(n\in \mathbb N\) mit \(\|x_n\|\le 1\). Sei weiter \(H_0 = \overline{\mathop{\mathrm{span}}}\{x_n : n\in \mathbb N\}\), \(H_1=H_0^\perp\) und somit \(H=H_0\oplus H_1\). Nach Konstruktion ist \(H_0\) separabel. Es existiert also eine in \(H_0\) schwach konvergente Teilfolge \(x_{n_k}\), \(x_{n_k}\rightharpoonup x\) und damit gilt für alle \(y\in H_0\) \[{\pmb(x_{n_k},y\pmb)} \to {\pmb(x,y\pmb)},\qquad k\to\infty.\] Da für alle \(y\in H_1\) ebenso \({\pmb(x_n,y\pmb)}=0\) gilt, konvergiert \(x_{n_k}\) schwach in \(H\). ◻

In reflexiven Banachräumen ist man versucht, ähnlich vorzugehen. Jede Folge \((x_n)\) in \(V\) ist sicher in einem separablen Teilraum \(W\), dem Normabschluß \(\overline{\mathop{\mathrm{span}}}\{x_n : n\in \mathbb N\}\) enthalten. Da \(V\) reflexiv ist, ist \(W=W''\) auch reflexiv und \(W'\) nach folgendem Lemma separabel.

Lemma 2.55. Ist \(V'\) separabel, so auch \(V\).

Proof. Sei \(V'\) separabel und sei \((\phi_n)\) eine in der Einheitssphäre \(\{ \phi\in V' : \|\phi\|=1\} \subseteq V'\) dichte Folge. Nach Definition der Norm in \(V'\) existieren damit \(x_n\in V\) mit \(\|x_n\|=1\) und \(|\langle \phi_n,x_n\rangle| > 1/2\).

Betrachtet man nun die \(\mathbb Q\)-lineare Hülle \(\mathop{\mathrm{span}}_{\mathbb Q} \{ x_n : n\in\mathbb N\}\), so ist diese offenbar abzählbar. Angenommen, ihr Abschluß ist nicht \(V\). Dann existiert nach dem Satz von Hahn–Banach ein \(\phi\in V'\) mit \(\|\phi\|=1\) und \(\phi(x_n)=0\) für alle \(n\). Für dieses \(\phi\) gilt \[\textstyle \frac12 \le | \langle \phi_n,x_n\rangle| = |\langle \phi_n-\phi, x_n\rangle | \le \|\phi_n-\phi\| \|x_n\| = \|\phi_n-\phi\|.\] Damit können die \(\phi_n\) aber nicht dicht in der Sphäre sein. Widerspruch! ◻

Also existiert eine (in \(W\)) schwach konvergente Teilfolge \((x_{n_k})\) von \((x_n)\) und ein \(x\in W\) mit \(\langle\phi,x_{n_k}\rangle \to \langle\phi,x\rangle\) für alle \(\phi\in W'\). Da jede Linearformen auf \(V\) auch eine auf \(W\) ist, impliziert dies schwache Konvergenz in \(V\).

Korollar 2.56. Sei \(V\) reflexiv. Dann ist die abgeschlossene Einheitskugel von \(V\) schwach folgenkompakt.

Bestapproximationsaufgaben

Eine Anwendung ist der folgende Existenzsatz für Bestapproximationen. Um die Eindeutigkeit zu garantieren, benötigt man stärkere Voraussetzungen.

Satz 2.57. Sei \(V\) reflexiv und \(U\subseteq V\) ein abgeschlossener Teilraum von \(V\). Sei weiter \(x\in V\). Dann gibt es ein \(y_0\in U\), für welches \[\|x-y_0\|=\mathrm{dist}\;(x,U)=\inf_{y\in U}\|x-y\|.\]

Proof. Ist \(x\in U\) so folgt \(y_0=x\) und Existenz (und Eindeutigkeit) sind klar. Sei also im folgenden \(x\in V\setminus U\). Sei weiter \(y_n\) eine Minimalfolge. Diese ist wegen \[\|y_n\|\leq \|x-y_n\|+\|x\| \leq \mathrm{dist}\;(x,U)+\varepsilon+\|x\|, \qquad n\geq n_0(\varepsilon)\] beschränkt und damit nach Folgerung Korollar 2.56 relativ folgenkompakt. Es existiert also eine schwach konvergente Teilfolge \(y_{n_k}\) und ein \(y_0\in U\) mit \(y_{n_k}\rightharpoonup y_0\).

Dieses \(y_0\) löst die Bestapproximationsaufgabe. Da \(U\) abgeschlossen und als Unterraum auch konvex ist folgt aus Satz Satz 2.39, dass \(y_0\in U\). Weiter impliziert \(x-y_{n_k} \rightharpoonup x-y_0\) mit Korollar Korollar 2.41 \[\mathrm{dist}\;(x,U) \le \| x-y_0 \| \le \liminf_{k\to\infty} \|x-y_{n_k}\| = \mathrm{dist}\;(x,U).\] ◻

Einfacher werden Bestapproximationsaufgaben, wenn der Unterraum \(U\) aus dem approximiert wird, endlichdimensional ist. Dann ist die Einheitskugel in \(U\) kompakt und wir können (ganz ohne Nutzung des Satzes von Banach–Alaoglu) aus jeder Minimalfolge eine konvergente Teilfolge auswählen.

Satz 2.58. Sei \(V\) normierter Raum und \(U\) endlichdimensionaler Teilraum von \(V\). Dann existiert zu jedem \(x\in V\) eine Bestapproximation an \(x\) aus \(U\).

Derartige Approximationsprobleme bezeichnet man als Tschebyscheff-Approximation. Das Standardbeispiel dazu ist, Funktionen aus \(\mathrm C[a,b]\) durch Polynome vom Grad \(n\) zu approximieren. In diesem Falle kann man sogar zeigen, daß die Bestapproximation eindeutig bestimmt ist (der Haarsche36 Eindeutigkeitssatz, ein Beweis findet sich im Buch von Heuser).

2.7 Appendix: Schwache Kompaktheitssätze

Für das nachfolgende sei an die Definition der Kompaktheit einer Menge erinnert. Ebenso daran, daß es zwei verschiedene Kompaktheitsbegriffe gibt.

Definition 2.59. Eine Teilmenge \(M\) eines topologischen Raumes \((X,\mathcal T)\) heißt

  1. überdeckungskompakt, falls jede offen Überdeckung \(M\subseteq\bigcup_{i\in I}U_i\), \(U_i\) offen in \(X\), eine endliche Teilüberdeckung \(M\subseteq\bigcup_{k=1,\ldots n} U_{i_k}\) besitzt;

  2. äquivalent dazu: falles jedes System abgeschlossener Teilmengen \(F_i\subseteq M\), \(i\in I\), mit nichtleeren endlichen Schnitten \(F_{i_1}\cap F_{i_2}\cap\cdots\cap F_{i_k}\ne\varnothing\) nichtleeren Schnitt \(\bigcap_{i\in I} F_i\ne\varnothing\) besitzt;

  3. folgenkompakt, falls jede Folge \((x_n)\) aus \(M\) eine in \(M\) konvergente Teilfolge \((x_{n_k})\) besitzt.

In metrischen Räumen sind beide Begriffe äquivalent. Wenn wir über lokalkonvexe Topologien sprechen, müssen wir sie unterscheiden. Besitzt der Raum eine abzählbare Umgebungsbasis, so folgt aus der Überdeckungskompaktheit die Folgenkompaktheit. Dies gilt zum Beispiel in separablen Räumen. Im allgemeinen sind die beiden Kompaktheitsbegriffe verschieden.

In Dualräumen gilt das folgende Kompaktheitsresultat. Das genutzte Hauptargument ist topologischer Natur und beruht darauf, dass Produkte kompakter Mengen kompakt sind (Satz von Tychonov).

Satz 2.60 (Alaoglu). Die abgeschlossene Einheitskugel in \(V'\) ist schwach-* kompakt.

Proof. Schritt 1. Wir gehen in zwei Teilschritten vor und betrachten zuerst die Menge \(\mathbb K^V\) aller Funktionen von \(V\) nach \(\mathbb K\). Diese kann mit einer Produkttopologie versehen werden. Eine Subbasis dieser Topologie ist durch die Mengen \(\mathcal U^{(x)} = \{ f \in \mathbb K^V : f(x)\in \mathcal U \}\) für beliebige offenen Mengen \(\mathcal U\subseteq\mathbb K\) und beliebige \(x\in V\) gegeben. Eine Menge \(\Omega\subseteq\mathbb K^V\) ist also genau dann offen, wenn sie Vereinigung endlicher Schnitte von Mengen \(\mathcal U^{(x)}\) ist.

Sei nun \(\Sigma\subseteq\mathbb K^V\) abgeschlossen und \(\Sigma_x=\{f(x) : f\in\Sigma\}\) für jedes \(x\) beschränkt. Dann ist \(\Sigma\) kompakt in der Produkttopologie. Dazu zeigen wir, daß jedes System abgeschlossener Teilmengen \(F_j\subseteq \Sigma\), \(j\in J\), mit \(F_{j_1}\cap F_{j_2}\cap\cdots\cap F_{j_k}\ne\varnothing\) für beliebige endliche Schnitte schon nichtleeren Durchschnitt \(\bigcap_{j\in J} F_j\ne\varnothing\) hat. Dazu machen wir zuerst das System \((F_j)_{j\in J}\) größer. Wir betrachten Familien abgeschlossener Teilmengen von \(\Sigma\), die

Die Menge aller solchen endlichen Familien ist durch Inklusion geordnet und jede aufsteigende Kette ist offenbar durch ihre Vereinigung nach oben beschränkt. Damit existiert nach dem Lemma von Zorn eine Familie, welche \((F_j)_{j\in J}\) enthält aber selbst nicht echte Teilmenge einer größeren Familie mit endlicher Durchschnittseigenschaft ist.

Wir nehmen oBdA an, daß \((F_j)_{j\in J}\) schon maximal ist. Für jedes \(x\in V\) und \(j\in J\) betrachten wir nun die Menge \(F_{j,x}= \{ f(x) : f\in F_j\}\subseteq \Sigma_x\). Da \(\Sigma_x\) nach dem Satz von Heine–Borel kompakt ist und die Familie \((F_{j,x})_{j\in J}\) die endliche Durchschnittseigenschaft besitzt, ist \(\bigcap_{j\in J} F_{j,x} \ne\varnothing\). Wir wählen \(r_x\in \bigcap_{j\in J} F_{j,x}\) und bezeichnen mit \(\tilde f : x\mapsto r_x\) die entstehende Auswahlfunktion.

Wir zeigen \(\tilde f\in \bigcap_{j\in J} F_j\). Für jedes \(x_*\in V\) und jede Umgebung \(\mathcal U\) von \(\tilde f(x_*)\) gilt \(F_{j,x_*}\cap \mathcal U\ne\varnothing\). Damit folgt aber \(\mathcal U^{(x_*)}\cap F_j\ne\varnothing\). Da \((F_j)_{j\in J}\) maximal ist, enthält es insbesondere den Abschluß von \(\mathcal U^{(x_*)}\) in \(\Sigma\) und ebenso den Abschluß endlicher Schnitte \(\mathcal U^{(x_1)}\cap\mathcal U^{(x_2)}\cap\dots\cap\mathcal U^{(x_k)}\). Auch diese schneiden jedes der \(F_j\) nichttrivial. Damit folgt aber, dass jede \(\tilde f\) enthaltende offene Menge nichtleeren Schnitt mit allen \(F_j\) besitzt und somit insbesondere \(\tilde f\in\bigcap_{j\in J} F_j\).

Wir betrachten die Einbettung \(V'\subseteq \mathbb K^V\), \(V'\) versehen mit der schwach-* Topologie. Diese ist nach Konstruktion der Produkttopologie homöomorph und das Bild der Einheitskugel \(B\) von \(V'\) ist in \(\mathbb K^V\) als Schnitt der offenbar abgeschlossenen Mengen \[B = \bigcap_{\lambda\in\mathbb K,\; x,y\in V} \{ f\in \mathbb K^V : f(x+\lambda y)= f(x) +\lambda f(y) \quad \land \quad |f(x)|\le \|x\| \}\] abgeschlossen. Weiter sind alle Schnitte \(B_x\subseteq\mathbb K\) beschränkt und damit \(B\subseteq \mathbb K^V\) kompakt. Also ist \(B\subseteq V'\) schwach-* überdeckungskompakt. ◻

Für reflexive Räume ergibt sich die schwache Kompaktheit der Einheitskugel. Es gilt sogar die Umkehrung, aus der schwachen (Folgen-) Kompaktheit der Einheitskugel folgt die Reflexivität des Raumes. Dazu zeigen wir zuerst

Lemma 2.61 (Goldstine37). Die Einheitskugel \(B\subseteq V\) ist schwach-* dicht in der Einheitskugel \(B''\subseteq V''\).

Proof. Sei dazu \(u''\in B''\). Dann existiert zu jedem \(\varepsilon>0\) und beliebigen \(\phi_1,\ldots,\phi_n\in V'\) mit \(\|\phi_k\|=1\) nach Lemma Lemma 2.30 ein \(x\in V\), \(\|x\|\le 1+\varepsilon\), mit \[\langle u'',\phi_k\rangle=\langle\phi_k,x\rangle,\qquad k=1,\ldots,n.\] Insbesondere gilt mit \(x_\varepsilon=(1+\varepsilon)^{-1} x\) \[| \langle u'',\phi_k\rangle-\langle\phi_k,x_\varepsilon\rangle | \le | \langle \phi_k, x-x_\varepsilon\rangle| \le (1+\varepsilon) (1-(1+\varepsilon)^{-1}) = \varepsilon.\] Nun bilden Mengen der Form \(\{ v'' \in V'' \;|\; |\langle v''-u'',\phi_k\rangle|<\varepsilon\}\) für beliebiges \(\varepsilon>0\) und endliche beliebige Familien \(\phi_k\) aber gerade eine Umgebungsbasis von \(u''\) in \(V''\) und die Dichtheit ist gezeigt. ◻

Korollar 2.62. Sei \(V\) normierter Raum. Dann sind äquivalent

  1. \(V\) ist reflexiv.

  2. Die abgeschlossene Einheitskugel in \(V\) ist schwach kompakt.

Proof. (1)\(\Rightarrow\)(2) entsprich dem Satz von Alaoglu. \(\bullet\qquad\) (2)\(\Rightarrow\)(1) Dies ist eine direkte Folgerung aus dem Lemma von Goldstine. Ist die Einheitskugel \(B\) von \(V\) schwach kompakt, so ist ihr Bild unter der kanonischen Einbettung \(V\hookrightarrow V''\) schwach-* kompakt und somit abgeschlossen. Also folgt \(B=B''\) und damit \(V=V''\). ◻

Satz 2.63 (Eberlein38–Šmulian39). Sei \(V\) normierter Raum und \(A\subset V\) schwach abgeschlossen. Dann sind äquivalent

  1. Die \(A\) ist schwach kompakt.

  2. Die \(A\) ist schwach folgenkompakt.

Zum Beweis. Wir verweisen auf die Literatur, z.B. Dunford–Schwartz Kapitel V.6. ◻

Korollar 2.64. Sei \(V\) normierter Raum. Dann sind äquivalent

  1. \(V\) ist reflexiv.

  2. Die abgeschlossene Einheitskugel in \(V\) ist schwach kompakt.

  3. Die abgeschlossene Einheitskugel von \(V\) ist schwach folgenkompakt.

Es sei an dieser Stelle an ein Resultat aus dem ersten Kapitel erinnert: Ein Banachraum ist genau dann endlichdimensional, wenn seine Einheitskugel normkompakt ist. Obiger Satz erlaubt es, in reflexiven Räumen endlichdimensionale Methoden anzuwenden. Insbesondere ersetzt er die im Endlichdimensionalen unverzichtbaren Sätze von Heine–Borel und Bolzano–Weierstraß.

3 Operatorgleichungen mit kompakten Operatoren

Lineare Gleichungssysteme, abstrahiert.

3.1 Kompakte Operatoren

Definition

Definition 3.1. Seien \(V_1\) und \(V_2\) zwei normierte Räume. Ein Operator \(A\in\mathcal L(V_1,V_2)\) wird als kompakt bezeichnet, falls er die Einheitskugel \(B_1=\{x\in V_1\;|\;\|x\|<\}\subseteq V_1\) auf eine relativ kompakte40 Teilmenge des \(V_2\) abbildet. Die Menge aller kompakten Operatoren aus \(\mathcal L(V_1,V_2)\) wird mit \(\mathcal K(V_1,V_2)\) bezeichnet.

Proposition 3.2.

  1. Kompakte Operatoren bilden beschränkte Teilmengen von \(V_1\) auf relativ kompakte Teilmengen aus \(V_2\) ab.

  2. Sind \(A,B\in\mathcal K(V_1,V_2)\) und \(\alpha\in\mathbb K\), so folgt \[A+B\in\mathcal K(V_1,V_2),\qquad\qquad \alpha A\in \mathcal K(V_1,V_2).\]

  3. Ist \(A\in\mathcal K(V_1,V_2)\), \(B\in\mathcal L(V_2,V_3)\) und \(C\in\mathcal K(V_3,V_4)\). Dann folgt \(BA\in\mathcal K(V_1,V_3)\) und \(CB\in\mathcal K(V_2,V_4)\).

Aus Punkt (3) ergibt sich unmittelbar, daß im Allgemeinen Operatoren nicht gleichzeitig invertierbar und kompakt sein können.

Korollar 3.3. Sei \(A\in \mathcal K(V_1,V_2)\) kompakt. Ist \(A\) stetig (links)invertierbar, so ist \(V_1\) endlichdimensional.

Proof. Wäre \(A\) stetig invertierbar, so würde \(I=A^{-1}A\in \mathcal K(V_1)\) gelten. Die identische Abbildung kann aber nach Satz Satz 1.41 nur in endlichdimensionalen Räumen kompakt sein. ◻

Satz 3.4. Sei \(V_2\) Banachraum. Dann ist \(\mathcal K(V_1,V_2)\) ein abgeschlossener Teilraum des Banachraumes \(\mathcal L(V_1,V_2)\).

Proof. Sei \(A_k\) eine Folge kompakter Operatoren, die in \(\mathcal L(V_1,V_2)\) gegen \(A\) konvergiert. Sei weiter \((x_\ell)\) eine beschränkte Folge aus \(V_1\). Nun ist \((A_1x_\ell)\) relativ kompakt, besitzt also eine konvergente Teilfolge \((A_1x_{\ell_{1,j}})\). Die Folge \((A_2x_{\ell_{1,j}})\) besitzt eine konvergente Teilfolge \((A_2x_{\ell_{2,j}})\). Dies kann man fortführen bis man unendlich viele Teilfolgen \((A_kx_{\ell_{k,j}})\) konstruiert hat. Die Diagonalfolge \((x_{\ell_{j,j}})\) besitzt nun auf Grund des Auswahlverfahrens die Eigenschaft, daß alle Folgen \((A_kx_{\ell_{j,j}})\) konvergent sind.

Bezeichne \(C=\sup_\ell \|x_\ell\|_1\). Dann gibt zu \(\varepsilon>0\) ein \(n\), so daß \(4C\|A_n-A\|<\varepsilon\). Zu diesem \(n\) bestimmen wir \(N_0\), so daß für \(j,k>N_0\) stets \(\|A_n(x_{\ell_{j,j}}-x_{\ell_{k,k}})\|_2<\varepsilon/2\) gilt. Dann folgt \[\|A(x_{\ell_{j,j}}-x_{\ell_{k,k}})\|_2\le\|A_n(x_{\ell_{j,j}}-x_{\ell_{k,k}})\|_2+\|(A-A_n)(x_{\ell_{j,j}}-x_{\ell_{k,k}})\|_2<\frac\varepsilon 2+\frac\varepsilon{4C}2C=\varepsilon\] die Folge \((Ax_{\ell_{j,j}})\) ist in \(V_2\) konvergent. ◻

Einige Bemerkungen zu Operatoren in einem Raum. Sei \(V\) Banachraum. Dann bezeichnet man \(\mathcal K(V,V)\) kurz als \(\mathcal K(V)\) und man sieht aus Propostion Proposition 3.2, daß es sich bei \(\mathcal K(V)\) um ein abgeschlossenes Ideal der Banachalgebra \(\mathcal L(V)\) handelt.

Kompakte Operatoren sind von der schwachen Topologie zur Normtopologie folgenstetig, man sagt auch sie seien vollstetig:

Satz 3.5. Sei \(A\in\mathcal K(V_1,V_2)\) kompakt. Konvergiert dann \(x_n\rightharpoonup x\) schwach in \(V_1\), so konvergiert die Folge der Bilder \(Ax_n\to Ax\) in der Norm von \(V_2\).

Proof. Die Folge \((x_n)\) ist nach Satz Satz 2.37 beschränkt, die Bildfolge \((Ax_n)\) also relativ kompakt. Sei \(y\) ein Häufungspunkt41 von \((Ax_n)\). Dann existiert eine Teilfolge \(Ax_{n,1}\) die in der Norm gegen \(y\) konvergiert, also auch schwach \(Ax_{n,1}\rightharpoonup y\).

Wegen Proposition Proposition 2.38 folgt aber auch \(Ax_n\rightharpoonup Ax\). Da Grenzwerte eindeutig bestimmt sind, folgt somit \(y=Ax\) und \((Ax_n)\) besitzt nur einen Häufungspunkt. Da jede Teilfolge eine konvergente Teilfolge besitzt, gilt insbesondere \(Ax_n\to Ax\). ◻

Kompaktheitskriterien in \(\mathrm C\) und \({\mathrm{L}}^p\)

Für Beispiele benötigen wir Kompaktheitskriterien in verschiedenen Räumen. Bekannt sein sollte aus der Grundvorlesung der Satz von Arzela42–Ascoli43. Wir wollen ihn in einer etwas allgemeineren Fassung angeben.

Satz 3.6 (Arzela–Ascoli). Sei \(X\) kompakter metrischer Raum und \(Y\) Banachraum. Sei weiter \(\mathrm C(X;Y)\) der Raum der stetigen Funktionen auf \(X\) mit Werten in \(Y\) versehen mit der Supremumsnorm \[\|f\| = \sup_{x\in X} \|f(x)\|_Y.\] Dann ist eine Teilmenge \(F\subseteq \mathrm C(X;Y)\) relativ kompakt genau dann, wenn sie

  1. gleichmäßig beschränkt ist, d.h. \[\sup_{f\in F}\|f\|<\infty,\]

  2. gleichgradig gleichmäßig stetig ist, d.h. \[\label{eq:glg-st} \forall \varepsilon >0 : \exists\delta>0 : \forall f\in F ,\,x\in X:\quad d_X(x,x')\leq\delta \Rightarrow \|f(x)-f(x')\|_Y\leq\varepsilon\]

  3. und für jedes \(x\in X\) die Menge \(\{ f(x)\,|\, f\in F\}\) relativ kompakt in \(Y\) ist.

Proof. Wir beweisen nur das Kompaktheitskriterium (den Satz von Arzela), die Rückrichtung (nach Ascoli) verbleibt als Übungsaufgabe.

Sei \(f_k \in F\) eine beliebige Folge aus \(F\). Zu zeigen ist, daß diese eine in \(\mathrm C(X;Y)\) konvergente Teilfolge enthält.

Da \(X\) kompakt ist, existiert zu jedem \(\varepsilon>0\) eine endliches \(\varepsilon\)-Netz für \(X\). Damit existiert insbesondere eine in \(X\) dichte Folge \(x_n\) (als Vereinigung der \(\varepsilon\)-Netze mit \(\varepsilon=1/m\)). Nach Voraussetzung ist die Folge \(f_k(x_1)\) in \(Y\) relativ kompakt. Damit existiert eine Teilfolge \(f_{k,1}\) von \(f_k\), so daß \(f_{k,1}(x_1)\) in \(Y\) konvergiert. Wir wählen nun rekursiv Teilfolgen \(f_{k,\ell}\) aus \(f_{k,\ell-1}\), so daß \(f_{k,\ell}(x_\ell)\) in \(Y\) konvergiert. Für die Diagonalfolge \(f_{k,k}\) konvergiert somit \(f_{k,k}(x_n)\) für jedes \(n\).

Damit ist \(f_{k,k}\) aber Cauchyfolge in \(\mathrm C(X;Y)\). Da die \(f_k\) gleichgradig stetig sind, existiert zu jedem \(\varepsilon>0\) ein \(\delta\) mit [eq:glg-st]. Wir fixieren \(\varepsilon\) und wählen ein endliches \(\delta\)-Netz \(x_{n_1},\ldots, x_{n_m}\) aus der Folge \((x_n)\). Zu gegebenem \(x\in X\) existiert damit ein \(n\in \{n_1,\ldots,n_m\}\), so daß \(d(x,x_n)<\delta\) gilt. Also folgt \[\begin{aligned} \| f_{k,k}(x) - f_{\ell,\ell}(x) \| &\le \| f_{k,k}(x) - f_{k,k}(x_n) \| + \| f_{k,k}(x_n) - f_{\ell,\ell}(x_n) \| + \| f_{\ell,\ell}(x_n) - f_{\ell,\ell}(x) \| \notag\\ &\le 2\varepsilon+ \max_{j=1,\ldots, m} \| f_{k,k}(x_{n_j}) - f_{\ell,\ell}(x_{n_j}) \| \to 0 \end{aligned}\] für \(k,\ell\to\infty\). Nach Konstruktion ist dies gleichmäßig in \(x\in X\) und der Satz ist gezeigt. ◻

Beispiel 3.7. Seien \(X, Y\) Abschluß beschränkter Gebiete und \(k\in \mathrm C(X\times Y)\). Dann ist der assoziierte Integraloperator \[K:\mathrm C(X)\ni f(x)\mapsto Kf(y)=\int_X k(x,y)f(x)\mathrm d x\in \mathrm C(Y)\] kompakt. Nach Korollar Korollar 3.3 kann also die Integralgleichung erster Art \[\int_X k(x,y)f(x)\mathrm dx=g(y)\qquad \text{für gegebenes $g\in \mathrm C(Y)$}\] in \(\mathrm C(X)\) nicht stetig nach \(f\) aufgelöst werden. Nach dem Satz von Banach über den inversen Operator (Korollar Korollar 1.47) kann damit auch nicht zu jedem \(g\in \mathrm C(Y)\) eine eindeutig bestimmte Lösung \(f\in\mathrm C(X)\) existieren.

Proof. Das ist eine Anwendung des Satzes von Arzela–Ascoli im Raum \(\mathrm C(Y) = \mathrm C(Y; \mathbb K)\), sei dazu \(f\in B_1 = \{ f\in \mathrm C(X) \mid \|f\| \le 1\}\). Dann ist \[| Kf(y) | \le \|f\| \int_X |k(x,y)|\,\mathrm dx \le \|k\| \boldsymbol{|}X\boldsymbol{|}\] gleichmäßig beschränkt in \(f\in B_1\) und da \(k\) auf \(X\times Y\) gleichmäßig stetig ist finden wir insbesondere zu \(\varepsilon>0\) ein \(\delta>0\) mit \(|k(x,y)-k(x,y')|\le \varepsilon\) für alle \(|y-y'|\le \delta\) und damit auch \[|Kf (y)-Kf(y')| \le \|f\| \int_X |k(x,y)-k(x,y')|\,\mathrm dx \le\varepsilon\boldsymbol{|}X\boldsymbol{|}\] gleichmäßig in \(|y-y'|\le \delta\). Also folgt gleichgradige Stetigkeit und damit mit Arzela–Ascoli die Behauptung. ◻

Beispiel 3.8. Sei \(X\) Abschluß eines beschränkten Gebietes im \(\mathbb R^n\), \(k\in\mathrm C((X\times X)\setminus\Delta_X)\) mit \(\Delta_X=\{(x,x)|x\in X\}\) und gelte \[|k(x,y)|\leq C|x-y|^{-\alpha}\] für ein \(\alpha<n\). Dann heißt die Kernfunktion \(k(x,y)\) schwach singulär und der Operator \[K:\mathrm C(X)\ni f(x)\mapsto Kf(y)=\int_X k(x,y)f(x)\mathrm dx\in \mathrm C(X)\] (definiert im Sinne eines uneigentlichen Riemannintegrals) ist kompakt.

Proof. Dies folgt aus dem vorigen Beispiel. Das Integral existiert als uneigentliches Riemannintegral, da \[\int_X |x-y|^{-\alpha} \,\mathrm dy \le \boldsymbol{|}\mathbb S^{n-1} \boldsymbol{|} \int_0^{\mathrm{diam}(X)} r^{n-1-\alpha} \,\mathrm dr <\infty.\] Um zu zeigen, daß der Operator kompakt ist, stellen wir den Operator als Normgrenzwert kompakter Operatoren dar. Dazu sei \(h\) stückweise stetig mit \(h(t)=0\) für \(t\le 1/2\), \(h(t)=1\) für \(t\ge 1\) und \(h(t)=2t-1\) für \(1/2<t\le 1\). Sei weiter \[k_m(x,y)= h(m|x-y|) k(x,y).\] Dann ist der zugeordnete Operator \(K_m\) nach Beispiel Beispiel 3.7 kompakt. Weiter konvergiert \(K_mf \to Kf\) in \(\mathrm C(X)\) und \(K_m\to K\) in \(\mathcal L(\mathrm C(X))\), da \[\begin{split} | Kf(y)-K_mf(y) | &= \left|\int_X \big(k(x,y) - k_m(x,y) \big) f(x) \,\mathrm dx \right|\\ & \le \|f\|_\infty \int_{x : |x-y|<1/m} |K(x,y)| \,\mathrm dy\\ & \le C \|f\|_\infty \boldsymbol{|}\mathbb S^{n-1} \boldsymbol{|} \int_0^{1/m} r^{n-1-\alpha} \,\mathrm dr \to 0,\qquad m\to\infty, \end{split}\] gleichmäßig in \(y\in X\). ◻

Als weitere wichtige Klasse von Räumen sind uns die \({\mathrm{L}}^p\)-Räume begegnet. Ein Kompaktheitskriterium in diesen Räumen läßt sich mit dem Satz von Arzela–Ascoli beweisen.

Satz 3.9 (Fréchet–Kolmogorov44). Eine Teilmenge \(F\subseteq {\mathrm{L}}^p(\mathbb R^n)\), \(p\in[1,\infty)\), ist relativ kompakt genau dann, wenn sie

  1. gleichmäßig normbeschränkt ist, d.h. \[\label{eq:FK-1} \sup_{f\in F}\|f\|_p < \infty,\]

  2. gleichgradig \(p\)-stetig und \(p\)-integrierbar ist, d.h. \[\label{eq:FK-2} \lim_{h\to 0} \sup_{f\in F} \int_{\mathbb R^n} |f(x+h)-f(x)|^p\,\mathrm dx=0\] und \[\label{eq:FK-3} \lim_{R\to\infty} \sup_{f\in F} \int_{|x|>R} |f(x)|^p \,\mathrm dx=0\]

gilt.

Beweisskizze. Wir beweisen wiederum nur das Kriterium und überlassen die Notwendigkeit der Bedingungen als Übungsaufgabe.

Für \(y\in\mathbb R^n\) sei \(T_y f(x) = f(x-y)\) die Translation um \(y\). Wegen Bedingung [eq:FK-2] gilt \(\lim_{y\to0} T_y f = f\) gleichmäßig in \(f\in F\). Bezeichne nun \(B_a=\{ y\in\mathbb R^n \;|\; |y|<a\}\) die Kugel vom Radius \(a\) und \[M_a f (x) = \frac1{\boldsymbol{|}B_a\boldsymbol{|}} \int_{B_a} T_y f (x) \,\mathrm dy\] den entsprechenden Mittelwert über die Translate. Dann gilt mit Hölder und Fubini–Tonelli \[\begin{split} \| M_a f- f\|_p &\le \frac1{\boldsymbol{|}B_a\boldsymbol{|}} \left(\int_{\mathbb R^n} \left( \int_{B_a} |f(x-y)-f(x)| \,\mathrm dy\right)^p\,\mathrm dx\right)^{1/p}\\ &\le \frac1{\boldsymbol{|}B_a\boldsymbol{|}} \left(\int_{\mathbb R^n} \int_{B_a} |f(x-y)-f(x)|^p\,\mathrm dy\; {\boldsymbol{|}B_a\boldsymbol{|}}^{p/p'}\,\mathrm dx\right)^{1/p}\\ &\le \left( \frac1{\boldsymbol{|}B_a\boldsymbol{|}}\int_{B_a} \int_{\mathbb R^n} |f(x-y)-f(x)|^p \,\mathrm dx \,\mathrm dy \right)^{1/p}\\ &\le \sup_{|y|\le a} \| T_y f-f\|_p \end{split}\] für \(p'\) den dualen Index zu \(p\). Also folgt \(\lim_{a\to0} M_a f=f\) gleichmäßig in \(f\in F\). Damit genügt es, die relative Kompaktheit der Menge \(\{ M_a f \;|\; f\in F\}\) für ein kleines, aber festes \(a>0\) zu zeigen. Dazu nutzen wir den Satz von Arzela–Ascoli: die Menge der Funktionen ist gleichmäßig beschränkt und gleichgradig stetig, \[\begin{split} | M_a f(x_1)-M_a f(x_2) | &\le \frac1{\boldsymbol{|}B_a\boldsymbol{|}} \int_{B_a} | f(x_1-y) - f(x_2-y) |\,\mathrm dy\\ &\le \left( \frac1{\boldsymbol{|}B_a\boldsymbol{|}} \int_{B_a} | f(x_1-y) - f(x_2-y) |^p \,\mathrm dy \right)^{1/p} \to 0 \end{split}\] für \(|x_1-x_2|\to 0\) gleichmäßig in \(f\in F\). Also kann man in \(\mathrm C( B_R )\) den Satz von Arzela–Ascoli anwenden. Wir finden also für jedes \(a>0\) und jedes \(\varepsilon>0\) eine endliche Familie \(M_a f_1,\ldots, M_a f_m\), so daß für jedes \(f\in F\) ein \(j\) mit \[\sup_{|x|\le R} | M_a f(x) - M_a f_j(x) | < \varepsilon\] existiert. Damit gilt aber \[\begin{split} \| M_a f- M_a f_j \|_p \le&\left(\int_{B_R} |M_a f(x) - M_a f_j(x) |^p \,\mathrm dx\right)^{1/p}\\& + \left( \int_{|x|>R} |M_a f(x) - M_a f_j(x) |^p \,\mathrm dx\right)^{1/p}. \end{split}\] Der erste Summand ist kleiner als \(\varepsilon{\boldsymbol{|}B_R\boldsymbol{|}}^{1/p}\). Der zweite kann durch \[\label{eq:FK-est} \|M_a f-f\|_p + \left(\int_{|x|>R} |f(x)-f_j(x)|^p\,\mathrm dx\right)^{1/p} + \|f_j - M_a f_j\|_p\] abgeschätzt werden. Der erste und dritte Term gehen gleichmäßig in \(f\in F\) mit \(a\) gegen Null. Der zweite ist mit [eq:FK-3] abschätzbar und geht gleichmäßig in \(f\in F\) mit \(R\to\infty\) gegen Null.

Sei nun \(\tilde\varepsilon>0\). Sei weiter \(a>0\) so klein gewählt, daß \[\sup_{f\in F} \|M_a f-f\|_p<\frac{\tilde\varepsilon}5\] gilt und \(R\) so groß, daß \[\sup_{f\in F} \left( \int_{|x|>R} |f(x)|^p \,\mathrm dx\right)^{1/p}<\frac{\tilde\varepsilon}{10}.\] Weiterhin sei \(\varepsilon= \tilde\varepsilon/ {\boldsymbol{|}B_R\boldsymbol{|}}^{1/p}\) und \(f_j\) wie oben konstruiert. Damit ist \(\{ M_a f_j : j=1,\ldots,m\}\) ein endliches \(4\tilde\varepsilon/5\) von \(\{M_a f: f\in F\}\) und damit ein endliches \(\tilde\varepsilon\)-Netz für \(F\). Also \(F\) ist relativ kompakt. ◻

Banachräume mit Basis

Als dritte Klasse wollen wir Banachräume mit Basis betrachten.

Definition 3.10. Sei \(V\) ein unendlichdimensionaler Banachraum und \((x_k)\) eine Folge von Elementen aus \(V\). Die Folge \((x_k)\) heißt Schauderbasis45 von \(V\), falls zu jedem \(x\in V\) eine eindeutig bestimmte Folge von Skalaren \(\alpha_k\in\mathbb K\) existiert, so daß \[x=\sum_{k=1}^\infty \alpha_kx_k\] gilt. Die Schauderbasis heißt normalisiert, falls \(\|x_k\|=1\) für alle \(k\) gilt.

Beispiel 3.11. Für die Räume \(\mathfrak c_0\) und \(\ell^p\) mit \(p\in[1,\infty)\) ist durch die Basisfolgen \({\mathbf e}_k=(0,\ldots,0,1,0,\ldots)\) (mit der \(1\) an \(k\)-ter Stelle) eine normalisierte Schauderbasis gegeben. Diese ist keine Schauderbasis für \(\ell^\infty\). (Warum?)

Sei im folgenden also \(V\) ein Banachraum mit normalisierter Schauderbasis \((x_k)\). Dann kann man jedem \(x\in V\) bijektiv eine Koeffizientenfolge \((\alpha_k)\) zuordnen. Die Menge der Koeffizientenfolgen bildet offensichtlich einen Vektorraum, nennen wir ihn \(\mathfrak S\). Auf diesem definieren wir durch \[|||(\alpha_k)|||=\sup_m \left\| \sum_{k=1}^m \alpha_kx_k\right\|=\sup_m \|P_mx\|\] eine Norm. Analog zur Vollständigkeit von \(\mathfrak c\) zeigt man die Vollständigkeit von \(\mathfrak S\). Weiter impliziert die Definition der Norm die Abschätzung \(\|x\|\leq|||(\alpha_k)|||\), also ist die Koeffizientenabbildung nach dem Satz über den inversen Operator stetig invertierbar und die Räume \(V\) und \(\mathfrak S\) sind isomorph. Es gibt also eine Konstante \(C\), so daß \[\| x\| \le |||(\alpha_k)||| \le C \|x\|\] Als Nebeneffekt haben wir gezeigt, daß sämtliche der Projektionen \(P_m\) beschränkte Operatoren sind und \(\sup_m\|P_m\|\le C <\infty\) gilt.

Für Banachräume mit Basis gilt das folgende Kompaktheitskriterium. Man fordert, daß die Koordinaten \(\alpha_k\) gleichmäßig gegen Null streben.

Satz 3.12. Sei \(V\) Banachraum mit normalisierter Schauderbasis \((x_k)\) und zugeordneten Projektoren \(P_m\). Eine Teilmenge \(F\subseteq V\) ist relativ kompakt genau dann, wenn \(F\) beschränkt ist und \[\label{eq:KompSchauder} \sup_{y\in F} \|y-P_{m}y\|\to0,\qquad m\to\infty\] gilt.

Proof. [\(\Leftarrow\)] Sei \(\varepsilon>0\). Dann wählen wir \(m\) so groß, daß \[\sup_{y\in F} \|y-P_{m}y\|<\frac\varepsilon 3\] gilt. Weiter ist \(\{ P_m y : y\in F\} \subseteq P_m V = \mathop{\mathrm{span}}\{x_1,\ldots,x_m\} \simeq \mathbb K^m\) als beschränkte Teilmenge (\(\|P_m y\|\le C \|y\|\)) eines endlichdimensionalen Teilraumes nach dem Satz von Heine–Borel relativ kompakt. Also existiert ein endliches \(\varepsilon/3\)-Netz \(P_m y_1\), …, \(P_m y_n\) für diese Menge, d.h., für jedes \(y\in F\) gibt es ein \(j\in\{1,2,\ldots,n\}\) mit \[\| P_m y - P_m y_j\| < \frac\varepsilon 3.\] Damit folgt aber \[\|y-y_j\| \le \|y-P_m y\|+\|P_m y-P_m y_j\| + \|P_m y_j- y_j\| <\varepsilon\] und \(\{y_1,\ldots, y_n\}\) bildet ein endliches \(\varepsilon\)-Netz für \(F\). Also ist \(F\) relativ kompakt.\(\bullet\qquad\) [\(\Rightarrow\)] Sei nun \(F\) relativ kompakt. Dann existiert zu jedem \(\varepsilon>0\) ein endliches \(\varepsilon/(3C)\)-Netz \(y_1,\ldots, y_n\) von \(F\). Damit existiert zu jedem \(y\in F\) ein \(j\in\{1,\ldots,n\}\) mit \(\|y-y_j\|<\varepsilon/(3C)\). Nach Definition der Schauderbasis streben die Reihenreste \(y_j-P_my_j\) für \(m\to\infty\) gegen Null. Also existiert ein von \(y\) unabhängiges \({N}(\varepsilon)\), so daß für alle \(m>{N}(\varepsilon)\) \[\| y_j - P_m y_j \| < \frac\varepsilon 3\] und damit \[\| y - P_my \| \le \| y - y_j \| + \|y_j - P_m y_j \| + \| P_m( y_j - y)\| \le \varepsilon\] für alle \(m>{N}(\varepsilon)\) gilt. ◻

Beispiel 3.13. Der Raum \(\mathrm C[a,b]\) besitzt eine Schauderbasis. Das klassische Beispiel einer solchen Basis für den \(\mathrm C[0,1]\) geht auf Schauder zurück und besteht aus linearen Splines.

Sei dazu \[\psi_0(x) = x\] und für \(k=1,2,\ldots\) sowie \(\ell=1,2,\ldots, 2^{k-1}\) \[\psi_{k,\ell} (x) = \begin{cases} x- (2\ell -2)2^{-k} , \qquad& (2\ell -2)2^{-k} \le x < (2\ell-1) 2^{-k}, \\ 2\ell 2^{-k} -x, & (2\ell-1) 2^{-k} \le x < 2\ell 2^{-k}, \\ 0, & \text{sonst}. \end{cases}\] Dann ist die Folge \[1, \quad\psi_0, \quad\psi_{1,1}, \quad\psi_{2,1}, \quad\psi_{2,2},\quad\psi_{3,1}, \quad\psi_{3,2}, \quad\psi_{3,3}, \quad\psi_{3,4}, \ldots\] eine Schauderbasis für \(\mathrm C[0,1]\).

Beispiele 3.14. Die Räume \({\mathrm{L}}^p[a,b]\), \(p\in[1,\infty)\) besitzen eine Schauderbasis. Beispiele dazu sind die sogenannten Waveletbasen, etwa die Haar-Basis bestehend aus den Funktionen \[\phi_0(x) = 1\] und \[\phi_{k,\ell} (x) = \begin{cases} 1, \qquad& (2\ell -2)2^{-k} \le x < (2\ell-1) 2^{-k}, \\ -1, & (2\ell-1) 2^{-k} \le x < 2\ell 2^{-k}, \\ 0, & \text{sonst}. \end{cases}\] für \(k=1,2,\ldots\) und \(\ell=1,2,\ldots,2^{k-1}\). In lexikographischer Reihenfolge \[\phi_0, \quad\phi_{1,1}, \quad\phi_{2,1}, \quad\phi_{2,2},\quad\phi_{3,1}, \quad\phi_{3,2}, \quad\phi_{3,3}, \quad\phi_{3,4}, \ldots\] ergeben sie eine Schauderbasis des \({\mathrm{L}}^p[0,1]\) für \(1\le p < \infty\). Die trigonometrischen Funktionen \(\{ 1, {\mathrm e}^{\mathrm ix}, {\mathrm e}^{-\mathrm ix}, {\mathrm e}^{2\mathrm ix},{\mathrm e}^{-2\mathrm ix},\ldots\}\) bilden eine Schauderbasis für \({\mathrm{L}}^p[0,2\pi]\) für \(1<p<\infty\), aber nicht für \({\mathrm L}^1[0,2\pi]\).

Beispiel 3.15. Jeder separable Hilbertraum besitzt eine Orthonormalbasis, also damit auch eine Schauderbasis.

Schauderbasen haben im allgemeinen einen Nachteil; die Basiseigenschaft und das Konvergenzverhalten hängt von der Reihenfolge ab. Eine Schauderbasis heiß unbedingt, falls für jedes \(x\in V\) die (eindeutig bestimmte) Darstellung als Reihe \(x=\sum_k \alpha_kx_k\) unbedingt konvergiert. Die oben erwähnte Haar-Basis ist unbedingt in \({\mathrm{L}}^p[a,b]\) für \(1<p<\infty\), während in \({\mathrm L}^1[a,b]\) keine unbedingte Schauderbasis existiert. Die trigonometrischen Funktionen sind nur für \(p=2\) unbedingt.

Stärker ist der Begriff einer Rieszbasis. Eine Schauderbasis heißt \(p\)-Rieszbasis, falls der oben definierte Folgenraum \(\mathfrak S\) isomorph zu \(\ell^p\) ist. Für eine \(p\)-Rieszbasis \((x_k)\) eines Banachraumes \(V\) existiert also eine Konstante \(C>0\), so daß für jedes \(x\in V\) und seine zugeordnete Koeffizientenfolge \((\alpha_k)\) \[\frac1C \| x\|^p \le \sum_{k=1}^\infty |\alpha_k|^p \le C \|x\|^p\] gilt. Rieszbasen sind immer unbedingt. Beispiele von \(p\)-Rieszbasen sind die oben erwähnten Waveletbasen auf \({\mathrm{L}}^p[a,b]\), \(1<p<\infty\).

3.2 Endlichdimensionale Operatoren und die Approximationseigenschaft

Wir wollen einen Operator \(A\in\mathcal L(V_1,V_2)\) als endlichdimensional bezeichnen, wenn sein Bild \(A(V_1)\) ein endlichdimensionaler Teilraum von \(V_2\) ist. Offenbar ist jeder endlichdimensionale Operator kompakt (da in endlichdimensionalen Räumen der Satz von Heine–Borel gilt).

Satz 3.16 (Grothendieck46). Sei \(V\) Banachraum. Dann sind die folgenden Aussagen äquivalent:

  1. Für jeden Banachraum \(W\) ist die Menge der endlichdimensionalen Operatoren dicht in \(\mathcal K(W,V)\)

  2. Für jede relativ kompakte Teilmenge \(K\subseteq V\) und jede Zahl \(\varepsilon>0\) existiert ein endlichdimensionaler Operator \(T_{K,\varepsilon}\in\mathcal K(V)\) mit \[\sup_{x\in K} \| T_{K,\varepsilon}x-x\| \leq \varepsilon.\]

Gelten diese Aussagen, so sagt man, \(V\) besitzt die Approximationseigenschaft.

Beweisskizze. Wir zeigen nur die Richtung (2)\(\Rightarrow\)(1), für den Schritt (1)\(\Rightarrow\)(2) verweisen wir auf die Literatur, z.B. das Buch von Lindenstrauss–Tzafriri.

Sei \(A\in\mathcal K(W,V)\) ein kompakter Operator. Dann ist das Bild der Einheitskugel \(K=A(B_1)\) aus \(W\) relativ kompakt in \(V\). Für \(\varepsilon>0\) sei \(P_\varepsilon:=T_{K,\varepsilon}\in\mathcal L(V)\) der nach Voraussetzung existierende endlichdimensionale Operator. Dann erfüllt \(A_\varepsilon=P_\varepsilon A\) nach Konstruktion \[\|A-A_\varepsilon\| = \sup_{x\in B_1} \| Ax - P_\varepsilon Ax\| \le \sup_{y\in K} \| y-P_\varepsilon y\| \leq\varepsilon\] und ist offensichtlich auch endlichdimensional. ◻

Beispiel 3.17. Alle Hilberträume besitzen die Approximationseigenschaft.

Proof. Wir zeigen die zweite der Eigenschaften und konstruieren den Operator \(T_{K,\varepsilon}\). Sei dazu \(\{x_1,\ldots, x_n\}\) ein endliches \(\varepsilon\)-Netz von \(K\) und \(U_\varepsilon=\mathop{\mathrm{span}}\{x_1,\ldots, x_n\}\). Zu jedem \(x\in K\) kann man nun eine Bestapproximation aus \(U_\varepsilon\) an \(x\) wählen. Nach dem Projektionssatz ist diese durch \(P_{U_\varepsilon}x\) gegeben und mindestens so gut, wie das am nächsten liegende \(x_j\). Nach Konstruktion gilt also \(\|P_{U_\varepsilon}x-x\|\leq\varepsilon\). ◻

Beispiel 3.18. Sei \(V\) Banachraum mit Schauderbasis. Dann besitzt \(V\) die Approximationseigenschaft.

Proof. Folgt direkt aus dem Kompaktheitskriterium für Banachräume mit Basis, der gesuchte Operator ist durch den durch die Basis bestimmten Projektor \(P_n\) für hinreichend großes \(n\) gegeben. ◻

Beispiele 3.19. Die Räume \(\mathfrak c_0\), \(\mathfrak c\) und \(\ell^p\), \(p\in[1,\infty)\), besitzen die Approximationseigenschaft. Ebenso besitzt \({\mathrm{L}}^p[a,b]\), \(p\in[1,\infty)\), und damit auch \({\mathrm{L}}^p(\mathbb R^n)\), \(p\in[1,\infty)\), die Approximationseigenschaft.

Es gilt ebenso eine duale Aussage zu Satz Satz 3.16. Ein Beweis findet sich ebenso im Buch von Lindenstrauss–Tzafriri.

Satz 3.20 (Grothendieck). Sei \(V\) Banachraum. Dann sind die folgenden Aussagen äquivalent:

  1. Für jeden Banachraum \(W\) ist die Menge der endlichdimensionalen Operatoren dicht in \(\mathcal K(V,W)\)

  2. \(V'\) besitzt die Approximationseigenschaft.

3.3 Riesz-Theorie kompakter Operatoren

Sei \(K\in\mathcal K(V)\) kompakter Operator. Gegenstand dieses Abschnittes soll es sein, eine Lösungstheorie für Gleichungen der Form \[Lx=(I-K)x=y,\qquad y\in V,\] in einem Banachraum zu entwickeln. Behandelt werden sollen dabei die Fragen nach der Existenz von Lösungen, deren Anzahl/Dimension, und deren Eindeutigkeit.

Als Beispiel kann man Integralgleichungen zweiter Art, \[f(y)-\int_X k(x,y)f(x)\mathrm d x=g(y)\] zu vorgegebenem stetigen (oder schwach singulären) Kern \(k\in \mathrm C(X\times X)\) und rechter Seite \(g\in \mathrm C(X)\), im Hinterkopf behalten.

Ein erster Schritt besteht in der Lösung des homogenen Problems. Die Kompaktheit von \(K\) impliziert sofort

Satz 3.21 (Riesz). Der Nullraum \(\mathop{\mathrm{ker}}(L)\) ist endlichdimensional.

Proof. Eingeschränkt auf den Nullraum stimmt \(K\) mit der Identität überein. Die identische Abbildung ist aber nur in endlichdimensionalen Räumen kompakt. ◻

Satz 3.22 (Riesz). \(\mathop{\mathrm{ran}}(L)\) ist abgeschlossen in \(V\).

Proof. Sei \(y\in\overline{\mathop{\mathrm{ran}}}(L)\) ein Element des Abschlusses von \(\mathop{\mathrm{ran}}(L)\). Dann existiert eine Folge \(x_n\in V\) mit \(Lx_n\to y\). Da \(\mathop{\mathrm{ker}}(L)\) endlichdimensional ist, existiert zu jedem \(x_n\) eine Bestapproximation \(\xi_n\in \mathop{\mathrm{ker}}(L)\), \(\|x_n-\xi_n\|=\inf_{\xi\in \mathop{\mathrm{ker}}(L)}\|x_n-\xi\|\).

Schritt 1: Die Folge \(x_n-\xi_n\) ist beschränkt. Wäre sie es nicht, gäbe es eine Teilfolge \(x_{n_k}-\xi_{n_k}\) mit \(\|x_{n_k}-\xi_{n_k}\|\geq k\). Normiert man \[\tilde x_k = \frac{x_{n_k}-\xi_{n_k}}{\|x_{n_k}-\xi_{n_k}\|},\] so existiert wegen der Kompaktheit von \(K\) eine Teilfolge \(\tilde x_{k_j}\) mit \(K \tilde x_{k_j}\to \tilde y\) für \(j\to\infty\). Weiter ist \[\|L\tilde x_k\|= \|L x_{n_k}\|/\|x_{n_k}-\xi_{n_k}\|\leq \|L x_{n_k}\|/k\to 0,\] da \(Lx_n\) konvergent ist. Insbesondere ist also \[\tilde x_{k_j}=L\tilde x_{k_j}+K\tilde x_{k_j}\to\tilde y,\] also \(L\tilde y=0\), \(\tilde y\in \mathop{\mathrm{ker}}(L)\). Das impliziert aber \[\|\tilde x_{k_j}-\tilde y\| =\frac1{\| x_{n_{k_j}}-\xi_{n_{k_j}}\|}\big\|x_{n_{k_j}}-\underbrace{\xi_{n_{k_j}}-\| x_{n_{k_j}}-\xi_{n_{k_j}}\|\,\tilde y}_{\in \mathop{\mathrm{ker}}(L)}\big\| \geq \frac1{\| x_{n_k}-\xi_{n_k}\|}\|x_{n_k}-\xi_{n_k}\|=1\] im Widerspruch zur Konvergenz. Also ist \(x_n-\xi_n\) beschränkt.

Schritt 2: Wegen der Kompaktheit von \(K\) besitzt \(K(x_n-\xi_n)\) eine konvergente Teilfolge. Dies impliziert aber die Existenz einer konvergenten Teilfolge von \(x_n-\xi_n\), da \[K (x_{n_k}-\xi_{n_k}) = (x_{n_k}-\xi_{n_k})-\underbrace{L(x_{n_k}-\xi_{n_k})}_{\to y}\to x-y.\] Also existiert \(x\in V\) mit \(x_{n_k}-\xi_{n_k}\to x\) und \(Lx=y\). ◻

Da Potenzen von \(L\) die Form \[L^n=(I-K)^n=I-\sum_{k=1}^n (-1)^{k-1}\binom nk K^k\] haben, gelten die ersten beiden Rieszschen Sätze auch für diese Operatoren. Insbesondere sind die Nullräume \(\mathop{\mathrm{ker}}(L^k)\) alle endlichdimensional und die Bildräume \(\mathop{\mathrm{ran}}(L^k)\) alle abgeschlossen. Beide hängen eng zusammen.

Satz 3.23 (Riesz). Es existiert ein \(\ell\in\mathbb N=\{0,1,2,\ldots\}\), so daß

\[\begin{aligned} \label{eq:rieszkette1} \{0\} \varsubsetneq \mathop{\mathrm{ker}}(L)\varsubsetneq \mathop{\mathrm{ker}}(L^2)\varsubsetneq \ldots\varsubsetneq \mathop{\mathrm{ker}}(L^\ell)&=\mathop{\mathrm{ker}}(L^{\ell+1}) =\ldots\\ \label{eq:rieszkette2} V\varsupsetneq \mathop{\mathrm{ran}}(L)\varsupsetneq \mathop{\mathrm{ran}}(L^2)\varsupsetneq\ldots\varsupsetneq \mathop{\mathrm{ran}}(L^\ell) &= \mathop{\mathrm{ran}}(L^{\ell+1})=\ldots \end{aligned}\]

Weiter gilt mit dieser Zahl \(\ell\) \[V=\mathop{\mathrm{ker}}(L^\ell)\dotplus \mathop{\mathrm{ran}}(L^\ell) .\] Man sagt, der Operator \(L\) ist kettenendlich mit Kettenlänge (oder auch Riesz-Zahl) \(\ell\).

Beispiel 3.24. Bevor wir zum Beweis dieses Satzes kommen, ein Beispiel. Sei \(K\in\mathbb C^{n\times n}\) eine komplexe \(n\times n\)-Matrix und sei \(1\) Eigenwert von \(K\). Dann entspricht die Kettenlänge des Operators \(L=I-K\) der Dimension des größten Jordanblocks zum Eigenwert \(1\). Zum Beweis betrachte man die Darstellung von \(L\) in Jordan-Normalform.

Beweis zu Satz Satz 3.23. Wir zerlegen den Beweis in Teilschritte.

Schritt 1: Wir zeigen die Inklusionskette [eq:rieszkette1]. Die Inklusionen \(\mathop{\mathrm{ker}}(L^n)\subseteq \mathop{\mathrm{ker}}(L^{n+1})\) sind klar. Angenommen alle diese Inklusionen sind echt. Dann existiert nach dem Rieszschen Lemma von der Fastsenkrechten (Lemma Lemma 1.40) zu jedem \(n\) ein \(x_n\in \mathop{\mathrm{ker}}(L^{n+1})\) mit \(\|x_n\|=1\) und \(\mathrm{dist}\;(x_n,\mathop{\mathrm{ker}}(L^n))\geq\frac12\). Wir untersuchen die Folge \((x_n)\). Wegen \[L^n(x_m+Lx_n-Lx_m)=(L^{n-m-1}-L^{n-m})L^{m+1}x_m+L^{n+1}x_n=0\] für \(n>m\) ist \(\|Kx_n-Kx_m\|=\|x_n-(x_m+Lx_n-Lx_m)\|\geq\frac12\). Damit kann \((Kx_n)\) aber keine konvergente Teilfolge enthalten, im Widerspruch zur Kompaktheit von \(K\) und der Beschränktheit von \((x_n)\).

Schritt 2: Angenommen \(\mathop{\mathrm{ker}}(L^k)=\mathop{\mathrm{ker}}(L^{k+1})\). Dann folgt \[\ker (L^{k+2}) = \{ x \mid L x \in \ker( L^{k+1}) = \ker (L^k) \} = \ker( L^{k+1})\] und nach der ersten Gleichheit bleibt die Inklusionskette konstant. Sei \(\ell\) die kleinste Zahl mit \(\mathop{\mathrm{ker}}(L^\ell)=\mathop{\mathrm{ker}}(L^{\ell+1})\).

Schritt 3: Inklusionskette [eq:rieszkette2]. Die Inklusion \(\mathop{\mathrm{ran}}(L^n)\supseteq \mathop{\mathrm{ran}}(L^{n+1})\) ist trivial. Angenommen, alle Inklusionen sind echt. Dann kann man wieder mit dem Rieszschen Lemma Lemma 1.40 eine Folge \(y_n\in \mathop{\mathrm{ran}}(L^n)\), \(\|y_n\|=1\) mit \(\mathop{\mathrm{dist}}(y_n,\mathop{\mathrm{ran}}(L^{n+1}))\geq\frac12\) konstruieren. Setzt man nun \(y_n=L^nx_n\), so folgt ganz analog für \(m>n\) daß \(Ky_n-Ky_m=y_n-(y_m+Ly_n-Ly_m)\) mit \[y_m+Ly_n-Ly_m=L^{n+1}(L^{m-n-1}x_m+x_n-L^{m-n}x_m) \in \mathop{\mathrm{ran}}(L^{n+1})\] und damit \(\|Ky_n-Ky_m\|\geq\frac12\). Aber das widerspricht der Kompaktheit von \(K\). Also ist auch diese Inklusionskette endlich und es gibt ein \(k\) mit \(\mathop{\mathrm{ran}}(L^k)=\mathop{\mathrm{ran}}(L^{k+1})\).

Schritt 4: Aus \(\mathop{\mathrm{ran}}(L^k)=\mathop{\mathrm{ran}}(L^{k+1})\) folgt wiederum \[\mathop{\mathrm{ran}}(L^{k+2} )= L \mathop{\mathrm{ran}}( L^{k+1}) = L\mathop{\mathrm{ran}}(L^k) = \mathop{\mathrm{ran}}(L^{k+1}).\] Sei \(\tilde \ell\) die kleinste Zahl mit \(\mathop{\mathrm{ran}}(L^{ \tilde\ell})=\mathop{\mathrm{ran}}(L^{\tilde\ell+1})\). Damit ist mit einem neuen \(\tilde\ell\) die zweite Inklusionskette gezeigt.

Schritt 5: Wir zeigen \(\ell=\tilde\ell\). Wir zeigen dies indirekt und nehmen zuerst an, dass \(\ell>\tilde\ell\). Sei \(x\in \mathop{\mathrm{ker}}(L^\ell)\setminus \mathop{\mathrm{ker}}(L^{\ell-1})\). Wegen \(\mathop{\mathrm{ran}}(L^{\ell-1})=\mathop{\mathrm{ran}}(L^\ell)\) existiert damit ein \(\tilde x\in V\) mit \(0\neq L^{\ell-1}x=L^\ell\tilde x\). Andererseits ist \(L^{\ell+1}\tilde x=L^\ell x=0\). Da \(\mathop{\mathrm{ker}}(L^{\ell+1})=\mathop{\mathrm{ker}}(L^\ell)\), folgt damit aber \(L^\ell \tilde x=0\). Widerspruch!

Also gilt \(\ell\le \tilde \ell\). Angenommen, es gilt sogar \(\ell<\tilde\ell\). Sei nun \(y\in \mathop{\mathrm{ran}}(L^{\tilde\ell-1})\). Dann gibt es ein \(x\) mit \(Ly=L^{\tilde\ell}x=L^{\tilde\ell+1}\tilde x\), also \(0=L(y-L^{\tilde\ell}\tilde x)=L^{\tilde\ell}(x-L\tilde x)\). Da \(\mathop{\mathrm{ker}}(L^{\tilde\ell})=\mathop{\mathrm{ker}}(L^{\tilde\ell-1})\), folgt \(L^{\tilde\ell-1}(x-L\tilde x)=0\) also \(y=L^{\tilde\ell}\tilde x\) und damit \(\mathop{\mathrm{ran}}(L^{\tilde\ell-1})=\mathop{\mathrm{ran}}(L^{\tilde\ell})\) im Widerspruch zur Definition von \(\tilde\ell\).

Also muß \(\ell=\tilde\ell\) gelten.

Schritt 6: Wir zeigen die direkte Summe. Sei \(y\in \mathop{\mathrm{ker}}(L^\ell)\cap \mathop{\mathrm{ran}}(L^\ell)\). Dann existiert \(x\in V\) mit \(y=L^\ell x\) und damit \(L^{2\ell}x=0\). Da aber \(\mathop{\mathrm{ker}}(L^{2\ell})=\mathop{\mathrm{ker}}(L^\ell)\) gilt, muß damit \(x\in \mathop{\mathrm{ker}}(L^\ell)\) sein, also \(y=0\) gelten.

Sei nun \(x\in V\) beliebig. Dann folgt mit \(y=L^\ell x\in \mathop{\mathrm{ran}}(L^\ell)\) die Existenz eines \(\tilde x\) mit \(L^\ell x=L^{2\ell}\tilde x\) und damit \(L^\ell(x-L^\ell\tilde x)=0\). Also folgt \(x-L^\ell\tilde x\in \mathop{\mathrm{ker}}(L^\ell)\) und \(x=L^\ell\tilde x+(x-L^\ell\tilde x)\) ist die gesuchte Zerlegung von \(x\). ◻

Nun können wir die soeben konstruierte Lösungstheorie in einem Satz zusammenfassen. Wir unterscheiden die Fälle \(\ell=0\) und \(\ell>0\).

Satz 3.25 (Riesz). Sei \(V\) Banachraum47 und \(K\in\mathcal K(V)\).

  1. Ist \(I-K\) injektiv, so ist \(I-K\) invertierbar.

  2. Ist \(L=I-K\) nicht injektiv, so ist der Projektionsoperator \(P:V\to \mathop{\mathrm{ker}}(I-K)^\ell\), der durch die Zerlegung \(V=\mathop{\mathrm{ker}}(L^\ell)\dotplus \mathop{\mathrm{ran}}(L^\ell)\) bestimmt wird, kompakt und \(L-P=I-K-P\) invertierbar.

Proof.  (1) Ist \(I-K\) injektiv, so folgt \(\ell=0\) und damit \(\mathop{\mathrm{ran}}(I-K)=V\). Nach dem Satz über den inversen Operator existiert \((I-K)^{-1}\in\mathcal L(V)\). \(\bullet\qquad\) (2) Auf \(\mathop{\mathrm{ker}}(L^\ell)\) definiert \[\|x\|_\ell=\inf_{y\in \mathop{\mathrm{ran}}(L^\ell)}\|x+y\|\] eine Norm. Da \(\mathop{\mathrm{ker}}(L^\ell)\) endlichdimensional ist, ist diese auf \(\mathop{\mathrm{ker}}(L^\ell)\) zu \(\|\cdot\|\) äquivalent. Es gibt also ein \(C\) mit \(\|x\|\leq C\|x\|_\ell\) und damit für \(z\in V\) \[\|Pz\|\leq C\inf_{y\in \mathop{\mathrm{ran}}(L^\ell)}\|Pz+y\| \leq C \|z\| ,\qquad z-Pz\in \mathop{\mathrm{ran}}(L^\ell).\] Damit ist \(P\) beschränkt und endlichdimensional, also kompakt. Also kann man auf \(L-P=I-K-P\) die Rieszschen Sätze anwenden. Da aus \(x\in \mathop{\mathrm{ker}}(L-P)\), \[Lx-Px=0,\] und damit \(L^{\ell+1}x=0\) folgt, gilt \(x\in \mathop{\mathrm{ker}}(L^\ell)=\mathop{\mathrm{ker}}(L^{\ell+1})\) und damit \(Px=x\), also \(Lx=x\). Damit folgt aber per Induktion \(L^\ell x=x\), also \(x=0\). Durch Anwenden von Teil 1 ist der Satz bewiesen. ◻

Beispiel 3.26. Wendet man die Aussagen konkret auf Integralgleichungen zweiter Art \[L f(x) = f(x)-\int_X k(x,y)f(y)\mathrm d y=g(x)\] im Raum \(\mathrm C(X)\) an, so hat man also zuerst die homogene Gleichung (\(g(x)\equiv0\)) zu untersuchen. Besitzt diese nur die triviale Lösung in \(\mathrm C(X)\), so existiert zu jedem \(g\in \mathrm C(X)\) genau eine Lösung \(f\in \mathrm C(X)\) und der Operator \(g\mapsto f\) ist beschränkt.

Hat das homogene Problem nichttriviale Lösungen, so muß die rechte Seite \(g\) Bedingungen erfüllen, so daß das Problem lösbar ist. Diese sind durch den Projektor \(P\) darstellbar.

Nimmt man nun eine Lösung \(f\), so kann man diese in einen Anteil \(f_1\) aus \(\mathop{\mathrm{ker}}(L^\ell)\) und einen Anteil \(f_2\) aus \(\mathop{\mathrm{ran}}(L^\ell)\) zerlegen. Wegen \[(L-P)^{-1}g=(L-P)^{-1}Lf=f+(L-P)^{-1}Pf\] erfüllt \(f_1=Pf\) das lineare Gleichungssystem (endlicher Dimension) \[(I+P(L-P)^{-1})f_1=P(L-P)^{-1}g\] in \(\mathop{\mathrm{ker}}(L^\ell)\). Es gilt \(g\in\mathop{\mathrm{ran}}(L)\) genau dann, wenn dieses Gleichungssystem lösbar ist. Sei \(f_1\) eine der Lösungen. Da \((L-P)f = g - Pf = g-f_1\) gilt, ist \[f=(L-P)^{-1} (g-f_1)\] die zugehörige Lösung der Ausgangsgleichung.

3.4 Fredholm-Theorie kompakter Operatoren

Bis jetzt haben wir nur den Operator \(K\) und die Gleichung \(x-Kx=y\) in \(V\) betrachtet. Jetzt wollen wir das Ganze mit Dualitätstheorie verbinden. Ist der transponierte Operator \(K^\dagger :V'\to V'\) ebenfalls kompakt, so können wir vollkommen analog die Gleichung \(\phi-K^\dagger \phi=\psi\) in \(V'\) behandeln und die Sätze der Rieszschen Theorie gelten. Wir wollen nun beide Gleichungen gleichzeitig betrachten.

Vorerst ein erster Satz zum Falle eines Hilbertraumes \(H\). In diesem Falle (und bei korrekter Identifikation der beiden Räume) sprechen wir von adjungierten Operatoren \(A\) und \(A^*\), falls \[{\pmb(Ax,y\pmb)}={\pmb(x,A^*y\pmb)}\] gilt. Existenz, Eindeutigkeit und Eigenschaften folgen direkt aus den entsprechenden Aussagen über transponierte Operatoren.

Satz 3.27. Seien \(H_1,H_2\) Hilberträume und sei \(K\in\mathcal K(H_1,H_2)\) kompakt. Dann ist der adjungierte Operator \(K^*\) ebenso kompakt.

Proof. Da \(K\) kompakt ist, ist auch \(KK^*\) kompakt. Insbesondere existiert zu jeder Folge \((x_n)\) aus \(H_2\), \(\|x_n\|\leq C\), eine Teilfolge \((x_{n_k})\) für die \(KK^*x_{n_k}\) konvergiert. Aber dann folgt \[\|K^*(x_{n_k}-x_{n_l})\|^2={\pmb(KK^*(x_{n_k}-x_{n_l}),(x_{n_k}-x_{n_l})\pmb)}\leq 2C \|KK^*(x_{n_k}-x_{n_l})\|\to0.\] Damit haben wir eine konvergente Teilfolge konstruiert und \(K^*\) ist kompakt. ◻

Zentral für die nachfolgende Theorie ist folgende Verallgemeinerung.

Satz 3.28 (Schauder). Seien \(V_1\) und \(V_2\) Banachräume. Es gilt \(K\in\mathcal K(V_1,V_2)\) genau dann, wenn \(K^\dagger \in\mathcal K(V_2',V_1')\).

Proof. [\(\Rightarrow\)] Wir zeigen, daß \(K^\dagger\) kompakt ist. Sei \(B_1=\{x\in V_1 : \|x\| < 1\}\) und \(M\) der Abschluß von \(K(B_1)\) in \(V_2\). Dann ist \(M\) kompakt. Sei weiter \(B\subseteq V_2'\) beschränkt. Dann ist wegen \[|\langle\phi,y_1-y_2\rangle|\leq\|y_1-y_2\|\,\sup_{\psi \in B}\|\psi\|\] für \(y_1,y_2\in M\) und \(\phi\in B\) die Menge \(B\) in \(\mathrm C(M)\) gleichmäßig beschränkt und gleichgradig stetig; nach dem Satz von Arzela–Ascoli also relativ kompakt. Also existiert zu jedem \(\varepsilon>0\) ein endliches \(\varepsilon\)-Netz \(\{ \phi_1,\ldots,\phi_n\} \subset B\). Ist \(\phi\in B\) beliebig, so finden wir also ein \(j\in\{1,\ldots, n\}\) mit \[\| \phi-\phi_j \|_{\mathrm C(M)} = \sup_{y\in M} | \langle\phi-\phi_j, y\rangle | <\varepsilon.\] Da \(K^\dagger \phi = \phi\circ K\) gilt, folgt daraus \[\| K^\dagger \phi - K^\dagger \phi_j\| = \sup_{x\in B_1} | \langle \phi-\phi_j , K x\rangle | \le \sup_{y\in M} | \langle \phi-\phi_j , y\rangle | < \varepsilon\] und da \(K^\dagger \phi \in K^\dagger(B)\) beliebig war, ist \(\{ K^\dagger \phi_1,\ldots, K^\dagger \phi_n\}\) ein endliches \(\varepsilon\)-Netz von \(K^\dagger (B)\). Da \(\varepsilon\) beliebig war, ist \(K^\dagger(B)\) relativ kompakt und damit \(K^\dagger\in\mathcal K(V_2', V_1')\). \(\bullet\qquad\) [\(\Leftarrow\)] Nach dem ersten Teil ist \((K^\dagger)^\dagger\) kompakt als Operator von \(V_1''\) nach \(V_2''\). Da \(V_1\) abgeschlossener Teilraum von \(V_1''\) ist und auf diesem \(K\) und \((K^\dagger)^\dagger\) übereinstimmen, ist \(K : V_1\to V_2''\) kompakt, also da \(\mathop{\mathrm{ran}}(K)\subseteq V_2\subseteq V_2''\) auch \(K\in\mathcal K(V_1,V_2)\). ◻

Für den folgenden Satz benötigen wir einen Zusammenhang zwischen Unterräumen aus \(V\) und Unterräumen aus \(V'\). Dazu führen wir den Annihilator \[U^\perp = \{ \phi\in V'\,|\, \forall x\in U\,:\,\langle\phi,x\rangle=0\}\] eines Unterraumes \(U\) von \(V\) ein. Durch Dualisieren erhält man den Koannihilator \[{}^\perp W = \{ x\in V\,|\, \forall \phi\in W\,:\,\langle\phi,x\rangle=0\},\] in nichtreflexiven Räumen ist zwischen \({}^\perp W\) und \(W^\perp\) zu unterscheiden. Dabei gilt (als Folgerung des Satzes von Hahn–Banach)

Proposition 3.29. Sei \(W\) abgeschlossener Unterraum von \(V\). Dann gilt \[{}^\perp(W^\perp)=W.%={({{}^\perp W})}^\perp.\]

Für einen Teilraum \(W\subset V'\) eines Dualraumes gilt im Allgemeinen allerdings nur \(W\subset ({}^\perp W){}^\perp\). Der Begriff des Annihilators verallgemeinert das orthogonale Komplement.

Satz 3.30 (Fredholm48). Sei \(K\in\mathcal K(V)\) kompakt. Dann gilt \[\mathop{\mathrm{ker}}(I-K)={}^\perp \mathop{\mathrm{ran}}(I-K^\dagger )\qquad\text{und}\qquad \mathop{\mathrm{ker}}(I-K^\dagger )= \mathop{\mathrm{ran}}(I-K)^\perp.\]

Proof. Beide Aussagen ergeben sich direkt durch nachrechnen, \[\begin{aligned} x\in \mathop{\mathrm{ker}}(I-K) \quad&\Longleftrightarrow\quad x=Kx \quad\Longleftrightarrow\quad \forall_{\phi\in V'} \quad \langle \phi,x- Kx\rangle=0 \\ \quad&\Longleftrightarrow\quad \forall_{\phi\in V'} \quad \langle \phi - K^\dagger \phi,x\rangle = 0 \quad\Longleftrightarrow\quad x\in{}^\perp \mathop{\mathrm{ran}}(I-K^\dagger)\end{aligned}\] liefert die erste Identität und Dualisieren \[\begin{aligned} \phi\in \mathop{\mathrm{ker}}(I-K^\dagger) \quad&\Longleftrightarrow\quad \phi=K^\dagger\phi \quad\Longleftrightarrow\quad \forall_{x\in V} \quad \langle \phi - K^\dagger\phi,x\rangle =0\\ \quad&\Longleftrightarrow\quad \forall_{x\in V} \quad \langle \phi,x- Kx\rangle=0 \quad\Longleftrightarrow\quad \phi\in \mathop{\mathrm{ran}}(I-K)^\perp\end{aligned}\] die zweite. ◻

Da \(\mathop{\mathrm{ran}}(I-K)\) abgeschlossen ist, folgt aus \(\mathop{\mathrm{ker}}(I-K^\dagger )= \mathop{\mathrm{ran}}(I-K)^\perp\) schon \[\mathop{\mathrm{ran}}(I-K)={}^\perp\mathop{\mathrm{ker}}(I-K^\dagger ).\] Aus diesem ersten Fredholmschen Satz ergibt sich damit ein wichtiges Lösbarkeitskriterium für die betrachteten Operatorgleichungen, die Fredholmsche Alternative. Entweder ist die adjungierte Gleichung \[\label{eq:FredAlt1} \phi-K^\dagger \phi=0\] in \(V'\) eindeutig (und damit nur trivial) lösbar. Dann ist für jede rechte Seite \(y\in V\) die Gleichung \[\label{eq:FredAlt2} x-Kx=y\] eindeutig lösbar. Oder die adjungierte Gleichung [eq:FredAlt1] besitzt nichttriviale Lösungen. Dann ist [eq:FredAlt2] genau dann lösbar, wenn für jede Lösung \(\phi\) von [eq:FredAlt1] \[\langle\phi,y \rangle=0\] gilt. Die Lösung von [eq:FredAlt2] ist nicht eindeutig.

Den ersten Fredholmschen Satz kann man ebenso auf die Potenzen von \(L=I-K\) anwenden. Es gilt \[\mathop{\mathrm{ker}}(L^k)={}^\perp \mathop{\mathrm{ran}}((L^\dagger )^k),\qquad \mathop{\mathrm{ran}}(L^k)={}^\perp \mathop{\mathrm{ker}}((L^\dagger )^k)\] für alle \(k\). Insbesondere ergibt sich als Folgerung:

Korollar 3.31. Die Kettenlänge \(\ell\) der Operatoren \(L\) und \(L^\dagger\) stimmt überein.

Zwischen \(\mathop{\mathrm{ker}}(L^\ell)\) und \(\mathop{\mathrm{ker}}((L^\dagger)^\ell)\) besteht ein tieferer Zusammenhang. Sie sind zueinander dual.

Satz 3.32 (Fredholm). Sei \(K\in\mathcal K(V)\) kompakt und \(\ell\) die Kettenlänge von \(L=I-K\). Dann gilt \[\mathop{\mathrm{ker}}((L^\dagger)^\ell) \simeq (\mathop{\mathrm{ker}}(L^\ell))',\] wobei der Isomorphismus durch die Einschränkung \(\cdot|_{\mathop{\mathrm{ker}}(L^\ell)}\) gegeben ist.

Proof. Mit dem ersten Rieszschen Satz folgt die Endlichdimensionalität beider Unterräume.

Wir zeigen zuerst, daß die Einschränkung injektiv ist. Seien dazu \(\phi,\psi\in \mathop{\mathrm{ker}}((L^\dagger )^\ell)\), \(\phi\neq\psi\). Dann existiert ein \(x\in V\) mit \(\langle\phi,x\rangle\neq\langle\psi,x\rangle\). Dieses \(x\) kann man nach dem dritten Rieszschen Satz in seine Komponenten \(x_1\in \mathop{\mathrm{ker}}(L^\ell)\) und \(x_2\in \mathop{\mathrm{ran}}(L^\ell)\) zerlegen. Da \(x_2\in \mathop{\mathrm{ran}}(L^\ell)={}^\perp \mathop{\mathrm{ker}}((L^\dagger )^\ell)\) gilt, folgt \(\langle\phi,x_2\rangle=\langle\psi,x_2\rangle=0\) und damit \(\langle\phi,x_1\rangle\neq\langle\psi,x_1\rangle\). Damit ist die Einschränkung \(\cdot|_{\mathop{\mathrm{ker}}(L^\ell)} : \mathop{\mathrm{ker}}((L^\dagger )^\ell) \to (\mathop{\mathrm{ker}}(L^\ell))'\) injektiv.

Die zweite Beweisrichtung folgt durch Dualisieren. Sei \(x,y\in \mathop{\mathrm{ker}}(L^\ell)\), \(x\neq y\). Dann gibt es ein \(\phi\in V'\) mit \(\langle\phi,x\rangle\neq\langle\phi,y\rangle\). Wendet man in \(V'\) den dritten Rieszschen Satz an und zerlegt \(\phi=\phi_1+\phi_2\) in seine Komponenten aus \(\mathop{\mathrm{ker}}((L^\dagger )^{\ell})\) und \(\mathop{\mathrm{ran}}((L^\dagger )^{\ell})\), so folgt wieder \(\langle\phi_2,x\rangle=\langle\phi_2,y\rangle=0\) und damit \(\langle\phi_1,x\rangle\neq\langle\phi_1,y\rangle\). Also ist \(\mathop{\mathrm{ker}}((L^\dagger )^\ell)\) punktetrennend auf \(\mathop{\mathrm{ker}}(L^\ell)\) und damit \[\dim \mathop{\mathrm{ker}}((L^\dagger )^\ell)\geq \dim \mathop{\mathrm{ker}}(L^\ell)\] und obige Einschränkung ist auch surjektiv. ◻

Eine Folgerung heben wir dabei hervor. Es gilt \(\dim \mathop{\mathrm{ker}}(L^\ell)=\dim \mathop{\mathrm{ker}}((L^\dagger )^\ell)\). Dasselbe gilt auch für die niedrigeren Potenzen von \(L\), hier ist es allerdings reine lineare Algebra.

Satz 3.33 (Fredholm). Sei \(K\in\mathcal K(V)\) kompakt. Dann gilt \[\dim \mathop{\mathrm{ker}}(I-K)=\dim \mathop{\mathrm{ker}}(I-K^\dagger ).\]

Proof. Wir nutzen die Dualitätsaussage des letzten Satzes zum Beweis. Sei also wieder \(\ell\) die Kettenlänge des Operators \(L=I-K\). Dann folgt mit dem dritten Rieszschen Satz \(L:\mathop{\mathrm{ran}}(L^\ell)\to \mathop{\mathrm{ran}}(L^\ell)\) und \(L:\mathop{\mathrm{ker}}(L^\ell)\to \mathop{\mathrm{ker}}(L^\ell)\), ebenso \(L^\dagger :\mathop{\mathrm{ker}}((L^\dagger )^\ell)\to \mathop{\mathrm{ker}}((L^\dagger )^\ell)\). Wir schränken unsere Betrachtung auf den (endlichdimensionalen) Raum \(U=\mathop{\mathrm{ker}}(L^\ell)\) und sein kanonisches Dual \(U'=\mathop{\mathrm{ker}}((L^\dagger )^\ell)\) ein. Dann gilt \(L:U\to U\) und die Bestimmung von \(\mathop{\mathrm{ker}}(L)\) entspricht der Lösung eines linearen Gleichungssystems. Die zu beweisende Aussage folgt damit direkt aus dem Rangsatz der linearen Algebra, \[\dim \mathop{\mathrm{ker}}(L)=\dim U - \mathop{\mathrm{rank}}L=\dim U' - \mathop{\mathrm{rank}}L^\dagger =\dim \mathop{\mathrm{ker}}(L^\dagger ).\] ◻

Bemerkung. Statt mit dem vollen Dualraum kann man die Fredholmtheorie auch mit sogenannten Dualsystemen aufbauen. Ein Paar \((V,W)\) von Banachräumen \(V\) und \(W\) heißt dabei ein Dualsystem, falls eine separat stetige bilineare Abbildung \[\langle\cdot,\cdot\rangle:V\times W\to\mathbb K,\qquad\qquad |\langle x,y\rangle |\leq C \|x\|_V\,\|y\|_W\] gegeben ist, und diese die Trennungseigenschaften

\[\begin{aligned} \forall_{x\in V}\quad \langle x,y\rangle=0\quad&\Longrightarrow\quad y=0\\ \forall_{y\in W}\quad \langle x,y\rangle=0\quad&\Longrightarrow\quad x=0\end{aligned}\]

besitzt. Für zwei Dualsysteme \((V_1,W_2)\) und \((V_2,W_2)\) heißen Operatoren \(A\in\mathcal L(V_1,V_2)\) und \(A^\dagger \in\mathcal L(W_2,W_1)\) zueinander konjugiert,, falls für alle \(x\in V_1\) und \(y\in W_2\) \[\langle Ax,y\rangle = \langle x,A^\dagger y\rangle\] gilt. Falls konjugierte Operatoren existieren, sind sie eindeutig bestimmt. Die obigen Sätze übertragen sich im wesentlichen. Einzige Ausnahme ist, daß der konjugierte Operator eines kompakten Operators nicht mehr automatisch kompakt sein muß, man dies also als Voraussetzung zu den Sätzen hinzuzufügen hat.

Beispiele gibt es viele, als zu \(V\) dualen Raum \(W\) kann man jeden dicht in \(V'\) eingebetteten Banachraum verwenden. Standardbeispiel ist das Dualsystem \((\mathrm C(X),\mathrm C(X))\) für den Abschluß \(X\) eines beschränkten Gebietes mit der bilinearen Abbildung \[\langle f,g\rangle =\int_X f(x)g(x)\,\mathrm dx.\] In diesem Dualsystem besitzen beide zu untersuchenden Gleichungen dieselbe Struktur.

Beispiel 3.34. Wir betrachten die Integralgleichung \[\phi(x)-\int_a^b e^{x-y}\phi(y)\,\mathrm dy=f(x).\] Offensichtlich muß jede ihrer Lösungen die Form \[\phi(x)=f(x)+c e^{x}\] mit einer Konstanten \(c\) haben. Eingesetzt in die Gleichung ergibt dies \[c(1-(b-a))=\int_a^b e^{-y}f(y)\,\mathrm dy.\] Entweder ist \(b-a\neq1\) oder \(b-a=1\). Im ersten Fall ist \(c\) durch diese Gleichung eindeutig bestimmt, die Integralgleichung besitzt die eindeutige Lösung \[\phi(x)=f(x)+\frac{\int_a^b e^{-y}f(y)\,\mathrm dy}{1-(b-a)} e^x.\] Im zweiten Fall ist \(c\) beliebig, vorausgesetzt \[\int_a^b e^{-y}f(y)\,\mathrm dy=0.\] Dies entspricht aber gerade dem Lösbarkeitskriterium der Fredholmschen Alternative, da für \(b-a=1\) die homogene adjungierte Gleichung \[\psi(x)-\int_a^b e^{y-x}\psi(y)\,\mathrm dy=0\] die Lösung \(\psi(x)=e^{-x}\) besitzt.

Beispiel 3.35. Als zweites Beispiel betrachten wir unendliche lineare Gleichungssysteme in \(\ell^p\), \(p\in[1,\infty)\). Zu lösen sei \[x_k-\sum_\ell a_{k,\ell} x_\ell = y_k\] zu vorgegebenem \((y_k)\in\ell^p\) und Koeffizienten \(a_{k,\ell}\). Diese sind von der Form \((I-A)x=y\) mit dem Operator \(A\) \[(A x) =\left( \sum_\ell a_{k,\ell} x_\ell\right).\] Analog zu Beispiel Beispiel 1.24 wissen wir, daß dabei \[\|A\|\leq \left(\sum_k \left(\sum_\ell |a_{k,\ell}|^{p'}\right)^{p/p'}\right)^{1/p}\] gilt. Aus dem Kompaktheitskriterium für Banachräume mit Basis folgt, daß \(A\) kompakt ist, falls \[\left(\sum_{k>N}\left(\sum_{\ell>N} |a_{k,\ell}|^{p'}\right)^{p/p'}\right)^{1/p} \to0,\qquad N\to\infty\] gilt. Auf das Gleichungssystem läßt sich unter dieser Voraussetzung also die oben entwickelte Theorie anwenden.

Eine mögliche Konsequenz ist folgende Aussage. Setzt man zusätzlich Dreiecksform voraus, \[a_{k,\ell}=0,\quad \ell>k, \qquad\text{(oder $k>\ell$)}\] so ist \(I-A\) genau dann in \(\ell^p\) stetig invertierbar, wenn \(a_{k,k}\neq1\) für alle \(k\) gilt.

Zum Beweis nutzen wir, daß entweder \(A\) oder \(A^\dagger\) untere Dreiecksform besitzt. Das homogene Problem \((I-A)x=0\) bzw. \((I-A^\dagger )x=0\) ist dann unter obiger Voraussetzung aber nur trivial lösbar. In beiden Fällen besitzt \(I-A\) also Kettenlänge \(0\), ist also stetig invertierbar.

Beispiel 3.36. Eine klassische Anwendung der Fredholmschen Alternative sind Randwertprobleme für gewöhnliche Differentialgleichungen. Wir wollen nur ein (allerdings recht allgemeines) Beispiel betrachten. Zu lösen sei49 \[(a_1(x)u')'+a_2(x)u=v(x),\qquad u(0)=u_0,\quad u(1)=u_1\] zu vorgegebenen Randwerten \(u_0,u_1\in\mathbb C\), reellen Koeffizienten \(a_1\in {\mathrm C}^1[0,1]\), \(a_2\in \mathrm C[0,1]\) und rechter Seite \(v\in \mathrm C[0,1]\). Dabei sei vorausgesetzt, daß \(a_1(x)\neq0\) für \(x\in[0,1]\) gilt. Wir transformieren das Problem in eine Integralgleichung.

Sei also \(u\in {\mathrm C}^2[0,1]\). Dann gilt für \(\phi=-u''\) (wie man sofort mittels partieller Integration sieht) \[\begin{aligned} u(x)&=u(0)+u'(0)x-\int_0^x (x-y)\phi(y)\,\mathrm dy\\ &=u(1)-u'(1)(1-x)+\int_x^1 (x-y)\phi(y)\,\mathrm dy. \end{aligned}\] Weiterhin gilt \[0=\int_0^1 \phi(y)\,\mathrm dy+u'(1)-u'(0).\] Multiplikation mit \((1-x)\), \(x\) bzw. \(x(1-x)\) liefert nach Addition eine Darstellung für \(u(x)\) \[\label{eq:expl_RWP_udef} u(x)=u(0)(1-x)+u(1)x+\int_0^x (1-x)y\phi(y)\,\mathrm dy+\int_x^1 x(1-y)\phi(y)\,\mathrm dy,\] also auch \[u'(x)=u(1)-u(0)-\int_0^x y\phi(y)\,\mathrm dy+\int_x^1 (1-y)\phi(y)\,\mathrm dy.\] Ist nun \(u(x)\) Lösung des Randwertproblems, so folgt mit \((a_1u')'+a_2u=v\) die Integralgleichung \[\begin{gathered} a_1'(x)(u_1-u_0)-\int_0^x a_1'(x)y\phi(y)\,\mathrm dy-a_1(x)x\phi(x) +\int_x^1 a_1'(x)(1-y)\phi(y)\,\mathrm dy-a_1(x)(1-x)\phi(x)\\+a_2(x)(u_0(1-x)+u_1x)+ \int_0^x a_2(x)(1-x)y\phi(y)\,\mathrm dy+\int_x^1a_2(x)x(1-y)\phi(y)\,\mathrm dy=v(x) \end{gathered}\] für \(\phi\). Zusammenfassen aller Ausdrücke liefert \[\label{eq:expl_RWP_igl} a_1(x)\phi(x)-\int_0^1 a_1^{-1}(y)K(x,y)a_1(y)\phi(y)\,\mathrm dy=f(x)\] mit \[K(x,y)= \begin{cases} -a_1'(x)y + a_2(x)(1-x)y ,&y<x,\\ a_1'(x)(1-y)+a_2(x)x(1-y),&x<y \end{cases}\] und \[f(x)=-v(x)+a_1'(x)(u_1-u_0)+a_2(x)(u_0(1-x)+u_1x).\] Ist umgekehrt \(a_1\phi\in \mathrm C[0,1]\) eine Lösung der Integralgleichung, so definiert [eq:expl_RWP_udef] eine Lösung des Randwertproblems. Beide Aufgaben sind also äquivalent.

Für die Integralgleichung [eq:expl_RWP_igl] läßt sich die Fredholmsche Alternative formulieren. Sei dazu \(\psi\) eine Lösung des homogenen konjugierten Problems \[\psi(x)-\int_0^1 a_1^{-1}(x)K(y,x)\psi(y)\,\mathrm dy=0.\] Dann impliziert \(K(y,0)=K(y,1)=0\) daß \(\psi(0)=\psi(1)=0\) gilt. Weiter folgt durch Differenzieren der Integralgleichung und entsprechendem Zusammenfassen \(\psi\in {\mathrm C}^1[0,1]\) sowie \[\begin{aligned} a_1(x)\psi'(x)&=\int_x^1 (-a_1'(y)+a_2(y)(1-y)) \psi(y)\,\mathrm dy+\int_0^x (-a_1'(y) -a_2(y)y)\psi(y)\,\mathrm dy\\ &=\int_0^1 (-a_1'(y)-a_2(y)y)\psi(y)\,\mathrm dy +\int_x^1 a_2(y)\psi(y)\,\mathrm dy \end{aligned}\] und damit \[(a_1(x)\psi')'+a_2(x)\psi=0,\qquad \psi(0)=\psi(1)=0.\] Es existiert höchstens ein eindimensionaler Lösungsraum dieses (konjugierten) Problems. Ist \(\psi=0\) einzige Lösung, so existiert für jedes \(v\) und alle Randdaten \(u_0,u_1\) eine eindeutige Lösung des Ausgangsproblems. Existiert eine nichttriviale Lösung \(\psi\), so müssen die Daten \(v\) und \(u_0,u_1\) Bedingungen erfüllen. Diese sind durch \[\begin{aligned} 0=\langle\psi,f\rangle =&\int_0^1 \psi(x)f(x)\,\mathrm dx= -\int_0^1 \psi(x)v(x)\,\mathrm dx+(u_1-u_0)\int_0^1 a_1'(x)\psi(x)\,\mathrm dx \\&+u_0 \int_0^1(1-x)a_2(x)\psi(x)\,\mathrm dx+u_1\int_0^1 xa_2(x)\psi(x)\,\mathrm dx \end{aligned}\] gegeben. Die Gleichung für \(\psi(x)\) liefert daraus mittels partieller Integration \[\begin{aligned} \int_0^1 \psi(x)v(x)\,\mathrm dx&= (u_1-u_0) \int_0^1 (a_1'(x)\psi(x)-x(a_1(x)\psi'(x))') \,\mathrm dx + u_0 [a_1(0)\psi'(0)-a_1(1)\psi'(1)]\notag\\ &=u_0 a_1(0)\psi'(0) -u_1 a_1(1)\psi'(1). \end{aligned}\] Erfüllen die rechte Seite \(v(x)\) und die Randdaten \(u_0,u_1\in\mathbb C\) diese Bedingung, so existiert für unser Ausgangsproblem eine Lösung. Diese ist nicht eindeutig bestimmt.

3.5 Fredholmoperatoren und Index

Wir wollen die bisher behandelte Theorie der Operatorgleichungen etwas verallgemeinern und betrachten nun Operatoren mit abgeschlossenem Bild, für die der Nullraum endlichdimensional ist und der Bildraum durch endlich viele Bedingungen charakterisiert ist.

Definition 3.37. Seien \(V\), \(W\) Banachräume und \(L\in\mathcal L(V,W)\). Dann heißt \(L\) Fredholmoperator, falls

  1. \(\dim \mathop{\mathrm{ker}}(L)<\aleph_0\) endlich ist und

  2. \(\mathop{\mathrm{codim}}\mathop{\mathrm{ran}}(L) = \dim W / _{\mathop{\mathrm{ran}}(L)} < \aleph_0\) endlich ist.

Die Menge der Fredholmoperatoren sei mit \(\mathcal F(V,W)\) bezeichnet. Für \(L\in\mathcal F(V,W)\) heißt \[\mathop{\mathrm{ind}}L = \dim \mathop{\mathrm{ker}}(L) - \mathop{\mathrm{codim}}\mathop{\mathrm{ran}}(L)\] der Index von \(L\).

Alle Fredholmoperatoren haben ein abgeschlossenes Bild.

Lemma 3.38. Sei \(L\in\mathcal F(V,W)\). Dann ist \(\mathop{\mathrm{ran}}(L)\) abgeschlossen.

Proof. Wir zeigen leicht mehr und nutzen nur, daß \(\mathop{\mathrm{codim}}\mathop{\mathrm{ran}}(L)<\aleph_0\) gilt. Da \(\mathop{\mathrm{ker}}(L)\) abgeschlossen ist, definiert \[\| x+\mathop{\mathrm{ker}}(L) \| = \inf_{z\in\mathop{\mathrm{ker}}(L)} \|x+z\|\] eine Norm auf \(V/_{\mathop{\mathrm{ker}}(L)}\), welche diesen Raum zu einem Banachraum macht. Damit induziert \(L\) eine injektive stetige lineare Abbildung \(V/_{\mathop{\mathrm{ker}}(L)} \to W\). Im folgenden nehmen wir o.B.d.A an, daß \(L\) injektiv ist.

Seien \(y_1,\ldots, y_n\in W\) so gewählt, daß \(\{y_j+\mathop{\mathrm{ran}}(L)\,:\,j=1,\ldots,n\}\) eine Basis von \(W/_{\mathop{\mathrm{ran}}(L)}\) bildet. Dann ist \(\mathbb K^n\times V\) Banachraum und \[\tilde L : \mathbb K^n\times V \ni (\lambda_1,\ldots,\lambda_n,x) \mapsto L x + \sum_{j=1}^n \lambda_j y_j \in W\] ist bijektiv und stetig. Damit ist aber \(\tilde L\) stetig invertierbar und \(\mathop{\mathrm{ran}}(L) =\tilde L (\{0\}\times V) \simeq V\) abgeschlossen. ◻

Während sich die Dimension des Nullraums und die Kodimension des Bildraumes bei kompakten Störungen ändern können, ist der Index invariant unter kompakten Störungen. Dazu benötigen wir noch eine Hilfsaussage und eine äquivalente Charakterisierung von Fredholmoperatoren.

Lemma 3.39. Sei \(U\subseteq V\) ein endlichdimensionaler Unterraum eines normierten Raumes \(V\) oder abgeschlossener Unterraum endlicher Kodimension. Dann existiert ein Projektor \(P\in\mathcal L(V)\) mit \(U=\mathop{\mathrm{ran}}(P)\).

Proof. Siehe Übung. ◻

Satz 3.40 (Atkinson50). Es gilt \(L \in\mathcal F(V,W)\) genau dann, wenn Operatoren \(A,B\in \mathcal L(W,V)\) existieren, so daß \[\label{eq:Fredh-Bed} AL - I \in \mathcal K(V)\qquad\text{und}\qquad LB-I\in\mathcal K(W)\] gilt. Dabei kann \(A=B\) gewählt werden und es gilt \(A\in\mathcal F(W,V)\). Man bezeichnet \(A\) als Regularisierer von \(L\).

Proof. Schritt 1. Sei \(L\in\mathcal F(V,W)\). Dann ist \(\mathop{\mathrm{ker}}(L)\) endlichdimensional und \(\mathop{\mathrm{ran}}(L)\) von endlicher Kodimension. Damit existieren nach Lemma Lemma 3.39 Projektoren \(P\in\mathcal L(V)\) und \(Q\in\mathcal L(W)\) mit \(\mathop{\mathrm{ran}}(P) = \mathop{\mathrm{ker}}(L)\) und \(\mathop{\mathrm{ran}}(Q)=\mathop{\mathrm{ran}}(L)\). Weiter ist \(I-P\) auf den Äquivalenzklassen \(x+\mathop{\mathrm{ker}}(L)\) konstant und induziert damit eine stetige Abbildung \((I-P) : V/_{\mathop{\mathrm{ker}}(L)}\to V\). Der Operator \(L\) induziert eine Abbildung \(\tilde L : V/_{\mathop{\mathrm{ker}}(L)} \to \mathop{\mathrm{ran}}(L)\), welche nach dem Satz über den inversen Operator stetig invertierbar ist. Sei nun \(A\) die Abbildung \[A : W \stackrel{Q}{\longrightarrow} \mathop{\mathrm{ran}}(L) \stackrel{\tilde L^{-1}}{\longrightarrow} V/_{\mathop{\mathrm{ker}}(L)} \stackrel{I-P}{\longrightarrow} V.\] Dann gilt \[ALx = (I-P) \tilde L^{-1} L x = (I-P) (x+ \mathop{\mathrm{ker}}(L)) = x - P x,\] und damit \(AL-I = P\) und \(P\) ist nach Voraussetzung kompakt. Entsprechend gilt \[LA x = L (I-P) \tilde L^{-1} Qx = Qx\] und damit \(LA-I = Q-I\) und \(Q-I\) ist nach Voraussetzung ebenso kompakt.

Schritt 2. Existieren umgekehrt Operatoren \(A\) und \(B\) mit [eq:Fredh-Bed], so folgt \(A-B = A-ALB + ALB - B = A(I-LB) + (AL-I)B \in\mathcal K(V,W)\) und damit \(LA-I\in\mathcal K(V)\). Damit können auch in diesem Fall \(A\) und \(B\) gleich gewählt werden. Weiter stimmt auf \(\mathop{\mathrm{ker}}(L)\) der kompakte Operator \((AL-I)\) mit der Identität überein. Damit ist \(\mathop{\mathrm{ker}}(L)\) endlichdimensional. Weiter sind nach der Riesztheorie \(AL\) und \(LB\) kettenendlich und damit \[V = \mathop{\mathrm{ran}}((AL)^\ell) \dotplus \mathop{\mathrm{ker}}((AL)^\ell),\qquad\text{und}\qquad W = \mathop{\mathrm{ran}}((LB)^{\tilde\ell}) \dotplus \mathop{\mathrm{ker}}((LB)^{\tilde\ell}).\] Aus letzterem folgt insbesondere \(\mathop{\mathrm{codim}}\mathop{\mathrm{ran}}(L) \le \mathop{\mathrm{codim}}\mathop{\mathrm{ran}}((LB)^{\tilde\ell}) <\aleph_0\) und damit insbesondere \(L\in\mathcal F(V,W)\).

Schitt 3. Da die Bedingung mit \(A=B\) symmetrisch in \(L\) und \(A\) ist, ist mit \(L\) insbesondere auch \(A\) Fredholm. ◻

Satz 3.41 (Indexsatz).

  1. Seien \(A\in\mathcal F(V_1,V_2)\) und \(B\in\mathcal F(V_2,V_3)\), dann ist \(BA\in\mathcal F(V_1,V_3)\) und es gilt \[\mathop{\mathrm{ind}}(BA) = \mathop{\mathrm{ind}}A + \mathop{\mathrm{ind}}B.\]

  2. Für \(L\in\mathcal F(V,W)\) und \(K\in\mathcal K(V,W)\) gilt \(\mathop{\mathrm{ind}}(L+K) = \mathop{\mathrm{ind}}L\).

Proof. (1) Dieser Satz ist nur lineare Algebra. Sei \(E_2=\mathop{\mathrm{ker}}(B)\cap\mathop{\mathrm{ran}}(A)\) und seien \(E_1\), \(E_3\), \(E_4\) Unterräume51 von \(V_2\) mit \[\mathop{\mathrm{ran}}(A) = E_1 \dotplus E_2,\qquad \mathop{\mathrm{ker}}(B) = E_2 \dotplus E_3,\qquad V_2 = E_1\dotplus E_2 \dotplus E_3 \dotplus E_4.\] Damit folgt \[\mathop{\mathrm{ran}}(B) = B (E_1\dotplus E_4) = B(E_1) \dotplus B(E_4) = B(E_1\dotplus E_2) \dotplus B(E_4) = \mathop{\mathrm{ran}}(BA)\dotplus B(E_4)\] Sei nun \(F\) ein Unterraum von \(V_1\) mit \(\mathop{\mathrm{ker}}(BA) = \mathop{\mathrm{ker}}(A) \dotplus F\). Die Einschränkung \(A|_F\) ist injektiv, also ist \(F\) (algebraisch) isomorph zu \(A(F) = A(F\dotplus N(A)) = A(\mathop{\mathrm{ker}}(BA)) = \mathop{\mathrm{ran}}(A) \cap \mathop{\mathrm{ker}}(B) = E_2\). Damit folgt aber \(\dim F = \dim E_2\) und \(\dim B(E_4)=\dim E_4\). Damit ergibt sich

\[\begin{aligned} \dim \mathop{\mathrm{ker}}(B) &= \dim E_2 + \dim E_3, \\ \mathop{\mathrm{codim}}\mathop{\mathrm{ran}}(A) &= \dim E_3+\dim E_4 ,\\ \dim\mathop{\mathrm{ker}}(BA) &= \dim \mathop{\mathrm{ker}}(A) + \dim F = \dim \mathop{\mathrm{ker}}(A) + \dim E_2,\\ \mathop{\mathrm{codim}}\mathop{\mathrm{ran}}(BA) &= \mathop{\mathrm{codim}}\mathop{\mathrm{ran}}(B) + \dim B(E_4) = \mathop{\mathrm{codim}}\mathop{\mathrm{ran}}(B) +\dim E_4 \end{aligned}\]

und somit \[\begin{aligned} \mathop{\mathrm{ind}}(BA) &= \dim\mathop{\mathrm{ker}}(BA)-\mathop{\mathrm{codim}}\mathop{\mathrm{ran}}(BA) = \dim \mathop{\mathrm{ker}}(A) + \dim E_2- \mathop{\mathrm{codim}}\mathop{\mathrm{ran}}(B) +\dim E_4 \notag \\ &= \dim \mathop{\mathrm{ker}}(A) +\dim\mathop{\mathrm{ker}}(B) - \dim E_3 - \mathop{\mathrm{codim}}\mathop{\mathrm{ran}}(B) -\mathop{\mathrm{codim}}\mathop{\mathrm{ran}}(A)+\dim E_3 \notag\\ & = \mathop{\mathrm{ind}}A + \mathop{\mathrm{ind}}B\end{aligned}\] und damit die Behauptung. \(\bullet\qquad\)(2) Wegen Satz Satz 3.33 und der Fredholmschen Alternative gilt \(\mathop{\mathrm{ind}}(I+\tilde K) = 0\) für \(\tilde K\in\mathcal K(V)\). Weiter impliziert der Satz von Atkinson, daß mit \(L\) auch \(L+K\) Fredholm ist. Sei dazu \(A\in \mathcal F(W,V)\) mit \(AL-I\in\mathcal K(V)\) und \(LA-I\in\mathcal K(W)\). Dann folgt \(A(L+K) -I= AL-I +AK\in\mathcal K(V)\) und \((L+K)A-I=LA-I-KA\in\mathcal K(W)\) und \(A\) regularisiert ebenso \(L+K\). Mit Teil 1 und obiger Bemerkung folgt nun aber \[\mathop{\mathrm{ind}}A + \mathop{\mathrm{ind}}L = \mathop{\mathrm{ind}}(AL) = 0 = \mathop{\mathrm{ind}}(A(L+K)) = \mathop{\mathrm{ind}}A + \mathop{\mathrm{ind}}(L+K).\] ◻

Damit kann man die Resultate der Fredholmtheorie auf Fredholmoperatoren übertragen. Dies soll im folgenden kurz zusammengefaßt werden. Es gilt

Korollar 3.42. Sei \(L\in\mathcal F(V,W)\). Dann gilt \(L^\dagger\in\mathcal F(W',V')\) und \[\mathop{\mathrm{ker}}(L) = {}^\perp \mathop{\mathrm{ran}}(L^\dagger)\qquad\text{und}\qquad \mathop{\mathrm{ker}}(L^\dagger) = \mathop{\mathrm{ran}}(L)^\perp.\] Weiterhin gilt \[\mathop{\mathrm{ind}}L = \dim \mathop{\mathrm{ker}}(L) - \dim \mathop{\mathrm{ker}}(L^\dagger)\] und falls \(V\) reflexiv ist damit auch \[\mathop{\mathrm{ind}}L^\dagger + \mathop{\mathrm{ind}}L = 0\]

Proof. Ist \(L\in\mathcal F(V,W)\), so existiert \(A\in\mathcal F(W,V)\) mit \(AL-I\in\mathcal K(V)\) und \(LA-I\in\mathcal K(W)\). Also gilt insbesondere \(L^\dagger A^\dagger-I\in \mathcal K(V')\) und \(A^\dagger L^\dagger-I\in\mathcal K(W')\). Damit ist aber \(L^\dagger\) auch Fredholm.

Weiter gilt \(x\in \mathop{\mathrm{ker}}(L)\) genau dann, wenn \(Lx=0\) und damit wenn \(\langle\phi, Lx\rangle =\langle L^\dagger\phi,x\rangle=0\) für alle \(\phi\in W'\) gilt. Damit ist aber \(x\in {}^\perp \mathop{\mathrm{ran}}(L^\dagger)\). Entsprechend ist \(\phi\in \mathop{\mathrm{ker}}(L^\dagger)\) äquivalent zu \(L^\dagger\phi=0\) und damit zu \(\langle \phi, Lx\rangle=0\) für alle \(x\in V\). Damit ist aber \(\phi\in \mathop{\mathrm{ran}}(L)^\perp\).

Nun ist aber \(\mathop{\mathrm{codim}}\mathop{\mathrm{ran}}(L) = \dim \mathop{\mathrm{ran}}(L)^\perp = \dim \mathop{\mathrm{ker}}(L^\dagger)\) und die weiteren Aussagen folgen. ◻

Beispiel 3.43. In \(\ell^p\) sei \(S\) der Shiftoperator \(S : (x_0,x_1,x_2,\ldots) \mapsto (x_1,x_2,\ldots)\) und \(T\) der Shiftoperator \(T:(x_0,x_1,\ldots)\mapsto (0,x_0,x_1,\ldots)\). Dann gilt \(ST=I\) und \(TS-\mathrm I=-P_0\) für \(P_0 : (x_0,x_1,\ldots)\mapsto (x_0,0,\ldots)\) den Projektor auf die erste Basisfolge. Damit ist \(S\) Fredholm und es gilt \(\mathop{\mathrm{ind}}S = 1 = -\mathop{\mathrm{ind}}T\).

Der Index ist stabil unter kleinen Störungen in der Operatornorm. Das besagt gerade folgendes Lemma.

Lemma 3.44. \(\mathcal F(V,W)\) ist offen in \(\mathcal L(V,W)\) und \(\mathop{\mathrm{ind}}: \mathcal F(V,W) \to \mathbb Z\) ist stetig.

Proof. Sei \(L\in\mathcal F(V,W)\). Dann existieren Zerlegungen \(V = E \dotplus \mathop{\mathrm{ker}}(L)\) und \(W = \mathop{\mathrm{ran}}(L)\dotplus F\) mit stetigen Projektoren auf die Komponenten und \(L_0= L|_E : E\to \mathop{\mathrm{ran}}(L)\) stetig invertierbar. Damit kann man \(L\) in Blockform schreiben, \[L =\begin{pmatrix} L_0 & 0 \\ 0 & 0 \end{pmatrix}.\] Sei nun \(A\in\mathcal L(V,W)\) mit \(\|A-L\|<\varepsilon\). Zerlegt man \(A\) entsprechend in Blockform, \[A =\begin{pmatrix} A_0 & A_1 \\ A_2 & A_3 \end{pmatrix}.\] So folgt \(\|L_0-A_0\|<\varepsilon\) und für hinreichend kleine \(\varepsilon\) ist \(A_0\) invertierbar. Mit dem Satz von Atkinson ist \(A\) damit aber schon Fredholm (jede Fortsetzung von \(A_0^{-1}\) auf den gesamten Raum regularisiert \(A\)).

Weiter gilt \(x\in\mathop{\mathrm{ker}}(A)\) genau dann, wenn \(x=y+z\) mit \(A_0y+A_1z=0\) und \(A_2y+A_3z=0\) und damit wenn \(A_3 z = A_2 A_0^{-1} A_1 z\). Nun ist \(A_3-A_2A_0^{-1}A_1 : \mathop{\mathrm{ker}}(L)\to F\) endlichdimensional und damit \(\dim \mathop{\mathrm{ker}}(A) = \dim \mathop{\mathrm{ker}}(A_3 - A_2A_0^{-1}A_1) < \aleph_0\). Analog folgt durch Betrachtung von \(A^\dagger\), daß \(\dim\mathop{\mathrm{ker}}(A^\dagger) = \dim\mathop{\mathrm{ker}}((A_3 - A_2A_0^{-1}A_1)^\dagger) < \aleph_0\) und damit \[\mathop{\mathrm{ind}}A = \mathop{\mathrm{ind}}(A_3 - A_2A_0^{-1}A_1) = \dim \mathop{\mathrm{ker}}(L) - \dim F = \mathop{\mathrm{ind}}L\] mit dem Rangsatz für Matrizen. ◻

Beispiel 3.45. (Toeplitzoperatoren52 und Gohberg–Krein53 Indexformel) Wir nutzen die Notation aus Beispiel Beispiel 3.43. Sei nun \((a_k)_{k\in \mathbb Z} \in \ell^1(\mathbb Z)\) summierbar und sei \[L = \sum_{k=-\infty}^{-1} a_k T^k + a_0 I + \sum_{k=1}^\infty a_k S^k\] in \(\mathcal L(\ell^p)\) für \(1< p<\infty\). Angenommen \(\sum_{k\in\mathbb Z} a_k {\mathrm e}^{\mathrm ik \theta}\ne0\) für alle \(\theta\in\mathbb R\). Dann ist \(L\) Fredholm und der Fredholmindex \(\mathop{\mathrm{ind}}L\) ist gleich der Windungszahl der Kurve \(\theta \mapsto \sum_{k\in\mathbb Z} a_k {\mathrm e}^{\mathrm ik \theta}\), \(\theta\in(0,2\pi)\), um den Ursprung. (Siehe Übung)

In Matrixform ist \(L\) gerade durch die unendliche Toeplitzmatrix \[L = \begin{pmatrix} a_0 & a_1 & a_2 & a_3 & \cdots \\ a_{-1} & a_0 & a_1 & a_2 & \\ a_{-2} & a_{-1} & a_0 & a_1 &\ddots \\ a_{-3} & a_{-2} & a_{-1} & a_0 & \ddots \\ \vdots & & \ddots & \ddots & \ddots \end{pmatrix}\] gegeben.

Beispiel 3.46. Auf dem Hardyraum \[\mathcal H^\infty(\mathbb D) = \{ f\in\mathfrak A(\mathbb D) \; : \; \|f\|_\infty = \sup\nolimits_{\zeta\in\mathbb D} |f(\zeta)| < \infty \}\] der beschränkten analytischen Funktionen auf der Einheitskreisscheibe wird zu jedem \(g\in\mathcal H^\infty(\mathbb D)\) durch Multiplikation \(M_g = f\mapsto gf\) ein beschränkter Operator \(M_g\) definiert. Dieser ist Fredholm, falls \(g\in\mathcal H^\infty(\mathbb D)\cap \mathrm C(\overline{\mathbb D})\) stetig auf die abgeschlossene Kreisscheibe \(\overline{\mathbb D}\) fortsetzbar ist und die Fortsetzung auf dem Rand \(\partial\mathbb D\) nirgends Null wird. Sein Index \[\mathop{\mathrm{ind}}M_g = - \frac1{2\pi\mathrm i} \oint_{|\zeta|=1} \frac{g'(\zeta)}{g(\zeta)}\,\mathrm d\zeta = - \mathcal N(g)\] entspricht minus der Zahl \(\mathcal N(g)\) der (mit Vielfachheiten gezählten) Nullstellen von \(g\) in \(\mathbb D\).

Beispiel 3.47. Randwertprobleme von Differentialgleichungen entsprechen Fredholmoperatoren. Dazu soll nur ein (sehr einfaches) Beispiel angegeben werden. Die Abbildung \[\partial^2 : {\mathrm C}^2[0,1]\ni u \mapsto u'' \in\mathrm C[0,1]\] ist Fredholm und es gilt \(\mathop{\mathrm{ker}}(\partial^2) = \{ u(x) = \alpha x+\beta \;:\; \alpha,\beta\in\mathbb C\}\) sowie \(\mathop{\mathrm{ran}}(\partial^2)=\mathrm C[0,1]\). Da somit \(\mathop{\mathrm{ind}}(\partial^2)=2\) gilt, muß man zum Invertieren des Operators zwei zusätzliche Gleichungen hinzunehmen (und zwar die beiden, sinnvoll gewählten, Randbedingungen). Die Operatoren \[\partial : {\mathrm C}^2[0,1]\ni u \mapsto u' \in\mathrm C[0,1],\qquad \iota : {\mathrm C}^2[0,1]\ni u \mapsto u \in\mathrm C[0,1]\] sind beide kompakt, also ist insbesondere jeder Differentialoperator \(P(x,\partial) = \partial^2 + a(x) \partial + b(x)\) mit Koeffizienten \(a,b\in\mathrm C[0,1]\) als Abbildung \({\mathrm C}^2[0,1]\to\mathrm C[0,1]\) ein Fredholmoperator mit Index \(2\).

4 Spektraltheorie

Operatoren sind auch nur Zahlen.

4.1 Der Spektralsatz von Riesz–Schauder

Wir wollen die Resultate des letzten Kapitels noch einmal, allerdings aus einer anderen Blickrichtung, zusammenfassen. Sei dazu \(V\) ein komplexer Banachraum und \(K\in\mathcal K(V)\) ein kompakter Operator. Dann ist die Gleichung \[\lambda x-Kx=0\] für ein komplexes \(\lambda\in\mathbb C\setminus\{0\}\) entweder eindeutig (und damit trivial) lösbar, der Operator \(\lambda I-K\) in \(\mathcal L(V)\) (stetig) invertierbar, oder es existiert ein nichttrivialer endlichdimensionaler Lösungsraum \(\mathop{\mathrm{ker}}(\lambda I-K)\). Im zweiten Falle wollen wir \(\lambda\) als Eigenwert des Operators \(K\) und den Lösungsraum \[E_\lambda=\mathop{\mathrm{ker}}(\lambda I-K)\] als zugehörigen Eigenunterraum bezeichnen. Die Menge der Eigenwerte sei mit \(\sigma_P(K)\) bezeichnet. Offensichtlich gilt für jeden Eigenwert \(\lambda\in\sigma_P(K)\) die Abschätzung \(|\lambda|\le\|K\|\).

Quintessenz des letzten Kapitels können wir nun im folgenden Satz zusammenfassen.

Satz 4.1 (Spektralsatz von Riesz–Schauder). Sei \(V\) Banachraum und \(K\in\mathcal K(V)\) kompakt. Dann gelten die folgenden Aussagen

  1. Ist \(\lambda\) ein Häufungspunkt von \(\sigma_P(K)\), so gilt \(\lambda=0\). Insbesondere ist \(\sigma_P(K)\) abzählbar.

  2. Für jedes \(\lambda\in\sigma_P(K)\setminus\{0\}\) ist der Eigenraum \(E_\lambda\) endlichdimensional.

  3. Sei \(\lambda\in\sigma_P(K)\setminus\{0\}\). Dann besitzt der Operator \(L=\lambda I-K\) die endliche Kettenlänge \(\ell(\lambda)>0\) und es gilt \[V = \mathop{\mathrm{ker}}((\lambda I-K)^{\ell(\lambda)})\dotplus \mathop{\mathrm{ran}}((\lambda I-K)^{\ell(\lambda)}).\] Bezeichnet man mit \(P_\lambda\) die Projektion auf die erste Komponente, so gilt \(P_\lambda \in\mathcal K(V)\).

  4. Es gilt \(\sigma_P(K)\setminus\{0\}=\sigma_P(K^\dagger )\setminus\{0\}\).54 Weiterhin folgt für \(\lambda\in\sigma_P(K)\setminus\{0\}\) \[E_\lambda = \mathop{\mathrm{ker}}(\lambda I-K)={}^\perp \mathop{\mathrm{ran}}(\lambda I-K^\dagger ),\qquad \mathop{\mathrm{ran}}(\lambda I-K)={}^\perp\mathop{\mathrm{ker}}(\lambda I-K^\dagger ).\]

Proof.  (1) Angenommen \(\lambda\) ist Häufungspunkt von \(\sigma_P(K)\) und \(\lambda\neq0\). Dann gibt es eine Folge von Eigenwerten \(\lambda_n\in\sigma_P(K)\setminus\{\lambda\}\) mit \(\lambda_n\to\lambda\) und eine Folge von normalisierten Eigenvektoren \(x_n\in \mathop{\mathrm{ker}}{\lambda_nI-K}\), \(\|x_n\|=1\). Da \(K\) kompakt ist, existiert eine Teilfolge \((x_{n_k})_{k\in\mathbb N}\) für die \(Kx_{n_k}=\lambda_{n_k} x_{n_k}\) konvergiert. Da \(\lambda_n\to\lambda\ne0\) konvergiert, folgt \(x_{n_k}\to x\) für ein \(x\) und damit \(Kx=\lambda x\). Dann folgt \(x\in \mathop{\mathrm{ker}}(\lambda I -K)\) und da alle \(x_n\) normiert waren gilt auch \(\|x\|=1\). Andererseits gilt \[(\lambda I-K)x_n = (\lambda_nI-K)x_n+(\lambda-\lambda_n)x_n = (\lambda-\lambda_n)x_n\] und damit für die Kettenlänge \(\ell\) zu \(\lambda I -K\) \[x_n = \frac1{(\lambda-\lambda_n)^\ell} (\lambda I-K)^\ell x_n \in \mathop{\mathrm{ran}}((\lambda I-K)^\ell).\] Also gilt \(x \in\mathop{\mathrm{ran}}((\lambda I-K)^\ell) \cap \ker(\lambda I-K)\) und damit nach dem dritten Rieszschen Satz \(x=0\). Widerspruch zu \(\|x\|=1\). \(\bullet\qquad\)(2) Das ist gerade der erste Rieszsche Satz. \(\bullet\qquad\) (3) Die Kettenendlichkeit folgt mit dem dritten Rieszschen Satz. Für \(P_\lambda\) geben wir noch eine Darstellung an. Sei dazu \(\{x_1,\ldots,x_n\}\) Basis von \(\mathop{\mathrm{ker}}((\lambda I-K)^{\ell(\lambda)})\) und \(\{ \phi_1,\ldots,\phi_n\}\) Basis von \(\mathop{\mathrm{ker}}((\lambda I-K^\dagger )^{\ell(\lambda)})\). Da man \(\mathop{\mathrm{ker}}((\lambda I-K^\dagger )^{\ell(\lambda)})\) nach dem zweiten Fredholmschen Satz mit dem Dual von \(\mathop{\mathrm{ker}}((\lambda I-K)^{\ell(\lambda)})\) identifizieren kann, können die \(\phi_i\) biorthogonal zu \(x_k\) gewählt werden, d.h. \[\langle\phi_i,x_k\rangle = \delta_{ki}.\] Weiter ist \(\mathop{\mathrm{ker}}((\lambda I-K^\dagger )^{\ell(\lambda)})\) Annihilator von \(\mathop{\mathrm{ran}}((\lambda I-K)^{\ell(\lambda)})\), der Projektionsoperator also durch \[P_\lambda x=\sum_{k=1}^n \langle\phi_k,x\rangle x_k\] gegeben. Also gilt \(\|P_\lambda\|\leq\sum_{k=1}^n \|\phi_k\|\,\|x_k\|\). \(\bullet\qquad\)(4) Das ist gerade die Fredholmsche Alternative. ◻

Wendet man sich speziell Hilberträumen zu, so kann man die Aussage des Spektralsatzes für besondere Operatoren noch wesentlich verschärfen. Sei also \(H\) Hilbertraum und \(K\in\mathcal K(H)\) kompakt. Der Operator wird als selbstadjungiert bezeichnet, falls \(K^*=K\) gilt.

Satz 4.2 (Riesz–Schauder, Spektralsatz für selbstadjungierte Operatoren). Sei \(K\in\mathcal K(H)\) selbstadjungiert. Dann gilt

  1. \(\sigma_P(K)\subseteq\mathbb R\).

  2. Ist \(K\neq0\), so existiert ein Eigenwert \(\lambda\in\sigma_P(K)\) mit \(|\lambda|=\|K\|\).

  3. Sei \(\lambda\in\sigma_P(K)\setminus\{0\}\). Dann gilt \(\ell(\lambda)=1\) und damit \(H=\mathop{\mathrm{ker}}(\lambda I -K)\oplus \mathop{\mathrm{ran}}(\lambda I-K)\).

  4. Gilt \(\lambda\neq\mu\) für \(\lambda,\mu\in \sigma_P(K)\), so sind die Eigenunterräume \(E_\lambda\) und \(E_\mu\) orthogonal.

  5. Sei zu \(\lambda\in\sigma_P(K)\setminus\{0\}\) durch \(\{e_{\lambda,1},\ldots,e_{\lambda,n(\lambda)}\}\) eine Orthogonalbasis von \(E_\lambda\) gegeben. Dann besitzt der Operator \(K\) die (in der Operatornorm konvergente) Darstellung \[K = \sum_{\lambda\in\sigma_P(K)\setminus\{0\}}\lambda P_\lambda = \sum_{\lambda\in\sigma_P(K)\setminus\{0\}} \lambda \sum_{k=1}^{n(\lambda)} e_{\lambda,k}\otimes e_{\lambda,k}.\] Insbesondere gilt für alle \(x\in H\) \[Kx = \sum_{\lambda\in\sigma_P(K)\setminus\{0\}} \lambda \sum_{k=1}^{n(\lambda)} {\pmb(x,e_{\lambda,k}\pmb)} e_{\lambda,k}.\]

  6. Es gilt \[H=\mathop{\mathrm{ker}}(K)\oplus \bigoplus_{\lambda\in\sigma_P(K)\setminus\{0\}} E_\lambda\] als orthogonale direkte Summe.

Proof.  (1) Sei \(\lambda\in\sigma_P(K)\) und \(x\neq0\) ein zugehöriger Eigenvektor. Dann gilt \[\lambda{\pmb(x,x\pmb)}={\pmb(\lambda x,x\pmb)}={\pmb(Kx,x\pmb)}={\pmb(x,Kx\pmb)}={\pmb(x,\lambda x\pmb)}=\overline{\lambda}{\pmb(x,x\pmb)}\] und damit \(\lambda=\overline{\lambda}\). \(\bullet\qquad\) (2) In einem Hilbertraum gilt für selbstadjungiertes \(K\) \[\|K\| = \sup_{\|x\|=1} |{\pmb(Kx,x\pmb)}|.\] Dazu nutzt man Cauchy–Schwarz in der Form \(|{\pmb(Kx,x\pmb)}| \le \|Kx\|\,\|x\| \le \|K\|\,\|x\|^2=\|K\|\) sowie für \(\nu>0\) \[\begin{aligned} 4\|Kx\|^2 &= {\pmb(K(\nu x+\nu^{-1} Kx),\nu x+\nu^{-1} Kx\pmb)}-{\pmb(K(\nu x-\nu^{-1} Kx),\nu x-\nu^{-1}Kx\pmb)}\notag\\ & \le \sup_{\|y\|=1} |{\pmb(Ky,y\pmb)}| \left(\|\nu x+\nu^{-1} Kx\|^2 + \|\nu x-\nu^{-1} Kx\|^2\right)\notag\\ & = 2 \sup_{\|y\|=1} |{\pmb(Ky,y\pmb)}| \left(\nu^2 \| x\|^2 +\nu^{-2}\| Kx\|^2\right)\end{aligned}\] mit der Parallelogrammidentität in der letzten Zeile und wählt \(\nu^2=\|Kx\|/\|x\|\). Damit folgt \(\|K\|\le \sup_{\|y\|=1} |{\pmb(Ky,y\pmb)}|\).

Also existiert eine Folge \(x_n\in V\) mit \(\|x_n\|=1\) und \({\pmb(Kx_n,x_n\pmb)}\to\lambda\) für ein \(\lambda\in\mathbb C\) mit \(|\lambda|=\|K\|\). Damit folgt \[\begin{gathered} 0\leq\|Kx_n-\lambda x_n\|^2=\|Kx_n\|^2-2\Re \overline\lambda{\pmb(Kx_n,x_n\pmb)}+|\lambda|^2\\\leq \|K\|^2 -2\Re \overline\lambda {\pmb(Kx_n,x_n\pmb)} + \|K\|^2\to 0, \end{gathered}\] und somit \(Kx_n-\lambda x_n\to0\). Da die Einheitskugel im Hilbertraum schwach kompakt ist, existiert eine schwach konvergente Teilfolge \(x_{n_j}\), \(x_{n_j}\rightharpoonup x\). Da \(K\) kompakt ist, konvergiert \(Kx_{n_j}\to Kx\) und damit auch \(x_{n_j}\to x\). Somit gilt \(Kx=\lambda x\). Also ist \(x\) Eigenvektor zum Eigenwert \(\lambda\). \(\bullet\qquad\) (3) Sei \(\lambda\in\sigma_P(K)\setminus\{0\}\). Dann sind sowohl der endlichdimensionale Unterraum \(U=\mathop{\mathrm{ker}}(\lambda I-K)^{\ell(\lambda)}\) als auch sein orthogonales Komplement \((\mathop{\mathrm{ker}}(\lambda I-K)^{\ell(\lambda)})^\perp = \mathop{\mathrm{ran}}(\lambda I - K)^{\ell(\lambda)}\) unter \(K\) invariant. Damit wird die Einschränkung von \(K\) auf den Unterraum \(U\) in jeder Orthogonalbasis dieses Unterraums als selbstadjungierte Matrix dargestellt, diese sind aber bekanntlich diagonalisierbar und haben damit Kettenlänge 1. \(\bullet\qquad\) (4) Sei \(x\in E_\lambda\) und \(y\in E_\mu\). Dann gilt (\(\lambda\) und \(\mu\) sind reell) \[(\lambda-\mu){\pmb(x,y\pmb)}={\pmb(\lambda x,y\pmb)}-{\pmb(x,\mu y\pmb)}={\pmb(Kx,y\pmb)}-{\pmb(x,Ky\pmb)}=0.\] Aus \(\lambda\neq\mu\) folgt die Orthogonalität \(E_\lambda\perp E_\mu\). \(\bullet\qquad\) (5) Es ist nur etwas zu zeigen, wenn es abzählbar unendlich viele Eigenwerte gibt (der Operator also nicht endlichdimensional ist). Seien die Eigenwerte \(\sigma_P(K)\setminus\{0\}\) betragsmäßig geordnet, \(\|K\|=|\lambda_0|\ge |\lambda|_1\geq|\lambda_2|\geq \ldots\). Zu jedem Eigenwert \(\lambda_j\) ist durch \[P_{j} : x\mapsto \sum_{k=1}^{n(\lambda_j)} {\pmb(x,e_{\lambda_j,k}\pmb)}e_{\lambda_j,k}\] die Orthogonalprojektion auf den Unterraum \(E_j=\ker(\lambda_j I - K)\) gegeben. Weiter ist der Operator \((I-P_0)K:E_0^\perp\to E_0^\perp\) gerade die Einschränkung von \(K\) auf \(E_0^\perp\) und hat damit nach Schritt 2 die Norm \(\|(I-P_0)K\|=|\lambda_1|\). Weiter gilt \(P_kK=KP_k=\lambda_kP_k\) für alle \(k\) und per Induktion folgt nun für alle \(k\) daß \(\|(I-P_0)(I-P_1)\cdots(I-P_k)K\|=|\lambda_{k+1}|\) und damit \[\left\| K - \sum_{j=1}^k \lambda_j P_j \right\| = |\lambda_{k+1}|.\] Das aber ist die Behauptung. (Die Reihe konvergiert auch in jeder Umordnung. Warum?) \(\bullet\qquad\) (6) Sei \(x\in H\) orthogonal zu allen Eigenunterräumen, \(x\perp E_\lambda\) für \(\lambda\in\sigma_P(K)\setminus\{0\}\). Sei weiter \(\|x\|=1\). Da dann \(x\perp H_k = \oplus_{j=1,\ldots k} E_j\) folgt \(\|Kx\|\leq\|K|_{H_k^\perp}\|=|\lambda_{k+1}|\). Für \(k\to\infty\) folgt \(Kx=0\) und damit \(x\in \mathop{\mathrm{ker}}(K)\). ◻

4.2 Schmidt-Reihen, Spuren und Schattenklassen kompakter Operatoren

Sei \(H\) separabler Hilbertraum und \(K\in\mathcal K(H)\) kompakt. Dann ist der Operator \(K^*K\) selbstadjungiert und nach Satz Satz 4.2 existiert eine Folge von Projektoren \(P_k\) auf die endlichdimensionalen Eigenräume von \(K^*K\) sowie eine (möglicherweise endliche) Folge positiver Zahlen \(\sigma_k\), so daß \[K^*K = \sum_{k} \sigma_k^2 P_k.\] Die Zahlen \(\sigma_k\) heißen die Singulärwerte des Operators \(K\).

Im folgenden sei \(\sigma_k\) geordnet, \(\sigma_{k+1} \le \sigma_k\), und die einzelnen \(\sigma_k\) seien entsprechend ihrer Vielfachheit wiederholt. Wir wählen eine aus Eigenvektoren bestehende Orthonormalbasis \(f_k\) von \(\overline{\mathop{\mathrm{ran}}}(K^*K)=\mathop{\mathrm{ker}}(K^*K)^\perp = (\ker K)^\perp = \overline{\mathop{\mathrm{ran}}}(K^*)\) in \(H\), d.h., es gelte \[K^*K x = \sum_{k} \sigma_k^2\; {\pmb(x,f_k\pmb)}\; f_k,\qquad\qquad H = \ker K \oplus \bigoplus_k \mathop{\mathrm{span}}\{f_k\}.\] Da \(Kf_k\) ein Eigenvektor von \(KK^*\) ist (\(KK^*Kf_k = \sigma_k^2 K f_k\)) und ebenso \[{\pmb(K f_k,K f_\ell\pmb)} = {\pmb(K^*K f_k,f_\ell\pmb)} =\sigma_k^2 {\pmb(f_k,f_\ell\pmb)} = \sigma_k^2 \delta_{k,\ell}\] gilt, bilden die \(e_k = \sigma_k^{-1} K f_k\) ein Orthonormalsystem. Dieses ist vollständig im Abschluß des Bildes von \(K\) und es ergibt sich eine Darstellung des Operators \(K\) \[K x = \sum_{k} \sigma_k \;{\pmb(x,f_k\pmb)} \;e_k,\] und ebenso von \(KK^*\) \[KK^* x = \sum_{k} \sigma_k^2\; {\pmb(x,e_k\pmb)}\; e_k,\qquad\qquad H = \ker K^* \oplus \bigoplus_k \mathop{\mathrm{span}}\{e_k\}.\]

Satz 4.3 (Schmidt-Zerlegung kompakter Operatoren). Sei \(H\) Hilbertraum und \(K\in\mathcal K(H)\) kompakt. Seien weiter \(\sigma_k\) die Singulärwerte des Operators \(K\) und \(e_k\) sowie \(f_k\) die zugeordneten Orthonormalbasen. Dann gilt \[K x = \sum_{k} \sigma_k \;{\pmb(x,f_k\pmb)} \;e_k, \qquad\qquad K = \sum_{k} \sigma_k\; e_k\otimes f_k.\] Diese Darstellung wird als Schmidt-Reihe des kompakten Operators \(K\) bezeichnet.

Korollar 4.4. Für \(K\in\mathcal K(H)\) sei \(|K|\in\mathcal K(H)\) definiert durch die Schmidt-Reihe \[|K| x = \sum_{k} \sigma_k \;{\pmb(x,f_k\pmb)} \;f_k.\] Sei weiter \[U x = \sum_{k} {\pmb(x,f_k\pmb)} \;e_k\] die durch \(f_k\mapsto e_k\) und \(\{f_k\}^\perp\mapsto0\) bestimmte partielle Isometrie. Dann gilt die Polardarstellung \(K = U |K|\).

Im folgenden wollen wir uns kurz mit Klassen kompakter Operatoren auseinandersetzen, welche durch Bedingungen an das Abfallen ihrer Singulärwerte definiert werden. Wir schreiben \(\sigma_k(K)\) für den \(k\)-ten Singulärwert des Operators \(K\), gibt es nur endlich viele Singulärwerte, so setzen wir \(\sigma_k(K)=0\) für alle weiteren \(k\).

Definition 4.5.

  1. Sei \(p\in [1,\infty)\). Dann ist die Schattenklasse55 \(\mathfrak S_p\subseteq \mathcal K(H)\) definiert als die Menge aller kompakten Operatoren \(K\in\mathcal K(H)\), deren Singulärwerte56 \[\| K \|_{\mathfrak S_p}^p = \sum_{k=1}^\infty \sigma_k(K)^p < \infty\] erfüllen.

  2. Sei nun \(K\in\mathfrak S_1\) und \(\phi_k\) eine Orthonormalbasis von \(H\). Dann wird \[\mathop{\mathrm{trace}}K = \sum_{k=1}^\infty {\pmb(K \phi_k,\phi_k\pmb)}\] als Spur des Operators \(K\) bezeichnet.

Zwei Klassen haben eine besondere Bedeutung. Operatoren aus \(\mathfrak S_2\) werden als Hilbert–Schmidt-Operatoren bezeichnet, Operatoren aus \(\mathfrak S_1\) als Spurklasseoperatoren.

Proposition 4.6.

  1. Die Spur eines Spurklasseoperators ist von der gewählten Orthonormalbasis unabhängig.

  2. Sei \(\mathcal O\) die Menge der Orthonormalsysteme von \(H\). Dann gilt \[\label{eq:4.2.10} \|K\|_{\mathfrak S_1} = \mathop{\mathrm{trace}}|K| = \sum_{k} {\pmb(|K| \phi_k,\phi_k\pmb)} = \sup_{(\psi_k),(\chi_k)\in\mathcal O} \sum_{k} | {\pmb(K\psi_k,\chi_k\pmb)}|\] für \(K\in\mathcal K(H)\) und jede Orthonormalbasis \(\phi_k\) von \(H\).

Proof. (1) Sei \(K\in\mathfrak S_1\) und seien \(e_k\) und \(f_k\) die in der Schmidt-Reihe des Operators \(K\) auftretenden Orthonormalbasen. Sei \(\phi_k\) eine beliebige Orthonormalbasis. Dann gilt \[{\pmb(K\phi_\ell,\phi_\ell\pmb)} ={\pmb( \sum_k \sigma_k \;{\pmb(\phi_\ell,f_k\pmb)} e_k,\phi_\ell\pmb)} = \sum_k \sigma_k \;{\pmb(\phi_\ell,f_k\pmb)} {\pmb( e_k,\phi_\ell\pmb)}\] und wegen der Summierbarkeit der \(\sigma_k\) sowie der Quadratsummierbarkeit der Innenprodukte bezüglich \(\ell\) gleichmäßig in \(k\) mit dem Satz von Fubini-Tonelli \[\sum_{\ell=1}^\infty {\pmb(K\phi_\ell,\phi_\ell\pmb)} %&%= \sum_{\ell=1}^\infty \sum_{k=1}^\infty \sigma_k \; \spro{\phi_\ell}{f_k} \; \spro{e_k}{\phi_\ell} = \sum_{k=1}^\infty \sigma_k \; \sum_{\ell=1}^\infty {\pmb(\phi_\ell,f_k\pmb)} \; {\pmb(e_k,\phi_\ell\pmb)} %= \sum_{k=1}^\infty \sigma_k \; \spro{ \sum_{\ell=1}^\infty \phi_\ell \; \spro{e_k}{\phi_\ell} } {f_k} = \sum_{k=1}^\infty \sigma_k \;{\pmb(e_k,f_k\pmb)}.\] \(\bullet\) Die ersten beiden Identitäten folgen aus der Definition der Spurnorm sowie dem gerade bewiesenen. Es bleibt die letzte Identität, wir zeigen zwei Ungleichungen. Sei zuerst \(K\in\mathcal K(H)\) derart, daß das Supremum endlich ist. Seien \(e_k\) und \(f_k\) die in der Schmidtreihe von \(K\) auftretendenen Orthonormalsysteme. Dann gilt mit der Polarzerlegung \(K=U|K|\) \[\begin{split} \mathop{\mathrm{trace}}|K| &= \sum_{k} {\pmb(|K| f_k,f_k\pmb)} = \sum_{k} {\pmb(U^*K f_k,f_k\pmb)} = \sum_{k} {\pmb(K f_k,e_k\pmb)} \\ &\le \sup_{(\psi_k),(\chi_k)\in\mathcal O} \sum_{k} | {\pmb(K\psi_k,\chi_k\pmb)}|. \end{split}\] Sei nun \(K\in\mathfrak S_1\) und seien \((\psi_k),(\chi_k)\in\mathcal O\) (nicht notwendig vollständige) Orthonormalsysteme. Dann gilt mit \(K=AB = U |K|^{1/2}|K|^{1/2}\) für Hilbert-Schmidt-Operatoren \(A=U|K|^{1/2}\) und \(B=|K|^{1/2}\) und der Ungleichung von Cauchy–Schwarz \[\begin{split} \sum_{k} |{\pmb(K\psi_k,\chi_k\pmb)}| &= \sum_k |{\pmb(B \psi_k,A^*\chi_k\pmb)} | \le \sum_k \| B\psi_k\| \,\|A^*\chi_k\| \\& \le \left(\sum_k \|B\psi_k\|^2\right)^{1/2} \left(\sum_k \|A^*\chi_k\|^2\right)^{1/2}\\ &\le \|B\|_{\mathfrak S_2} \|A\|_{\mathfrak S_2} = \|K\|_{\mathfrak S_1}. \end{split}\] ◻

Korollar 4.7. \(\mathfrak S_1\) ist Banachraum mit Norm \(\|\cdot\|_{\mathfrak S_1}\).

Proof. Die Normeigenschaften sind offensichtlich mit Ausnahme der Dreiecksungleichung. Für diese nutzen wir [eq:4.2.10] \[\begin{split} \| A+B\|_{\mathfrak S_1} &= \sup_{(\phi_k),(\psi_k) \in \mathcal O} \sum_k |{\pmb((A+B)\phi_k,\psi_k\pmb)}| \\ & \le \sup_{(\phi_k),(\psi_k) \in \mathcal O} \sum_k | {\pmb(A\phi_k,\psi_k\pmb)}| + \sup_{(\phi_k),(\psi_k) \in \mathcal O} \sum_k | {\pmb(B\phi_k,\psi_k\pmb)}| \\&= \|A\|_{\mathfrak S_1} + \|B\|_{\mathfrak S_1}. \end{split}\] Wegen \(\|Kx\|^2 = {\pmb(K^*Kx,x\pmb)} \le \|K^*Kx\|\|x\|\) gilt \(\|K\|^2 \le \|K^*K\|\le \|K\|^2\) und damit \(\|K\|^2=\|K^*K\|\). Damit gilt \(\|K\| = \sigma_1(K)\) und somit \[\|K\| \le \|K\|_{\mathfrak S_1}.\] Jede Cauchyfolge \(K_n\) in \(\mathfrak S_1\) ist damit Cauchy in \(\mathcal K(H)\) und konvergiert somit gegen einen kompakten Operator \(K\). Wiederum mit [eq:4.2.10] und dem Lemma von Fatou folgt \[\sum_k | {\pmb(K\phi_k,\psi_k\pmb)} | = \sum_k \lim_{n\to\infty} | {\pmb(K_n\phi_k,\psi_k\pmb)} | \le \liminf_{n\to\infty} \sum_k | {\pmb(K_n \phi_k,\psi_k\pmb)} | \le \sup_n \|K_n\|_{\mathfrak S_1}\] und damit \(K\in\mathfrak S_1(H)\) und analog die Konvergenz in \(\mathfrak S_1(H)\), \[\begin{split} \sum_k | {\pmb((K-K_n)\phi_k,\psi_k\pmb)} | &= \sum_k \lim_{m\to\infty} | {\pmb((K_m-K_n)\phi_k,\psi_k\pmb)} | \\& \le \liminf_{m\to\infty} \sum_k | {\pmb((K_m-K_n) \phi_k,\psi_k\pmb)} |\\& \le \sup_{m\ge n} \|K_m-K_n\|_{\mathfrak S_1}\to0,\quad n\to\infty, \end{split}\] und damit die Behauptung. ◻

Korollar 4.8. \(\mathfrak S_2\) ist Hilbertraum mit Innenprodukt \[\label{eq:spur-innen} {\pmb(A,B\pmb)}_{\mathfrak S_2} = \mathop{\mathrm{trace}}(B^*A) .\]

Proof. Es gilt \(A\in\mathfrak S_2\) genau dann, wenn \(A^*A\in\mathfrak S_1\). Damit ist klar, daß das Spurinnenprodukt [eq:spur-innen] die \(\mathfrak S_2\)-Norm erzeugt. Zu zeigen ist also wiederum nur die Vollständigkeit. Diese folgt analog aus der Charakterisierung \[\|A\|_{\mathfrak S_2}^2 = \sup_{(\phi_k),(\psi_k)\in\mathcal O} \sum_{k} |{\pmb(A\phi_k,A\psi_k\pmb)}|\] und dem Lemma von Fatou. ◻

Zum Schluß wollen wir noch einige allgemeine Eigenschaften der Schattenklassen zusammenfassen. Für Beweise sei auf die Literatur verwiesen.

Proposition 4.9.

  1. \(\mathfrak S_p\) ist ein Banachraum mit Norm \(\|\cdot\|_{\mathfrak S_p}\).

  2. Es gilt die Hölderungleichung für Schattenklassen \[\| AB \|_{\mathfrak S_r} \le \|A\|_{\mathfrak S_p} \|B\|_{\mathfrak S_q}\] für \(A\in \mathfrak S_p\) und \(B\in\mathfrak S_q\) und \(\frac1r = \frac1p + \frac1q\).

Satz 4.10 (Lidskij57). Sei \(K\in\mathfrak S_1\). Dann gilt \[\mathop{\mathrm{trace}}K = \sum_{\lambda\in \sigma(K)\setminus\{0\}} \lambda \dim \mathop{\mathrm{ker}}((\lambda I-K)^{\ell(\lambda)}).\]

Bemerkung zum Beweis. Der Originalbeweis nutzt Jordan-Normalformen kompakter Operatoren, alternative Beweise die Theorie der Fredholmdeterminanten \(z\to \det(I+zK)\) als holomorphe Funktionen in \(z\) und die Identität \(\mathop{\mathrm{trace}}K = \frac{\,\mathrm d}{\,\mathrm dz} \det(I+zK)\big|_{z=0}\).
Siehe Gohberg–Krein, §III.8, Theorem 8.4. ◻

Satz 4.11 (Dualitätssätze). Sei \(H\) Hilbertraum. Dann gilt \(\mathcal K(H)' = \mathfrak S_1\), d.h., zu jeder stetigen Linearform \(\phi : \mathcal K(H)\to \mathbb C\) existiert ein Spurklasseoperator \(T\in\mathfrak S_1\) derart, daß \[\langle \phi, K \rangle = \mathop{\mathrm{trace}}(T K)\] für alle \(K\in\mathcal K(H)\) gilt. Entsprechend gilt \(\mathfrak S_1'=\mathcal L(H)\) und \(\mathfrak S_p' = \mathfrak S_q\) für \(pq=p+q\) und \(1<p<\infty\).

Beweis. Siehe Gohberg–Krein, §III.12, Theorem 12.1 und 12.3. ◻

4.3 Das analytische Spektralkalkül

Banachalgebren

Wir wollen die Aussagen etwas abstrakter fassen und uns nicht auf die Banachalgebra \(\mathcal L(V)\) der beschränkten Operatoren eines Banachraumes \(V\) beschränken. Sei dazu für das folgende \(\mathcal A\) eine komplexe Banachalgebra mit Eins. Das Einselement wollen wir mit \(1\) bezeichnen. Durch \[\mathbb C\ni\lambda \mapsto \lambda1\in\mathcal A,\qquad\|\lambda1\|=|\lambda|\] wird der Körper \(\mathbb C\) kanonisch in die Algebra \(\mathcal A\) eingebettet.

Definition 4.12. Sei \(x\in\mathcal A\). Dann bezeichnet man die Menge \[\rho(x)=\{ \lambda\in\mathbb C\,|\, (\lambda-x)^{-1}\in\mathcal A\}\] als Resolventenmenge von \(x\) und ihr Komplement \(\sigma(x)=\mathbb C\setminus\rho(x)\) als Spektrum von \(x\). Auf der Resolventenmenge definiert man die Funktion \[R_x : \rho(x)\ni\lambda \mapsto (\lambda-x)^{-1} \in\mathcal A,\] die Resolvente von \(x\).

Beispiel 4.13. Speziell für die Banachalgebra \(\mathcal A=\mathcal L(V)\) ergibt sich als Resolventenmenge \(\rho(A)\) für ein \(A\in\mathcal L(V)\) die Menge aller \(\lambda\in\mathbb C\), für die \(\lambda I-A\) stetig invertierbar ist. Das Spektrum \(\sigma(A)\) kann man in diesem Falle in Teile untergliedern. Entweder ist \(\lambda I-A\) nicht injektiv, dann ist \(\lambda\) Eigenwert. Die Menge \(\sigma_P(A)\) der Eigenwerte wird als Punktspektrum bezeichnet. Oder, \(\lambda I-A\) ist injektiv. Dann kann \(\lambda I-A\) nicht surjektiv sein (da es ja sonst nach dem Satz von Banach über den inversen Operator stetig invertierbar wäre). Also ist entweder \(\mathop{\mathrm{ran}}(\lambda I-A)\) dichter Teilraum von \(V\) oder der Abschluß von \(\mathop{\mathrm{ran}}(\lambda I-A)\) ist ein echter Teilraum. Im ersten Falle gehört \(\lambda\) zum kontinuierlichen Spektrum \(\sigma_c(A)\), im zweiten Falle zum residualen Spektrum \(\sigma_r(A)\).

Beispiel 4.14. Wählt man als Banachalgebra die Calkin-Algebra \(\mathcal A=\mathcal L(V)/\mathcal K(V)\), so erhält man für einen Operator \(A\) (bzw. seine Äquivalenzklasse \([A]_{\mathcal K}\)) als Resolventenmenge den sogenannten Fredholmbereich von \(A\) und als Spektrum das essentielle (Wolf-) Spektrum58 \[\sigma_w(A)=\{\lambda\in\mathbb C\,|\,\text{$[\lambda I-A]_{\mathcal K}$ nicht invertierbar in $\mathcal L(V)/\mathcal K(V)$}\,\}.\] Es gilt \(\sigma_w(A)\subseteq\sigma(A)\), letzteres das Spektrum aus Beispiel Beispiel 4.13. Betrachtet man speziell nur kompakte Operatoren \(K\in\mathcal K(V)\), \(V\) unendlichdimensional, so ist \(\sigma_w(K)=\sigma_w(0)=\{0\}\).

Die in \(\mathcal L(V)/\mathcal K(V)\) invertierbaren Operatoren sind nach dem Satz von Atkinson (Satz Satz 3.40) gerade die Fredholmoperatoren.

Von besonderer Bedeutung ist das essentielle (Weyl-) Spektrum59 \[\sigma_e(A)= \mathbb C\setminus \{\lambda\in\mathbb C\,|\,\text{$\lambda I-A$ Fredholm mit $\mathop{\mathrm{ind}}(\lambda I-A)=0$}\,\}.\] Es gilt \(\sigma_w(A)\subset \sigma_e(A)\subset \sigma(A)\) und nach Schechter60 auch \[\sigma_e(A) = \bigcap_{K\in\mathcal K(V)} \sigma(A+K).\]

Beispiel 4.15. Setzt man für \(\mathcal A\) die Banachalgebra \(\mathrm C(X)\) der stetigen Funktionen auf dem Kompaktum \(X\), so ergibt sich für das Spektrum des Elementes \(f\in \mathrm C(X)\) genau der Wertebereich der Funktion, \(\sigma(f)=f[X]\).

Lemma 4.16. Es gilt \(\sigma(x)\subseteq \{ \lambda\in\mathbb C\,|\,|\lambda|\leq\|x\|\}\). Weiterhin gilt für \(|\lambda|>\|x\|\) \[\label{eq:Resolvente-Laurent} R_x(\lambda)=\lambda^{-1}(1-\lambda^{-1}x)^{-1} = \sum_{k=0}^\infty \lambda^{-k-1}x^k.\] (Dabei sei \(x^0=1\) gesetzt.)

Proof. Neumannreihe. ◻

Eine Funktion \(f:\mathbb C\to\mathcal A\) die sich lokal durch eine in \(\mathcal A\) konvergente Potenzreihe \[f(\lambda)=\sum_{k=0}^\infty x_k (\lambda-\lambda_0)^k,\qquad |\lambda-\lambda_0|<r\] mit Koeffizienten \(x_k\in\mathcal A\) schreiben läßt, wollen wir als analytisch bezeichnen. Das Majorantenkriterium (Satz Satz 1.17) liefert für den Konvergenzradius \(r\) die Darstellung \[\frac1r=\limsup_{k\to\infty} \|x_k\|^{1/k}.\]

Satz 4.17. Sei \(x\in\mathcal A\). Dann gelten die folgenden Aussagen:

  1. Die Resolventenmenge \(\rho(x)\) ist offen und die Resolvente \(R_x\) ist analytisch.

  2. Das Spektrum \(\sigma(x)\) ist nichtleer und kompakt.

  3. Es gilt \[\sup_{\lambda\in\sigma(x)} |\lambda| =r_x= \limsup_{n\to\infty} \|x^n\|^{1/n}.\] Die Zahl \(r_x\) wird als Spektralradius von \(x\) bezeichnet.

Proof.  [1.] Sei \(\lambda_0\in \rho(x)\) und \(\lambda\) so, daß \(|\lambda-\lambda_0|\,\|R_x(\lambda_0)\|<1\). Dann gilt \[R_x(\lambda)=R_x(\lambda_0)\sum_{k=0}^\infty ((\lambda_0-\lambda)R_x(\lambda_0))^k,\] da wegen \((\lambda-x)=(\lambda_0-x)+(\lambda-\lambda_0)\) \[\begin{aligned} (\lambda-x)R_x(\lambda)&=(\lambda-x)R_x(\lambda_0)\sum_{k=0}^\infty ((\lambda_0-\lambda)R_x(\lambda_0))^k\\ &=(\lambda_0-x)R_x(\lambda_0)\sum_{k=0}^\infty ((\lambda_0-\lambda)R_x(\lambda_0))^k+(\lambda-\lambda_0)R_x(\lambda_0)\sum_{k=0}^\infty ((\lambda_0-\lambda)R_x(\lambda_0))^k\\ &=\sum_{k=0}^\infty ((\lambda_0-\lambda)R_x(\lambda_0))^k-R_x(\lambda_0)\sum_{k=0}^\infty (\lambda_0-\lambda)^{k+1}R_x(\lambda_0)^k=1 \end{aligned}\] gilt. Also ist \(R_x\) in \(\lambda_0\) analytisch. Weiter sieht man, daß \(\rho(x)\) offen ist. \(\bullet\qquad\) [2.] Damit ist \(\sigma(x)\) als Komplement der offenen Menge abgeschlossen. Wegen Lemma Lemma 4.16 ist das Spektrum beschränkt, also kompakt. Um zu zeigen, daß das Spektrum nichtleer ist, wenden wir den Satz von Liouville aus der Funktionentheorie an. Sei dazu \(\phi\in\mathcal A'\). Dann ist die Funktion \[\rho(x)\ni \lambda\mapsto\langle\phi,R_x(\lambda)\rangle \in\mathbb C\] analytisch und wegen \(\lambda R_x(\lambda)=\lambda(\lambda-x)^{-1} \to 1\) für \(\lambda\to\infty\) in \(\lambda=\infty\) regulär. Wäre \(\rho(x)=\mathbb C\), so müßte \(\langle\phi,R_x(\lambda)\rangle\) für jedes \(\phi\) konstant sein. Dann wäre aber auch \(R_x\) konstant (Trennungseigenschaften, Hahn–Banach). Widerspruch! \(\bullet\qquad\) [3.] Durch [eq:Resolvente-Laurent] ist eine Laurentreihe der Resolvente gegeben. Analog zur Funktionentheorie zeigt man, daß auf dem (inneren) Rand des Konvergenzgebietes ein \(\lambda\) existieren muß, in das \(R_x\) nicht analytisch fortgesetzt werden kann. Dieses muß also zu \(\sigma(x)\) gehören. ◻

Proposition 4.18. Die Resolvente \(R_x\) erfüllt die Resolventengleichung \[R_x(\lambda)-R_x(\mu)=-(\lambda-\mu)R_x(\mu)R_x(\lambda)\] für \(\lambda,\mu\in\rho(x)\). Insbesondere gilt \[\partial_\lambda R_x(\lambda)=-R_x(\lambda)^2.\]

Integrale mit Werten in einer Banachalgebra, Integraldarstellungen

Sei nun \(\Gamma\) eine glatte Kurve endlicher Länge innerhalb von \(\mathbb C\) und \(f:\Gamma\to\mathcal A\) stetig. Dann kann man das komplexe \(\mathcal A\)-wertige Kurvenintegral \[\int_\Gamma f(\lambda)\,\mathrm d\lambda \in\mathcal A\] in vollkommener Analogie zum \(\mathbb C\)-wertigen Riemann-Integral definieren, die entsprechenden Riemannschen Summen konvergieren in \(\mathcal A\). Wir skizzieren kurz eine mögliche Konstruktion:61

Sei \(\phi\in\mathcal A'\). Dann ist \(\lambda\to\langle\phi,f(\lambda)\rangle\) stetig und es existiert damit das komplexe Kurvenintegral entlang der Kurve \(\Gamma\). Wie man sofort sieht ist die Zuordnung \[\Psi : \phi \mapsto \int_\Gamma \langle\phi,f(\lambda)\rangle \,\mathrm d\lambda\] linear in \(\phi\) und wegen \[\label{eq:4:IntEst} \left| \int_\Gamma \langle\phi,f(\lambda)\rangle \,\mathrm d\lambda\right| \leq \boldsymbol{|} \Gamma\boldsymbol{|}\, \|\phi\|_{\mathcal A'}\,\max_{\lambda\in\Gamma} \|f(\lambda)\|_{\mathcal A},\] \(|\Gamma|\) die Länge der Kurve \(\Gamma\), ist \(\Psi\in\mathcal A''\). Wir zeigen, daß sogar \(\Psi\in\mathcal A\) gilt. Sei dazu \(\lambda : [0,1]\to\Gamma\) eine Parametrisierung der Kurve. Das komplexe Kurvenintegral ist Grenzwert seiner Riemannschen Summen, \[\sum_{\mathfrak Z} \langle\phi,f(\lambda(t_j)) \lambda'(t_j) \rangle (t_{j+1}-t_j) \to \int_\Gamma \langle\phi,f(\lambda)\rangle \,\mathrm d\lambda\] für immer feiner werdende Zerlegungen \(\mathfrak Z\) des Intervalls \([0,1]\). Also auch \[\left\langle\phi,\sum_{\mathfrak Z} f(\lambda(t_j)) \lambda'(t_j) (t_{j+1}-t_j)\right\rangle \to \langle\Psi,\phi\rangle \qquad \forall\phi\in\mathcal A'\] und damit \[\sum_{\mathfrak Z} f(\lambda(t_j)) \lambda'(t_j) (t_{j+1}-t_j)\stackrel{*}{\rightharpoonup}\Psi\] in \(\mathcal A''\). Dann ist jede der Riemannschen Summen in der konvexen Hülle \[\mathrm{conv} \{ f(\lambda(t))\lambda'(t) : t\in[0,1]\}\] enthalten. Nutzt man die Hilfsaussage

Lemma 4.19 (Kompaktheitssatz von Mazur). Sei \(X\) Banachraum und \(M\subseteq X\) kompakt. Dann ist die konvexe Hülle \(\mathrm{conv}\;M\) relativ kompakt.

so existiert eine in \(\mathcal A\) normkonvergente Teilfolge von Riemannschen Summen.62 Die Eindeutigkeit des schwach-* Grenzwertes impliziert, daß diese gegen \(\Psi\) konvergiert, insbesondere also \(\Psi\in \overline{\mathrm{conv}}\{ f(\lambda(t))\lambda'(t) : t\in[0,1]\} \subseteq\mathcal A\) gilt.

Satz 4.20 (Dunford63). Sei \(\Gamma\) glatte Kurve endlicher Länge in \(\mathbb C\) und \(f:\Gamma\to\mathcal A\) stetig. Dann existiert genau ein Element \(\int_\Gamma f(\lambda)\,\mathrm d\lambda\in\mathcal A\), für welches \[\left\langle\phi,\int_\Gamma f(\lambda)\,\mathrm d\lambda\right\rangle = \int_\Gamma \langle\phi,f(\lambda)\rangle \,\mathrm d\lambda\] für jedes \(\phi\in\mathcal A'\) gilt.

Da damit alle Integrale auf rein komplexe Kurvenintegrale zurückgeführt worden sind, kann man somit für analytische Funktionen \(f:\mathbb C\supseteq\Omega\to\mathcal A\) Integralsätze der Funktionentheorie anwenden. Der Schritt zurück erfolgt mit den Trennungssätzen nach Hahn–Banach. Als Anwendung der Cauchyschen Integralformeln auf die Laurent-Reihe [eq:Resolvente-Laurent] ergeben sich für deren Koeffizienten

Proposition 4.21. Sei \(\Gamma\) eine glatte Kurve die \(\sigma(x)\) einmal positiv umläuft. Dann gilt \[x^k = \frac1{2\pi \mathrm i} \oint_\Gamma \lambda^k R_x(\lambda)\,\mathrm d\lambda\] für alle \(k=0,1,2,\ldots\)

Proof. Sei \(\phi\in\mathcal A'\). Dann gilt \[\langle\phi, R_x(\lambda)\rangle = \sum_{k=0}^\infty \lambda^{-k-1}\langle\phi,x^k\rangle.\] Das ist eine Laurent-Reihe auf \(|\lambda|>r_x\). Damit gilt für den Koeffizienten \(\langle\phi,x^k\rangle\) vor \(\lambda^{-k-1}\) die Darstellung durch das Cauchy-Integral \[\langle\phi,x^k\rangle= \frac1{2\pi \mathrm i} \oint_\Gamma \lambda^k \langle\phi,R_x(\lambda)\rangle\,\mathrm d\lambda = \frac1{2\pi i} \langle\phi,\oint_\Gamma \lambda^k R_x(\lambda)\,\mathrm d\lambda\rangle.\] Da lineare Funktionale punktetrennend sind, folgt die Aussage. ◻

Damit haben wir eine Darstellung für Polynome in \(x\). Wir wollen diese auf in einer Umgebung des Spektrums analytische Funktionen ausweiten.

Definition 4.22. Sei \(f\) in einer Umgebung von \(\sigma(x)\) analytisch und \(\Gamma\) endliche Vereinigung geschlossener positiv orientierter glatter Kurven um \(\sigma(x)\) (innerhalb dieser Umgebung). Dann sei \[f(x) = \frac1{2\pi \mathrm i} \oint_\Gamma f(\lambda) R_x(\lambda)\,\mathrm d\lambda .\]

Satz 4.23 (Dunford). Sei \(x\in\cal A\). Seien \(f,g\) in einer Umgebung von \(\sigma(x)\) analytisch, \(\alpha,\beta\in\mathbb C\). Dann gilt

  1. \((\alpha f+\beta g)(x)=\alpha f(x)+\beta g(x)\)

  2. \((fg)(x)=f(x)g(x)\)

Sei \(f_n\) Folge analytischer Funktionen in einer (gemeinsamen) Umgebung von \(\sigma(x)\). Konvergiert \(f_n\) in dieser Umgebung gleichmäßig gegen \(f\), so konvergiert \(f_n(x)\) gegen \(f(x)\) in der Banachalgebra \(\mathcal A\).

Proof. Es ist nur (2) zu zeigen, der Rest ist klar. Dazu nehmen wir an, daß \(\Gamma_1\) vollständig im Innern von \(\Gamma_2\) liegt. Dann gilt \[\begin{aligned} f(x)g(x) &=-\frac1{4\pi^2}\oint_{\Gamma_1} f(\lambda)R_x(\lambda)\,\mathrm d\lambda\cdot\oint_{\Gamma_2} g(\mu)R_x(\mu)\,\mathrm d\mu\\ &=-\frac1{4\pi^2}\oint_{\Gamma_1}\oint_{\Gamma_2} f(\lambda)g(\mu)(\mu-\lambda)^{-1}(R_x(\lambda)-R_x(\mu))\,\mathrm d\mu\,\mathrm d\lambda\\ &=\frac1{2\pi \mathrm i}\oint_{\Gamma_1} f(\lambda)R_x(\lambda)\left\{\frac1{2\pi\mathrm i}\oint_{\Gamma_2} \frac{g(\mu)}{\mu-\lambda}\,\mathrm d\mu\right\}\,\mathrm d\lambda\\ &\qquad-\frac1{2\pi \mathrm i}\oint_{\Gamma_2} g(\mu)R_x(\mu)\left\{\frac1{2\pi\mathrm i}\oint_{\Gamma_1} \frac{f(\lambda)}{\mu-\lambda}\,\mathrm d\lambda\right\}\,\mathrm d\mu\\ &=\frac1{2\pi \mathrm i}\oint_{\Gamma_1} f(\lambda)g(\lambda)R_x(\lambda)\,\mathrm d\lambda=(fg)(x). \end{aligned}\] Dabei nutzt man aus, daß \[\oint_{\Gamma_1} \frac{f(\lambda)}{\mu-\lambda}\,\mathrm d\lambda=0\] gilt, da \(\mu\) außerhalb von \(\Gamma_1\) liegt und der Integrand somit im Innern der Kurve \(\Gamma_1\) analytisch ist.

Die Stetigkeit des Integralkalküls folgt aus [eq:4:IntEst] in der Form \[\| f(x)\| \le \frac{\boldsymbol{|}\Gamma\boldsymbol{|}}{2\pi} \; \max_{\lambda\in\Gamma} \|R_x(\lambda)\| \; \max_{\lambda\in\Gamma} |f(\lambda)|.\] ◻

Korollar 4.24 (Spektraler Abbildungssatz). Sei \(f\) analytisch in einer Umgebung von \(\sigma(x)\). Dann ist \[\sigma(f(x))=f[\sigma(x)].\]

Proof. Sei \(f\) analytisch in einer Umgebung von \(\sigma(x)\).

Sei \(\lambda\in\sigma(x)\). Betrachtet man nun \[g(\mu)=\frac{f(\lambda)-f(\mu)}{\lambda-\mu},\] so ist damit \(g\) analytisch in einer Umgebung von \(\sigma(x)\) (für \(\lambda=\mu\) gilt \(f(\lambda)=f(\mu)\)) und es gilt \(f(\lambda)-f(x)=(\lambda-x)g(x) = g(x)(\lambda-x)\). Wäre \(f(\lambda)-f(x)\) invertierbar, so auch \((\lambda-x)\) mit Inverser \((\lambda-x)^{-1} = g(x) (f(\lambda)-f(x))^{-1} = (f(\lambda)-f(x))^{-1} g(x)\), Widerspruch. Also ist \(f(\lambda)\in\sigma(f(x))\).

Sei \(\lambda\in\sigma(f(x))\) und \(\lambda\not\in f[\sigma(x)]\). Sei nun \[g(\mu)=\frac1{f(\mu)-\lambda},\] dann ist \(g\) analytisch in einer Umgebung von \(\sigma(x)\) und somit folgt \(g(x)(f(x)-\lambda)=(f(x)-\lambda)g(x)=1\), Widerspruch. ◻

Beispiel 4.25. Ein Grund, warum wir Analytizität nur in der Umgebung von \(\sigma(x)\) gefordert haben, ist, daß wir nun Elemente \(x\in\cal A\) nach Zusammenhangskomponenten des Spektrums \(\sigma(x)\) zerlegen können. Gilt \(\sigma(x)=\sigma_1(x)\cup\sigma_2(x)\) mit disjunkten kompakten Mengen \(\sigma_1(x)\) und \(\sigma_2(x)\) , \(\sigma_1(x)\cap\sigma_2(x)=\varnothing\), so ist die Funktion \[f_i(\lambda)=\begin{cases} 1, \qquad &\lambda\in\sigma_i(x),\\ 0,&\lambda\in\sigma(x)\setminus\sigma_i(x) \end{cases}\] in eine Umgebung des Spektrums analytisch fortsetzbar. Setzt man nun \(p_i=f_i(x)\), so gilt \(p_i^2=p_i\) und \(\sigma(p_ix)=\sigma(xp_i)=\sigma_i(x)\cup\{0\}\). Weiter gilt \(p_1+p_2=1\) und \(x=p_1x+p_2x\) stellt die gesuchte Zerlegung dar.

Beispiel 4.26. Sei \(K\in\mathcal K(V)\) kompakt. Dann besagt der Spektralsatz von Riesz–Schauder, daß \(\sigma_P(K)\setminus\{0\}\) aus abzählbar vielen Eigenwerten \(\lambda_i\) besteht. Zu jedem dieser Eigenwerte \(\lambda_i\) gehörte ein Projektionsoperator \(P_i\) auf \(\mathop{\mathrm{ker}}((\lambda_iI-K)^\ell)\), \(\ell\) Kettenlänge von \(\lambda_iI-K\). Dieser ist durch \[P_i=\frac1{2\pi\mathrm i}\oint_\Gamma R_K(\lambda)\,\mathrm d\lambda\] gegeben. Dabei umläuft \(\Gamma\) (nur) den Eigenwert \(\lambda_i\) einmal in positivem Sinn. Das kann man auch anders schreiben, \[P_i=\mathrm{Res}(R_K,\lambda_i).\] Zusammen mit dem Residuensatz ergibt sich \[K = \sum_{i=1}^N K P_i + R_N\] mit einem Restterm \(R_N\) für den \(\sigma(R_N) = \sigma(K)\setminus\{\lambda_1,\ldots,\lambda_N\}\) gilt. Im Allgemeinen gilt nicht \(\|R_N\|\to0\) für \(N\to\infty\).

Beispiel 4.27. Eine Anwendung dieses Spektralkalküls kann es sein, Lösungen von Evolutionsgleichungen zu berechnen. Wir wollen nur ein Beispiel betrachten. Sei \(V\) Banachraum und \(A\in\mathcal L(V)\) beschränkter Operator. Gesucht ist eine (Fréchet-) differenzierbare64 Funktion \(f:\mathbb R\to V\), für welche \[f'-Af=g,\qquad f(0)=f_0\in V\] zu einem vorgegebenen stetigen \(g:\mathbb R\to V\) gilt. Die Lösung dieser abstrakten Differentialgleichung ist dann durch \[f(t)=e^{tA} f_0 + \int_0^t e^{(t-\tau)A} g(\tau)\,\mathrm d\tau\] gegeben. Es gilt \(\sigma({\mathrm e}^{tA}) = \{ {\mathrm e}^{t\lambda}\;:\; \lambda\in\sigma(A)\}\), entsprechend \(\sigma_w({\mathrm e}^{tA})= \{ {\mathrm e}^{t\lambda}\;:\; \lambda\in\sigma_w(A)\}\).

Interessanter wird dieses Beispiel für unbeschränkte Operatoren und führt dann zur Theorie der Operatorhalbgruppen und der Spektraltheorie sektorieller Operatoren (mit Anwendungen für partielle Differentialgleichungen).


  1. Die Annahme der Kontinuumshypothese ist rein notationell begründet, keiner der Hauptsätze der Funktionalanalysis beruht auf dieser. Allerdings ‘weiß’ man damit, daß jeder separable vollständige metrische Raum die Kardinalität \(\aleph_1\) besitzt.↩︎

  2. nach Augustin Louis Cauchy, 1789-1857↩︎

  3. bezeichnet nach dem polnischen Mathematiker Stefan Banach, 1892-1945, der vollständige metrisierte Gruppen und normierte Räume in seiner Dissertation systematisch untersuchte und damit die abstrakte Funktionalanalysis begründete↩︎

  4. nach Henri Lebesgue, 1875-1941, dem Begründer der Lebesgueschen Integrationstheorie↩︎

  5. nach Godfrey Harold Hardy, 1877-1947, der diese und weitere nach ihm benannte Räume analytischer Funktionen auf der Einheitskreisscheibe zum Studium (nicht nur) zahlentheoretischer Probleme nutzte↩︎

  6. nach William Henry Young, 1862-1942.
    Es gilt die entsprechende Verallgemeinerung für \(L^p*L^q\to L^r\) mit \(1/r+1=1/p+1/q\).↩︎

  7. nach Carl Neumann, 1832-1925, der damit die Lösbarkeit gewisser Integralgleichungen nachgewiesen hat↩︎

  8. Norbert Wiener 1894-1964↩︎

  9. Karl Weierstraß, 1815-1897↩︎

  10. nach Sergei0 Natanovich Bernshtei0n (Sergei Natanovich Bernstein), 1880-1968, der den hier angegebenen elementar-konstruktiven Beweis des Weierstraßschen Approximationssatzes damit führte↩︎

  11. Frigyes Riesz, 1880-1956. Wir werden noch einige nach ihm benannte Sätze kennenlernen.↩︎

  12. René Louis Baire, 1874-1932↩︎

  13. dabei bezeichne \(\overline{\alpha}\) die komplexe Konjugierte von \(\alpha\), falls \(\mathbb K=\mathbb C\)↩︎

  14. nach Hermann Amandus Schwarz, 1843-1921;
    ebenso nach Augustin-Louis Cauchy, 1789-1857, und Viktor Yakovlebich Bunyakovskii0 (Viktor Jakovlevich Bunjakovski), 1804-1889↩︎

  15. zu Ehren von David Hilbert, 1862-1943, der mit Hilbertraummethoden Integralgleichungen studierte↩︎

  16. nach Eliakim Hastings Moore, 1862-1932, und Roger Penrose, 1931-↩︎

  17. nach Jørgen Pedersen Gram, 1850-1916, und Erhard Schmidt, 1876-1959↩︎

  18. nach Friedrich Wilhelm Bessel, 1784-1846↩︎

  19. nach Marc-Antoine Parseval, 1755-1836↩︎

  20. Ernst Sigismund Fischer, 1875-1954↩︎

  21. Adrien Marie Legendre, 1752-1833↩︎

  22. Pafnutii0 Lp1vovich Chebyshe0v (Pafnuti Lvovich Chebyschev), 1821-1894↩︎

  23. Hugo Steinhaus, 1887-1972↩︎

  24. Paul Dirac, 1902-1984↩︎

  25. Otto Hölder, 1859-1937↩︎

  26. Hans Hahn, 1879-1934↩︎

  27. René Maurice Fréchet, 1878-1973↩︎

  28. Johann Radon, 1887-1956↩︎

  29. Der Satz geht für Intervalle \(X=[a,b]\subseteq\mathbb R\) auf Frigyes Riesz zurück.
    Johann Radon verallgemeinerte ihn auf beschränkte Gebiete des \(\mathbb R^n\), Stefan Banach und Stanislaw Saks (1897-1942) auf kompakte metrische Räume. Weiter gelten nach Andrei0 Andreevich Markov (Andre Andrejevich Markow) (1903-1979) und Shizuo Kakutani (1911–2004) Verallgemeinerungen auf lokalkompakte metrische beziehungsweise hausdorffsche Räume.↩︎

  30. Camille Jordan, 1838-1922↩︎

  31. Eduard Helly, 1884-1943↩︎

  32. David Milman, 1912-1982↩︎

  33. Billy James Pettis, 1913-1979↩︎

  34. Nach James Clarkson, der damit die Geometrie der \(L^p\)-Räume studierte.↩︎

  35. Lewnidas Alaoglou (Leonidas Alaoglu), 1914-1981↩︎

  36. Alfréd Haar, 1885-1933↩︎

  37. Herman Heine Goldstine, 1913–2004↩︎

  38. William Frederick Eberlein, 1917-1986↩︎

  39. Vitolp1d Lp1vovich Shmulp1yan (Witold Lwowitsch Schmulian), 1914-1944↩︎

  40. d.h. der Abschluß der Menge ist kompakt↩︎

  41. in der Normtopologie↩︎

  42. Cesare Arzelà,1847-1912↩︎

  43. Giulio Ascoli, 1843-1896↩︎

  44. Andrei0 Nikolaevich Kolmogorov (Andre Nikolaevich Kolmogorov), 1903-1987↩︎

  45. nach Julius Schauder, 1899-1943↩︎

  46. Alexander Grothendieck, 1928-2014↩︎

  47. Man kann den Satz auf allgemeine normierte Räume verallgemeinern, muß dann aber im Beweis auf den Satz über den inversen Operator verzichten und die Kompaktheit von \(K\) direkt ausnutzen.↩︎

  48. Ivar Fredholm, 1866-1927↩︎

  49. Man sagt, die Gleichung sei in selbstadjungierter Form gegeben. Wie man nachfolgend sieht, stimmt sie so mit der konjugierten Gleichung überein.↩︎

  50. Frederick Valentine Atkinson, 1916-2002↩︎

  51. Solche algebraischen Komplementärräume existieren immer (allgemeiner Basisergänzungssatz!); \(E_1\) ist im allgemeinen nicht endlichdimensional, die anderen sind es nach Voraussetzung.↩︎

  52. Otto Toeplitz, 1881-1940↩︎

  53. nach Mark Grigorp1ievich Krei0n (Mark Grigorievich Krein), 1907-1989, und Izrailp1 Cudikovich Gokhberg (Israel Gohberg), 1928-2009↩︎

  54. Transponiert, nicht adjungiert!↩︎

  55. nach Robert Schatten, 1911-1977 und gelegentlich auch nach John von Neumann, 1903-1957↩︎

  56. gezählt mit Vielfachheit↩︎

  57. Viktor Borisovich Lidskii0 (Viktor Borisovitch Lidskij), 1924–2008↩︎

  58. nach František Wolf, 1904-1989↩︎

  59. nach Hermann Weyl, 1885-1955↩︎

  60. Martin Schechter, 1930–↩︎

  61. Wir wählen nicht die klassische Definition des Riemann-Integrals sondern wählen den Umweg über Dualitätstheorie und das sogenannte Dunford–Pettis-Integral als ’schwachen’ Integralbegriff.↩︎

  62. Alternativ kann man die gleichmäßige Stetigkeit von \(f\) auf \(\Gamma\) nutzen und die Konvergenz der Riemannschen Summen direkt zeigen. Dies wuerde auf den ’starken’ Integralbegriff, das Bochner-Integral führen.↩︎

  63. Nelson Dunford, 1906-1986↩︎

  64. Da es nur ein Beispiel ist, wollen wir keine eigenständige Definition dazu angeben. Was wir fordern ist, daß \(f(t+\tau)-f(t)=f'(t)\tau + o(|\tau|)\) für ein von \(t\) abhängiges \(f'(t)\in\mathcal L(V)\) gilt. Man bezeichnet \(f'(t)\) als Fréchet-Ableitung von \(f\) an der Stelle \(t\).↩︎