Will man Randwertprobleme der Form \[\Delta u = \sum_{j=1}^n \partial_j^2 u= 0,\qquad u(x)\big|_{\partial\Omega} = h(x) \in \mathrm C(\partial\Omega)\] für ein gegebenes Gebiet \(\Omega\subseteq\mathbb R^n\) mit glattem Rand \(\partial\Omega\) lösen, so ist die Suche nach den klassischen Lösungen, also Funktionen \(u\in\mathrm C^2(\overline\Omega)\) die diese Gleichung punktweise erfüllen, schwierig und ohne zusätzliche Voraussetzungen an \(h(x)\) im allgemeinen unlösbar. Die Behandlung vereinfacht sich, wenn man beobachtet, dass die Lösung (falls existent) \[\sum_{j=1}^n \int_\Omega \left|\partial_j u(x)\right|^2 {\,\mathrm d}x \longrightarrow \min\] unter der Klasse aller Funktionen \(u(x)\) mit vorgegebenen Randwerten minimiert. Ersetzt man den Begriff der klassischen Differenzierbarkeit durch eine schwächere Forderung und die Klasse der gesuchten Lösungsfunktionen durch den Sobolevraum \(\mathrm H^1(\Omega)\), so ist das Variationsproblem stets lösbar. Ziel der Vorlesung ist es, Grundtechniken im Umgang mit Sobolev- und allgemeineren Funktionenräumen zu erlangen.
Funktionenräume sind spezielle Banach- oder Hilberträume, die sich dadurch auszeichnen, daß ihre Elemente auch ‘außerhalb’ ihres Raumes leben. Sei dazu im folgenden \(\mathcal F\) ein (hier abstrakt nicht weiter spezifizierter) topologischer \({\mathbb C}\)-Vektorraum aller ‘Funktionen’ versehen mit der Struktur eines vollständigen toplogischen Hausdorff-Raumes. Wir nehmen also an, daß Addition und skalare Multiplikation stetig sind und die Topologie punktetrennend und vollständig ist.
In konkreten Situationen wird \(\mathcal F\) zum Beispiel der Raum der stetigen Funktionen auf einem Gebiet, der Raum der lokal integrierbaren Funktionen oder ein Distributionenraum sein. Wir wollen hier vorerst aber weiterhin abstrakt bleiben.
Unter einem Funktionenraum soll im folgenden ein komplexer Banach-Raum \(\mathbf A\) verstanden werden, der aus allen Funktionen \(f \in\mathcal F\) besteht, welche eine definierende Bedingung der Form \[\label{eq:1:A-def} % \left\|\left. f \,\right|\, \mathbf A \right\| < \infty\] erfüllen. Dabei soll \(% \left\|\left. \cdot \,\right|\, \mathbf A \right\|\) die folgenden Eigenschaften einer auf \(\mathcal F\) definierten Normfunktion besitzen:
Es sei \[\label{eq:1:N1} % \left\|\left. \cdot \,\right|\, \mathbf A \right\| : \mathcal F \to [0,\infty] =\overline{{\mathbb R}_+}\cup\{\infty\}\] mit \(% \left\|\left. f \,\right|\, \mathbf A \right\| = 0\) genau dann, wenn \(f\) die Nullfunktion \(0\in\mathcal F\) ist, und \[\label{eq:1:N2} % \left\|\left. \lambda f \,\right|\, \mathbf A \right\| = |\lambda| \,% \left\|\left. f \,\right|\, \mathbf A \right\| ,\qquad % \left\|\left. f+g \,\right|\, \mathbf A \right\| \le % \left\|\left. f \,\right|\, \mathbf A \right\| + % \left\|\left. g \,\right|\, \mathbf A \right\|\] für alle Funktionen \(f,g\in\mathcal F\) und Skalare \(\lambda\in{\mathbb C}\).
Hierbei sei \(0\cdot\infty=0\), \(0+\infty=\infty\) und \(a\cdot\infty=a+\infty=\infty\) für \(a\in(0,\infty]\) gesetzt werden.
Damit wird \(\mathbf A = \{ f\in\mathcal F : % \left\|\left. f \,\right|\, \mathbf A \right\| <\infty\}\) versehen mit \(% \left\|\left. \cdot \,\right|\, \mathbf A \right\|\) zu einem normierten Raum. Als zweites fordern wir, daß dieser stetig in \(\mathcal F\) eingebettet ist.
Aus \(% \left\|\left. f_k \,\right|\, \mathbf A \right\| \to 0\) folgt \(f_k \to 0\) in \(\mathcal F\).
Da \(\mathcal F\) vollständig und die Einbettung stetig ist, konvergiert jede Cauchyfolge aus \(\mathbf A\) in \(\mathcal F\). Damit der durch \(% \left\|\left. \cdot \,\right|\, \mathbf A \right\|\) definierte Raum \(\mathbf A\) vollständig ist, muß die Norm auf den so entstehenden Grenzelementen endlich sein. Dies fordert
Sei \(f_k\) eine \(\mathbf A\)-Cauchyfolge und \(f\) ihr Grenzwert in \(\mathcal F\). Dann gilt \(f\in\mathbf A\).
Als Konsequenz der umgekehrten Dreiecksungleichung in \(\mathbf A\) ergibt sich direkt \[\label{eq:1:N4} % \left\|\left. f \,\right|\, \mathbf A \right\| = \lim_{k\to\infty} % \left\|\left. f_k \,\right|\, \mathbf A \right\| ,\] die letzte Forderung ist notwendig, da die Anwendung der umgekehrten Dreiecksungleichung für Elemente aus \(\mathcal F\) im Allgemeinen auf Ausdrücke der Form \(\infty-\infty\) führt und wir explizit \(% \left\|\left. f \,\right|\, \mathbf A \right\| <\infty\) fordern müssen.
Die Normfunktion \(% \left\|\left. \cdot \,\right|\, \mathbf A \right\|\) erfüllt hier einen doppelten Zweck, sie mißt sowohl die Größe der Funktion \(f\) als auch deren Zugehörigkeit zu einem Raum.
Hat man zwei solche Funktionenräume \(\mathbf A\) und \(\mathbf B\) gegeben, so sind \(\mathbf A\cap \mathbf B\) und \(\mathbf A+ \mathbf B\) wiederum Funktionenräume mit Normfunktionen \[% \left\|\left. f \,\right|\, \mathbf A\cap \mathbf B \right\| = % \left\|\left. f \,\right|\, \mathbf A \right\| + % \left\|\left. f \,\right|\, \mathbf B \right\|\] und \[% \left\|\left. f \,\right|\, \mathbf A+ \mathbf B \right\| = \inf_{f=g+h} \left( % \left\|\left. g \,\right|\, \mathbf A \right\| + % \left\|\left. h \,\right|\, \mathbf B \right\| \right) .\] Die Normeigenschaften sind offensichtlich, daß es sich bei den so definierten Räumen \(\mathbf A+ \mathbf B\) und \(\mathbf A\cap\mathbf B\) um Banachräume handelt ist eine elementare Übungsaufgabe. Die beiden so konstruierten Räume werden als Summe beziehungsweise Durchschnitt der Räume \(\mathbf A\) und \(\mathbf B\) bezeichnet.
Lemma 1.1. Seien \(\mathbf A\) und \(\mathbf B\) Funktionenräume. Dann gilt \(\mathbf A\subset\mathbf B\) genau dann, wenn es eine Konstante \(C>0\) mit \[% \left\|\left. f \,\right|\, \mathbf B \right\| \le C\, % \left\|\left. f \,\right|\, \mathbf A \right\|\] für alle \(f\in\mathcal F\) gibt.
Proof. Die Ungleichung impliziert die Enthaltenseinsbeziehung direkt aus der Definition von \(\mathbf A\) und \(\mathbf B\).
Der Beweis der Gegenrichtung nutzt tiefere Aussagen der Funktionalanalysis und ist hier nur der Vollständigkeit halber angegeben. Wir betrachten die identische Abbildung als Abbildung \(\mathbf A\cap\mathbf B\to\mathbf A\). Diese ist offenbar bijektiv (da \(\mathbf A\cap\mathbf B\) als Menge mit \(\mathbf A\) übereinstimmt) und stetig, da \(\|f\,|\, \mathbf A\| \le \|f\,|\,\mathbf A\cap B\|\) per definitionem gilt. Nach dem Satz über die offene Abbildung ist damit aber die Inverse dieser Abbildung stetig und deshalb existiert eine Konstante \(C\) mit \[% \left\|\left. f \,\right|\, \mathbf A \right\| + % \left\|\left. f \,\right|\, \mathbf B \right\| = % \left\|\left. f \,\right|\, \mathbf A\cap \mathbf B \right\| \le C % \left\|\left. f \,\right|\, \mathbf A \right\| .\] Also folgt \[0\le % \left\|\left. f \,\right|\, \mathbf B \right\| \le (C-1)\, % \left\|\left. f \,\right|\, \mathbf A \right\|\] und die Aussage ist bewiesen. ◻
Es sei darauf hingewiesen, daß für diese Aussage die Banachraumeigenschaft der Funktionenräume wesentlich ist.
Korollar 1.1. Sind \(\mathbf A\) und \(\mathbf B\) Funktionenräume, die als Mengen übereinstimmen, so sind ihre Normen äquivalent. Es gibt also eine Konstante \(C\ge1\) mit \[C^{-1} % \left\|\left. f \,\right|\, \mathbf A \right\| \le % \left\|\left. f \,\right|\, \mathbf B \right\| \le C % \left\|\left. f \,\right|\, \mathbf A \right\|\] für alle \(f\in \mathcal F\).
Wir beginnen mit einigen Standardbeispielen von Funktionenräumen. Sei dazu \(\Omega\subset{\mathbb R}^n\) ein Gebiet und bezeichne \(\mathcal F = \mathrm C(\Omega)\) die Menge der auf \(\Omega\) stetigen komplexwertigen Funktionen. Der Raum \(\mathrm C_b(\Omega)\) der beschränkten stetigen Funktionen auf \(\Omega\) ist dann definiert durch die Forderung \[% \left\|\left. f \,\right|\, \mathrm C_b(\Omega) \right\| = \|f\|_\infty = \sup_{x\in\Omega} |f(x)| < \infty.\] Entsprechend definiert für \(k\in\mathbb N\) \[% \left\|\left. f \,\right|\, \mathrm C_b^k(\Omega) \right\| = \sum_{|\alpha|\le k} % \left\|\left. \partial^\alpha f \,\right|\, \mathrm C_b(\Omega) \right\| <\infty\] den Raum der \(k\)-fach stetig differenzierbaren Funktionen. Hierbei nutzen wir die übliche Multiindexschreibweise, \(\partial^\alpha = \partial_{x_1}^{\alpha_1}\cdots \partial_{x_n}^{\alpha_n}\) für \(\alpha=(\alpha_1,\ldots,\alpha_n)\in\mathbb N_0^n\), wobei \(\mathbb N_0=\mathbb N\cup\{0\}\) und \(|\alpha| = \alpha_1+\cdots+\alpha_n\), und vereinbaren, daß für nichtdifferenzierbare Funktionen die entsprechende Norm auf der rechten Seite \(\infty\) sei.
Wir belassen es als Übungsaufgabe, zu zeigen, daß die Normeigenschaften gelten. Die Voraussetzung der Vollständigkeit ist erfüllt und alle so definierten Räume sind Banach-Räume.
Im folgenden setzen wir als \(\mathcal F\) die Menge aller lokal integrierbaren Funktionen modulo Nullfunktionen auf einem Gebiet \(\Omega\). Dann definiert man für \(1\le p<\infty\) den Lebesgue-Raum \(\mathrm L^p(\Omega)\) durch \[% \left\|\left. f \,\right|\, \mathrm L^p(\Omega) \right\| = \|f\|_p = \left( \int_\Omega |f(x)|^p {\,\mathrm d}x\right)^{1/p} < \infty\] gilt. Entsprechend sei \(\mathrm L^\infty(\Omega)\) durch \[% \left\|\left. f \,\right|\, \mathrm L^\infty(\Omega) \right\| = \|f\|_\infty = \mathop{\mathrm{ess\,sup}}_{x\in\Omega} |f(x)| < \infty\] bestimmt. Um zu sehen, daß diese Definitionen sinnvoll sind, wären zuerst die Normeigenschaften nachzuweisen, die einzige nichttriviale Eigenschaft ist dabei die Dreiecksungleichung \[\begin{gathered} \| f+g \|_p = \left( \int_\Omega |f(x)+g(x)|^p{\,\mathrm d}x\right)^{1/p} \\ \le \left( \int_\Omega |f(x)|^p{\,\mathrm d}x\right)^{1/p} + \left( \int_\Omega |g(x)|^p{\,\mathrm d}x\right)^{1/p} = \|f\|_p + \|g\|_p, \end{gathered}\] welche als Minkowski-Ungleichung 1 aus der Höheren Analysis bekannt sein sollte. Die Vollständigkeit der Räume ist wiederum nachzuweisen oder schon bekannt.
Raumskale n sind Funktionenräume, die von einem oder mehreren reellen Parametern abhängen. Als Beispiel denke man an die eben genannten Lebesgue-Räume und deren Abhängigkeit vom Parameter \(p\in[1,\infty]\). Bei Raumskalen wird besonders deutlich, daß Funktionen ein ‘Eigenleben’ außerhalb konkreter Räume führen, Funktionenräume also nur zum ‘messen’ von Funktionen dienen.
So kann man für eine gegebene Funktion fragen, für welche \(p\) sie zu \(\mathrm L^p(\Omega)\) gehört. Auf dem ersten Blick überraschend ist die Tatsache, daß die Anwort auf diese Frage immer ein Intervall ist. Zum Beweis benötigen wir die Höldersche Ungleichung 2 \[\begin{gathered} \| f g\|_r = \left( \int_\Omega |f(x)g(x)|^r{\,\mathrm d}x\right)^{1/r} \\ \le \left( \int_\Omega |f(x)|^p{\,\mathrm d}x\right)^{1/p} \left( \int_\Omega |g(x)|^q{\,\mathrm d}x\right)^{1/q} = \|f\|_p \|f\|_q\end{gathered}\] für \[\frac 1p+\frac1q = \frac1r.\] Besonders wichtig ist hier der Fall \(r=1\), dann ist \(fg\in\mathrm L^1(\Omega)\) und man spricht von zueinander dualen Indices \(p\) und \(q\).
Lemma 1.2 (Riesz). Für \(1\le r< s < t \le\infty\) gilt \(\mathrm L^r(\Omega) \cap \mathrm L^t(\Omega)\subset \mathrm L^s(\Omega)\).
Proof. Es bleibt eine Ungleichung für die Normen zu beweisen. Wir nehmen der Einfachheit halber an \(t\ne\infty\). Nach Vorausstzung existiert dann \(\theta\in(0,1)\) mit \[\frac1s = \frac \theta r+\frac{1-\theta} t\] und somit gilt nach der Hölderschen Ungleichung angewandt auf die Produktzerlegung \(|f(x)|=|f(x)|^\theta |f(x)|^{1-\theta}\) \[\begin{aligned} \int_\Omega |f(x)|^s \mathrm d s \le \left( \int_\Omega |f(x)|^{r}{\,\mathrm d}x\right)^{\theta/r} \left( \int_\Omega |f(x)|^{t}{\,\mathrm d}x\right)^{(1-\theta)/t}, \end{aligned}\] also \[\label{eq:1:conv-ineq} \|f\|_s \le \|f\|_r^\theta \|f\|_t^{1-\theta}\] und die Behauptung folgt. Der Fall \(t=\infty\) folgt direkt aus der Definition der Norm. ◻
Ungleichung [eq:1:conv-ineq] wird als Konvexitätsungleichung von Riesz3 bezeichnet.
Mit Raumskalen werden wir uns in Kapitel 4 noch einmal besonders befassen. Sie erlauben es, Aussagen auf (meist einfacher zu beweisende) Spezialfälle an Randpunkten zurückzuführen.
Als letztes ein etwas anders geartetes Beispiel. Sei dazu \(\mathcal F\) die Menge der auf der offenen Kreisscheibe \(\mathbb D\subset{\mathbb C}\) analytischen Funktionen. Dann definiert \[% \left\|\left. f \,\right|\, \mathcal H^\infty(\mathbb D) \right\| = \| f\|_\infty = \sup_{\zeta\in\mathbb D} |f(\zeta)|\] den Hardy-Raum 4 \(\mathcal H^\infty(\mathbb D)\). Dieser besteht aus allen beschränkten analytischen Funktionen und ist nach den abstrakten Bemerkungen aus dem ersten Abschnitt ein Banachraum. Er wird uns im Kapitel 3 wieder begegnen. Ersetzt man die Supremumsnorm durch eine \(\mathrm L^p\)-Norm, so entstehen Spezialfälle sogenannter Bergman-Räume5.
Bisher haben wir Funktionenräume durch die Bedingung \(% \left\|\left. f \,\right|\, \mathbf A \right\| <\infty\) aus einem umfassenden Raum zulässiger Funktionen ausgewählt. Oft nutzt man eine alternative, intrinsische, Charakterisierung und bertrachtet Funktionen welche sich in einem gewissen Sinne durch ‘schöne’ Funktionen approximieren lassen. Wir bleiben vorerst abstrakt und bezeichnen mit \(\mathcal S\subset\mathcal F\) eine Menge ‘schöner’ Funktionen; in Anwendungen wird dies für reelle Funktionenräume oft ein Raum von \(\mathrm C^\infty\)-Funktionen mit kompaktem Träger sein.
Dann heißt \(\mathcal S\) dicht in \(\mathbf A\), falls für jedes \(f\in\mathbf A\) eine Folge \(f_k\in\mathcal S\) mit \[\lim_{k\to\infty} % \left\|\left. f_k-f \,\right|\, \mathbf A \right\| = 0\] existiert. Hat man dieselbe Menge \(\mathcal S\) für mehrere betrachtete Funktionenräume, so lassen sich Aussagen über die Räume äquivalent als Ungleichungen für Funktionen aus \(\mathcal S\) formulieren und damit oft einfacher beweisen. Ein Beispiel ist:
Lemma 1.3. Sei \(\mathcal S\) in \(\mathbf A\) und \(\mathbf B\) dicht. Es gilt \(\mathbf A\subset\mathbf B\) genau dann, wenn \[% \left\|\left. f \,\right|\, \mathbf B \right\| \le C % \left\|\left. f \,\right|\, \mathbf A \right\|\] für alle \(f\in\mathcal S\) und eine Zahl \(C>0\) gilt.
Hier sollen vorerst wieder die \(\mathrm L^p\)-Räume als Beispiel dienen, allerdings mit der Einschränkung \(1\le p<\infty\). Dann kann als Menge \(\mathcal S\) die Menge der Treppenfunktionen
\[\sum_{j\in J} \alpha_j 1_{E_j}(x) ,\qquad \alpha_j\in{\mathbb C},\] für endliche Indexmengen \(J\) und Borel-meßbare beschränkte Mengen \(E_j\subset\Omega\) genutzt werden. Diese ist (nach Konstruktion des Lebesgue-Integrals) dicht in \(\mathrm L^p(\Omega)\) für alle \(p\in[1,\infty)\). Dies kann man zum Beispiel nutzen, um die vorher angesprochenen Hölder- und Minkowski-Ungleichungen auf entsprechende Ungleichungen für endliche Summen zurückzuführen.
Für unsere Zwecke ist es besser, dichte Teilmengen glatter Funktionen zu wählen. Im Falle des \(\mathrm L^p({\mathbb R}^n)\) wählt man dazu die Menge der Schwartz-Funktionen 6, das heißt \(f\) gehört zu \(\mathscr S({\mathbb R}^n)\) falls \(f\) beliebig oft differenzierbar ist und \[x^\alpha {\mathrm D}^\beta f(x) \in \mathrm L^\infty({\mathbb R}^n)\] für alle Multi-Indices \(\alpha,\beta\in\mathbb N_0^n\) gilt. Dann ist \(\mathscr S({\mathbb R}^n)\) dicht in \(\mathrm L^p({\mathbb R}^n)\) für alle \(p\in[1,\infty)\). Wir werden diese Aussage im nächsten Kapitel beweisen.
Der Schwartz-Raum ist besonders wichtig für Aussagen, die mit Hilfe der Fouriertransformation studiert werden sollen. Für \(f\in\mathscr S({\mathbb R}^n)\) sei diese durch \[\mathscr F^\pm f (\xi) = (2\pi)^{-n/2} \int_{{\mathbb R}^n} {\mathrm e}^{\pm {\mathrm i}x\cdot\xi} f(x) {\,\mathrm d}x\] definiert. Ebenso aus der Höheren Analysis bekannt sein sollte der
Satz 1.1. Es gilt \(\mathscr F^\pm : \mathscr S({\mathbb R}^n)\to\mathscr S({\mathbb R}^n)\) als Bijektion auf der Menge der Schwartz-Funktionen mit \((\mathscr F^+)^{-1} = \mathscr F^-\).
Er hat eine interessante Konsequenz. Betrachtet man das \(\mathrm L^2\)-Innenprodukt der Schwartz-Funktionen \(\mathscr F^+ f\) und \(g\), so gilt \[\begin{aligned} % \left( \mathscr{F}^+f,g \right)_{\mathrm L^2} &= \int_{{\mathbb R}^n} \mathscr F^+ f(\xi) \overline{g(\xi)} {\,\mathrm d}\xi = \int_{{\mathbb R}^n} \int_{{\mathbb R}^n} {\mathrm e}^{{\mathrm i}x\cdot\xi} f(x) \overline{g(\xi)}{\,\mathrm d}x{\,\mathrm d}\xi\notag\\ &= \int_{{\mathbb R}^n} \int_{{\mathbb R}^n} f(x) \overline{{\mathrm e}^{- {\mathrm i}x\cdot\xi} g(\xi)}{\,\mathrm d}\xi{\,\mathrm d}x = % \left( f,\mathscr{F}^-g \right)_{\mathrm L^2}\end{aligned}\] und damit insbesondere mit der Inversionsformel \(\|\mathscr F^\pm f\|_2 = \|f\|_2\). Damit kann man die Fouriertransformation stetig von \(\mathscr S({\mathbb R}^n)\) auf den Raum \(\mathrm L^2({\mathbb R}^n)\) fortsetzen. Die entstehende unitäre Abbildung bezeichnen wir wiederum mit \(\mathscr F^\pm\). Weiterhin ist die Bezeichnung \(\widehat f = \mathscr F^-f\) üblich.
Korollar 1.2 ( Plancherel 7). Die Fouriertransformation \(\mathscr F^\pm\) ist eine unitäre Transformation des \(\mathrm L^2({\mathbb R}^n)\), das heißt \[% \left\|\left. \widehat f \,\right|\, \mathrm L^2 \right\| = % \left\|\left. f \,\right|\, \mathrm L^2 \right\|\] für alle \(f\in\mathrm L^2({\mathbb R}^n)\).
Proof. Sei \(f_k\in \mathscr S({\mathbb R}^n)\) eine Folge von Schwartz-Funktionen mit \(f_k\to f\) in \(\mathrm L^2({\mathbb R}^n)\). Dann ist \(f_k\) insbesondere Cauchyfolge und somit existiert für \(\epsilon>0\) ein \(N_\epsilon\) mit \[\| \widehat f_k - \widehat f_\ell \|_2 = \| f_k -f_\ell \|_2 < \epsilon\] für alle \(k,\ell\ge N_\epsilon\). Also ist \(\widehat f_k\) eine Cauchyfolge in \(\mathrm L^2({\mathbb R}^n)\). Bezeichne \(\widehat f\) ihren Grenzwert. Dann folgt \[\|\widehat f\|_2 = \lim_{k\to\infty} \| \widehat f_k \|_2 = \lim_{k\to\infty} \| f_k \|_2 = \|f\|_2\] und die Aussage ist bewiesen. ◻
Die Menge der stetigen linearen Funktionale \(\mathscr S({\mathbb R}^n)\to{\mathbb C}\) bezeichnet man als Raum der temperierten Distribution en \(\mathscr S'({\mathbb R}^n)\). Dieser ist ein gutes Beispiel für den Raum \(\mathcal F\) aller (verallgemeinerten) Funktionen und wird uns noch einige Male begegnen. Für Details verweisen wir wiederum auf die Höhere Analysis.
Sei \(\mathrm C^\infty_{c} ({\mathbb R}^n)\) die Menge der glatten Funktionen mit kompaktem Träger, das heißt jede Funktion \(f\in\mathrm C^\infty_{c} ({\mathbb R}^n)\) ist beliebig oft differenzierbar und es gibt eine Zahl \(R>0\), so daß \[f(x) =0 \qquad \text{f\"ur alle $x$ mit $|x|\ge R$}\] gilt. Solche Funktionen gibt es, ein Beispiel ist einfach mittels der glatten Abschneidefunktion \[\chi_+(r) = \begin{cases} 0 ,\qquad &r\le 0,\\ {\mathrm e}^{-1/r}, &r>0, \end{cases}\] konstruierbar.
Sei \(\Omega\subset{\mathbb R}^n\) ein Gebiet , d.h., eine zusammenhängende offene Teilmenge. Weiter sei \(\mathrm C^\infty_{c}(\Omega)\) für eine offene Menge \(\Omega\) die Menge aller glatten Funktionen mit kompaktem Träger innerhalb \(\Omega\). Weiter bezeichne \(\mathrm L^1_{loc}(\Omega)\) die Menge aller meßbaren Funktionen \(f\) auf \(\Omega\) modulo Nullfunktionen, für die \(\varphi f \in \mathrm L^1(\Omega)\) für alle \(\varphi\in\mathrm C_c^\infty(\Omega)\) gilt. Die Menge \(\mathrm L^1_{loc}(\Omega)\) bezeichnet man als den Raum der lokal integrierbaren Funktionen. Er wird für uns im folgenden die Rolle des ‘Raumes aller Funktionen’ einnehmen.
Eine Funktion \(f\in\mathrm L^1_{loc}(\Omega)\) bezeichnen wir als schwach differenzierbar bzgl. der Ableitung \(\partial^\alpha\), falls eine Funktion \(g\in\mathrm L^1_{loc}(\Omega)\) mit \[\label{eq:w-der} \int_\Omega g(x) \varphi(x) {\,\mathrm d}x = (-1)^{|\alpha|} \int_\Omega f(x) \partial^\alpha \varphi(x) {\,\mathrm d}x\] für alle \(\varphi\in\mathrm C^\infty_{c}(\Omega)\) gibt.
Mit dem noch zu beweisenden
Lemma 2.1 ( Fundamentallemma der Variationsrechnung ). Sei \(g\in\mathrm L^1_{loc}(\Omega)\) lokal integrierbar. Gilt dann für alle \(\varphi\in\mathrm C^\infty_{c}(\Omega)\) \[\int_\Omega g(x)\varphi(x){\,\mathrm d}x = 0,\] so ist \(g(x)=0\) fast überall in \(\Omega\).
ergibt sich, dass die Funktion \(g\) in [eq:w-der] eindeutig bestimmt ist. Wir bezeichnen deshalb für schwach differenzierbares \(f\) die so bestimmte Funktion als die schwache Ableitung \(\partial^\alpha f\).
Die Definition ist sinnvoll, für jede klassisch \(k\)-fach differenzierbare Funktion stimmen klassische und schwache Ableitung überein. Auch dies ergibt sich direkt aus dem Fundamentallemma.
Wir beweisen das Fundamentallemma der Variationsrechnung. Dazu nutzen wir, dass stetige Funktionen in \(\mathrm L^1\) dicht sind. Für gegebenes \(g\in\mathrm L^1(\Omega)\) existiert also zu jedem \(\epsilon>0\) eine stetige Funktion \(h_\epsilon\in\mathrm L^1(\Omega)\cap \mathrm C(\Omega)\) mit \[\int_\Omega | g(x)-h_\epsilon(x) |{\,\mathrm d}x<\epsilon.\] Ein Beweis dieser Aussage verbleibt als Übungsaufgabe.
Beweis des Fundamental-Lemmas. Sei zuerst \(g\) als stetig vorausgesetzt. Ist dann \(g\ne0\), so existiert insbesondere ein \(x_0\in\Omega\) mit \(g(x_0)\ne0\). Wegen Stetigkeit existiert also eine kleine Umgebung um \(x_0\) mit \(|g(x)|\ge|g(x_0)|/2\) und \(|\arg g(x) - \arg g(x_0)|\le \pi/4\). Sei nun \(\varphi\in\mathrm C^\infty_{c}(\Omega)\) so gewählt, dass der Träger in dieser Umgebung enthalten ist, \(\varphi(x)\ge0\) und \(\int\varphi(x){\,\mathrm d}x=1\) gilt. Dann ist das betrachtete Integral gerade ein Mittel über die Funktionswerte in dieser Umgebung und damit folgt nach Konstruktion \[\left| \int g(x)\varphi(x) {\,\mathrm d}x \right| \ge \frac{\sqrt2} 4 |g(x_0)|\ne0.\]
Sei nun \(g\) allgemeiner eine lokal integrierbare Funktion, die nicht fast überall verschwindet. Wir wollen ein Teilgebiet \(\Omega'\subset\Omega\) als eigentliches Teilgebiet bezeichnen, wenn es eine kompakte Teilmenge \(K\subset\Omega\) mit \(\Omega'\subset K\) gibt. Damit existiert nach Voraussetzung ein eigentliches Teilgebiet \(\Omega' \subset\Omega\), so dass \[\int_{\Omega'} |g(x) |{\,\mathrm d}x \ne 0\] gilt. Wir können \(g\) mit Konstanten multiplizieren und deshalb oBdA annehmen, dass \[\int_{\Omega'} |g(x) |{\,\mathrm d}x = % \!\left\bracevert\!\Omega'\!\right\bracevert\!\!\] gilt. Zu jedem \(\epsilon>0\) finden wir nun eine stetige Funktion \(h_\epsilon(x)\) mit \[\int_{\Omega'} |g(x) - h_\epsilon(x) |{\,\mathrm d}x <\epsilon % \!\left\bracevert\!\Omega'\!\right\bracevert\!\!,\] nach Anwendung der umgekehrten Dreiecksungleichung folgt damit \[\int_{\Omega'} |h_\epsilon(x) |{\,\mathrm d}x > (1-\epsilon) % \!\left\bracevert\!\Omega'\!\right\bracevert\!\!,\] und es muss somit ein \(x_0\in \Omega'\) mit \(|h_\epsilon(x_0)|>(1-\epsilon)\) geben. Also finden wir nach obiger Argumentation auch eine Funktion \(\varphi\in\mathrm C^\infty_{c}(\Omega)\) mit Träger um \(x_0\), \(\varphi(x)\ge0\) und \(\int\varphi(x){\,\mathrm d}x=1\), so dass \[\left| \int_{\Omega'} h_\epsilon(x) \varphi(x) {\,\mathrm d}x \right| > \frac{\sqrt2}4(1-\epsilon).\] Also folgt nach Anwendung der umgekehrten Dreiecksungleichung und mit \(M=\max_x|\varphi(x)|\) \[\begin{aligned} \left| \int_{\Omega'} g(x) \varphi(x) {\,\mathrm d}x \right| &\ge \left| \int_{\Omega'} h_\epsilon(x) \varphi(x) {\,\mathrm d}x \right| - \int_{\Omega'} \varphi(x) |g(x) - h_\epsilon(x) |{\,\mathrm d}x \notag\\ & > \frac{\sqrt2}4(1-\epsilon) - M% \!\left\bracevert\!\Omega'\!\right\bracevert\!\!\epsilon.\end{aligned}\] Für \(\epsilon\) klein genug ist die rechte Seite positiv und damit die Kontraposition des Fundamentallemmas gezeigt. ◻
Wir wollen das Fundamentallemma anwenden um einige elementare Eigenschaften schwacher Ableitungen zu beweisen. Es gilt
Korollar 2.1.
Schwache Ableitungen sind, wenn sie existieren, fast überall eindeutig bestimmt.
Ist eine Funktion klassisch differenzierbar, so ist sie auch schwach differenzierbar und die Ableitungen stimmen fast überall überein.
Seien \(f,g\in \mathrm L^1_{loc}(\Omega)\) und \(\mu\in{\mathbb C}\). Dann gilt für alle \(\alpha\in\mathbb N_0^n\) \[\partial^\alpha (f+\mu g) = \partial^\alpha f + \mu \partial^\alpha g,\] vorausgesetzt zwei der drei schwachen Ableitungen existieren.
Angenommen \(f\) ist schwach differenzierbar bezüglich \(\partial^\alpha\) und \(\partial^\alpha f\) schwach differenzierbar bezüglich \(\partial^\beta\). Dann ist \(f\) schwach differenzierbar bezüglich \(\partial^{\alpha+\beta}\) und es gilt \[\partial^{\alpha+\beta}f = \partial^\beta(\partial^\alpha f).\]
Proof.
Folgt direkt aus der Definition.
Angenommen \(f\in \mathrm C^k(\Omega)\) und \(|\alpha|\le k\) ist ein gegebener Multiindex. Dann gilt für jedes \(\varphi\in\mathrm C^\infty_{c}(\Omega)\) mittels partieller Integration \[\begin{aligned} \int_\Omega f(x) \partial^\alpha \varphi(x) {\,\mathrm d}x = (-1)^{|\alpha|} \int_\Omega (\partial^\alpha f(x)) \,\varphi(x){\,\mathrm d}x, \end{aligned}\] und damit ist die klassische Ableitung \(\partial^\alpha f\) eine schwache Ableitung. Nach dem Fundamentallemma ist aber die schwache Ableitung fast überall eindeutig bestimmt.
Dies folgt wiederum direkt mit dem Fundamentallemma, \[\begin{aligned} \int_\Omega &\partial^\alpha(f(x)+\mu g(x) ) \varphi(x) {\,\mathrm d}x = (-1)^{|\alpha|} \int_\Omega (f(x)+\mu g(x) ) \partial^\alpha \varphi(x) {\,\mathrm d}x \notag\\ & =(-1)^{|\alpha|} \int_\Omega f(x)\partial^\alpha \varphi(x){\,\mathrm d}x + \mu (-1)^{|\alpha|}\int_\Omega g(x) \partial^\alpha\varphi(x){\,\mathrm d}x\notag\\ &= \int_\Omega ( \partial^\alpha f(x) ) \varphi(x){\,\mathrm d}x + \mu \int_\Omega ( \partial^\alpha g(x) ) \varphi(x){\,\mathrm d}x\notag\\ &= \int_\Omega (\partial^\alpha f(x) + \mu \partial^\alpha g(x) ) \varphi(x){\,\mathrm d}x.\end{aligned}\]
Analog impliziert \[\begin{aligned} \int_\Omega \partial^{\beta}(\partial^\alpha f) (x) \varphi(x){\,\mathrm d}x &= (-1)^\beta \int_\Omega \partial^\alpha f(x) \partial^\beta\varphi(x){\,\mathrm d}x\\ &= (-1)^{|\alpha|+|\beta|} \int_\Omega f(x) \partial^{\alpha+\beta}\varphi(x){\,\mathrm d}x \end{aligned}\] mit \(|\alpha+\beta|=|\alpha|+|\beta|\) die Behauptung.
◻
Beispiel 2.1. Auf \({\mathbb R}\) ist die Funktion \(f(x)=|x|\) nicht differenzierbar, aber sehr wohl schwach differenzierbar. Es gilt (wie leicht nachzurechnen ist) \[\partial f (x) = \mathop{\mathrm{sign}}x = \begin{cases} 1 , \qquad & x>0, \\-1 ,&x<0.\end{cases}\] Eine zweite schwache Ableitung existiert nicht. Auf \({\mathbb R}\setminus\{0\}\) gilt \(\partial^2f(x)=0\), allerdings ist die Nullfunktion keine zweite schwache Ableitung da für alle \(\varphi\in\mathrm C^\infty_{c}({\mathbb R})\) \[\int f(x) \varphi''(x){\,\mathrm d}x = - \int \mathop{\mathrm{sign}}x\; \varphi'(x){\,\mathrm d}x = 2\varphi(0)\] gilt und dies nicht immer verschwindet.
Beispiel 2.2. Die Existenz höherer schwacher Ableitungen sagt im Allgemeinen nichts über die die Existenz niederer Ableitungen aus. Ein einfaches Beispiel im \({\mathbb R}^2\) ist die Funktion \[f(x_1,x_2) = \mathop{\mathrm{sign}}x_1 + \mathop{\mathrm{sign}}x_2.\] Die Ableitungen \(\partial_{x_1}f\) und \(\partial_{x_2} f\) existieren beide nicht als schwache Ableitungen (siehe obiges Beispiel), trotz allem gilt \(\partial^{(1,1)} f = \partial_{x_1,x_2}^2 f = 0\), da für alle Testfunktionen \(\varphi\in\mathrm C^\infty_{c}({\mathbb R}^2)\) \[\begin{aligned} \iint &f(x_1,x_2) \partial^2_{x_1,x_2} \varphi(x_1,x_2){\,\mathrm d}x_1{\,\mathrm d}x_2 \notag\\ &= \int \mathop{\mathrm{sign}}x_1 \int \partial^2_{x_1,x_2} \varphi(x_1,x_2){\,\mathrm d}x_2{\,\mathrm d}x_1 + \int \mathop{\mathrm{sign}}x_2 \int \partial^2_{x_1,x_2} \varphi(x_1,x_2){\,\mathrm d}x_1{\,\mathrm d}x_2\notag\\ &= - 2\int \partial_{x_2} \varphi(0,x_2) {\,\mathrm d}x_2 -2 \int \partial_{x_1} \varphi(x_1,0){\,\mathrm d}x_1 = 0.\end{aligned}\]
Im folgenden benötigen wir noch ein weiteres Hilfsmittel, welches wie das Fundamentallemma aus der Dichtheit stetiger Funktionen in \(\mathrm L^p({\mathbb R}^n)\) folgt. Die analoge Aussage ist für \(p=\infty\) falsch. Warum?
Lemma 2.2 ( Stetigkeit im \(p\)-Mittel ). Sei \(f\in\mathrm L^p({\mathbb R}^n)\), \(1\le p<\infty\). Dann gilt \[\lim_{\rho\to0} \sup_{|y|\le \rho} \int |f(x+y)-f(x)|^p{\,\mathrm d}x = 0.\]
Proof. Wir zeigen das ganze für \(p=1\), der allgemeine Fall ist analog. Sei \(\epsilon>0\). Dann existiert eine stetige Funktion \(h_\epsilon\) mit kompaktem Träger in \(B_{R_\epsilon}(0)\), so dass \[\int |f(x)-h_\epsilon(x)|{\,\mathrm d}x \le \epsilon/3.\] Da \(h_\epsilon\) sogar gleichmäßig stetig ist, gilt \[\sup_x \sup_{|y|\le\rho} |h_\epsilon(x+y)-h_\epsilon(x)|\le \omega(\rho)\] mit \(\lim_{\rho\to0} \omega(\rho)=0\). Also gilt \[\lim_{\rho\to0} \sup_{|y|\le \rho} \int |h_\epsilon (x+y)-h_\epsilon (x)|{\,\mathrm d}x \le \lim_{\rho\to0} |B_{R_\epsilon+\rho}(0)| \omega(\rho) = 0.\] Man kann also \(\rho\) so klein wählen, dass \[\sup_{|y|\le \rho} \int |h_\epsilon (x+y)-h_\epsilon (x)|{\,\mathrm d}x \le \epsilon/3.\] Da ausserdem \[\int |f(x+y)-h_\epsilon(x+y)|{\,\mathrm d}x \le \epsilon/3\] gilt, folgt die Behauptung mit der Dreiecksungleichung. ◻
Schwache Ableitungen haben etwas mit der Approximierbarkeit durch glatte Funktionen zu tun. Dies soll im folgenden gezeigt werden. Für jedes eigentliche Teilgebiet \(\Omega'\) gilt die Ungleichung \(\mathrm{dist}(\Omega',\partial\Omega) > 0\).
Satz 2.1 ( Approximationssatz für schwache Ableitungen ). Angenommen, \(f\in\mathrm L^1_{loc}(\Omega)\) ist schwach differenzierbar bezüglich \(\partial^\alpha\). Dann existiert eine Folge \(f_k\in\mathrm C^\infty(\Omega)\) mit \(f_k\to f\) und \(\partial^\alpha f_k\to \partial^\alpha f\) in \(\mathrm L^1(\Omega')\) für jedes eigentliche Teilgebiet \(\Omega'\subset\Omega\).
Proof.
Sei \(\psi\in\mathrm C^\infty_{c}({\mathbb R}^n)\) mit Träger in \(B_1(0)\), \(\psi(x)>0\) und \(\int\psi(x){\,\mathrm d}x=1\). Weiter sei für \(\rho>0\) die Funktion \[\psi_\rho(x) = \rho^{-n} \psi(x/\rho)\] definiert. Weiter definieren wir für \(\mathrm{dist}(x,\partial\Omega)>\rho\) \[\tilde f_\rho(x) = \int_\Omega \psi_\rho(x-y) f(y){\,\mathrm d}y = \int_\Omega \psi_\rho(y) f(x-y){\,\mathrm d}y.\] Diese Funktion ist stetig, mit \(M_\rho=\max_y \psi_\rho(y)\) gilt \[\begin{aligned} | \tilde f_\rho(x) - \tilde f_\rho(x')| &\le \int_\Omega \psi_\rho(y) | f(x-y)-f(x'-y)|{\,\mathrm d}y \notag\\ & \le M_\rho \int_{|y|\le\rho} |f(x- y)-f(x'- y)|{\,\mathrm d}y \notag\\&\to 0 ,\qquad \qquad x'\to x,\end{aligned}\] als Konsequenz der Stetigkeit im Mittel. Die Funktion ist ebenso beliebig oft differenzierbar da die Ableitungen \[\partial^\beta \tilde f_\rho(x) = \int_\Omega \partial_x^\beta\psi_\rho(x-y) f(y){\,\mathrm d}y = (-1)^{|\beta|}\int_\Omega \partial_y^\beta\psi_\rho(x-y) f(y){\,\mathrm d}y\] mit gleicher Argumentation als stetig erkannt werden.
Sei weiter \(\chi_\rho\in\mathrm C^\infty(\Omega)\) mit Träger in \(\mathrm{dist(x,\partial\Omega)}>\rho\) und \(\chi_\rho(x)=1\) für \(\mathrm{dist(x,\partial\Omega)}>2\rho\). Dann ist \(f_\rho(x) = \chi_\rho(x)\tilde f_\rho(x)\) durch Null zu einer glatten Funktion auf \(\Omega\) fortsetzbar.
Wir zeigen, dass für jedes eigentliche Teilgebiet \(\Omega'\) \[% \left\|\left. f_\rho-f \,\right|\, \mathrm L^1(\Omega') \right\| \to 0\] für \(\rho\to0\) gilt. Für \(\rho\) klein genug, ist \(f_\rho\) durch obiges Integral definiert. Es ist also zu zeigen, dass \[\int_{\Omega'} \left| \int_\Omega \psi_\rho(y) f(x-y){\,\mathrm d}y - f(x) \right| {\,\mathrm d}x\] gegen Null strebt. Nutzt man \(\int \psi_\rho(y){\,\mathrm d}y=1\), so ist dies äquivalent zu \[\begin{aligned} \int_{\Omega'}& \left| \int_\Omega \psi_\rho(y) (f(x-y)-f(x)){\,\mathrm d}y \right| {\,\mathrm d}x \notag\\ & \le \int_{\Omega'} \int_{B_\rho(0)} \psi_\rho( y) | f(x- y)-f(x) | {\,\mathrm d}y{\,\mathrm d}x \notag\\ & \le M_\rho \sup_{|y|\le \rho} \int |f(x-y)-f(x)|{\,\mathrm d}x \to 0,\qquad \rho\to0,\end{aligned}\] unter Ausnutzung der Stetigkeit im Mittel.
In einem letzten Schritt zeigen wir die Konvergenz der Ableitungen. Da wir \(f\) als schwach differenzierbar vorausgesetzt haben, gilt \(g_\alpha=\partial^\alpha f\in\mathrm L^1_{loc}(\Omega)\). Weiterhin ist nach Definition der schwachen Ableitung und für \(x\in\Omega'\), \(\rho\) klein, \[\partial^\alpha f_\rho (x) = (-1)^{|\alpha|} \int_\Omega \partial_y^\alpha \psi_\rho(x-y) f(y){\,\mathrm d}y = \int_{\Omega} \psi_\rho(x-y) g_\alpha(y){\,\mathrm d}y.\] Damit kann man aber Schritt 2 des Beweises anwenden und die Behauptung folgt.
◻
Die genutzte Argumentation geht auf Kurt Otto Friedrichs zurück, nach ihm wird das Verfahren Funktionen durch Faltungen mit den \(\psi_\rho\) zu approximieren als Friedrichs-Glättung 8 bezeichnet.
Es gilt in gewissem Sinne die Umkehrung des gerade bewiesenen Satzes. Existiert zu gegebenem \(f\in\mathrm L^1_{loc}(\Omega)\) eine Folge \(f_k\in\mathrm C^\infty(\Omega)\), so dass in allen \(\mathrm L^1(\Omega')\) für eigentliche Teilgebieten \(\Omega'\subset\Omega\) die Folge \(f_k\) gegen \(f\) konvergiert und \(\partial^\alpha f_k\) Cauchyfolge ist, so ist \(f\) schwach differenzierbar und \(\partial^\alpha f\) der Grenzwert von \(\partial^\alpha f_k\).
Damit kann man nun Sobolevräume auf Gebieten definieren.
Definition 2.1. Sei \(1\le p\le \infty\) und \(k\in\mathbb N_0\). Wir definieren den Sobolev-Raum 9 \(\mathrm W^{k,p}(\Omega)\) als Menge aller \(k\)-fach schwach differenzierbaren Funktionen in \(\mathrm L^p(\Omega)\) mit schwachen Ableitungen in \(\mathrm L^p(\Omega)\), \[\mathrm W^{k,p}(\Omega) = \{ f\in\mathrm L^1_{loc}(\Omega) : \forall_{\alpha\in\mathbb N^n_0, |\alpha|\le k} \partial^\alpha f\in\mathrm L^p(\Omega) \},\] versehen mit der Norm \[% \left\|\left. f \,\right|\, \mathrm W^{k,p}(\Omega) \right\| = \bigg(\sum_{|\alpha|\le k} \|\partial^\alpha f\|_p^p\bigg)^{1/p}\] für \(p<\infty\) und entsprechend \[% \left\|\left. f \,\right|\, \mathrm W^{k,\infty}(\Omega) \right\| = \max_{|\alpha|\le k} \|\partial^\alpha f\|_\infty.\]
Die so definierten Räume sind Funktionenräume im Sinne der Einleitung, wobei man \(\mathrm L^1_{loc}(\Omega)\) als ‘Raum aller Funktionen’ verwenden kann. Die Einbettungen \(\mathrm W^{k,p}(\Omega)\hookrightarrow \mathrm L^p(\Omega) \hookrightarrow \mathrm L^1_{loc}(\Omega)\) sind alle stetig
Satz 2.2. Für jedes Gebiet \(\Omega\), alle \(1\le p\le\infty\) und alle \(k\in\mathbb N\) ist \(\mathrm W^{k,p}(\Omega)\) ein Banachraum. Für \(p=2\) handelt es sich um einen Hilbertraum mit Innenprodukt \[% \left( f,g \right)_{\mathrm W^{k,2}(\Omega)} = \sum_{|\alpha|\le k} \int_\Omega \partial^\alpha f(x) \overline{\partial^\alpha g(x)}{\,\mathrm d}x.\]
Proof. Die Normeigenschaften der angebenen Norm sind einfach nachzurechnen, zu zeigen wäre die Vollständigkeit. Sei dazu \(f_i\in\mathrm W^{k,p}(\Omega)\) eine Cauchyfolge. Dann sind \(\partial^\alpha f_i\) für \(|\alpha|\le k\) Cauchyfolgen in \(\mathrm L^p(\Omega)\) und wegen der Hölder-Abschätzung \[% \left\|\left. g \,\right|\, \mathrm L^1(\Omega') \right\| \le % \!\left\bracevert\!\Omega'\!\right\bracevert\!\!^{1/q}\; % \left\|\left. g \,\right|\, \mathrm L^p(\Omega) \right\| ,\qquad \frac1p+\frac1q=1,\] auch in jedem \(\mathrm L^1(\Omega')\), \(\Omega'\subset\Omega\) eigentlich. Damit ist aber \(f\) schwach differenzierbar bezüglich aller \(\partial^\alpha\), \(|\alpha|\le k\); für alle \(\varphi\in\mathrm C^\infty_{c}(\Omega')\) gilt \[\begin{aligned} \int f_i(x) \partial^\alpha \varphi(x) {\,\mathrm d}x &= (-1)^{|\alpha|} \int \partial^\alpha f_i(x) \varphi(x) {\,\mathrm d}x \notag\\ \downarrow \qquad\qquad & \quad\qquad\qquad \downarrow \notag\\ \int f(x) \partial^\alpha \varphi(x) {\,\mathrm d}x &=(-1)^{|\alpha|} \int \partial^\alpha f(x) \varphi(x) {\,\mathrm d}x.\notag\end{aligned}\] Da die \(\mathrm L^p(\Omega)\) vollständig sind liegt die Grenzfunktion in \(\mathrm W^{k,p}(\Omega)\).
Für \(p=2\) erzeugt das angegebene Skalarprodukt die Norm, es handelt sich also um einen Hilbertraum. ◻
Wir beschließen mit dem ersten Hauptsatz. Er liefert ein Approximationsresultat für Funktionen aus Sobolevräumen, welches wesentlich über das vorher bewiesene \(\mathrm L^1_{loc}\)-Resultat hinausgeht. Überraschend ist, dass man nichts über das Gebiet \(\Omega\) voraussetzen muss.
Satz 2.3 ( Approximationssatz von Meyers und Serrin 10). Sei \(1\le p<\infty\) und \(k\in\mathbb N\). Dann existiert zu jedem \(f\in\mathrm W^{k,p}(\Omega)\) eine Folge von Funktionen \(f_i\in\mathrm W^{k,p}(\Omega)\cap\mathrm C^\infty(\Omega)\) mit \[\lim_{i\to\infty} % \left\|\left. f-f_i \,\right|\, \mathrm W^{k,p}(\Omega) \right\| = 0.\]
Proof. Für \(i\in\mathbb N\) sei \[\Omega_i = \{ x\in\Omega : \mathrm{dist}(x,\partial\Omega)> 1/i,\quad |x|< i \}.\] Dann sind die \(\Omega_i\) offen und beschränkt und es gilt \(\bigcup_i\Omega_i=\Omega\). Weiterhin sei \(U_i=\Omega_{i+2}\cap(\overline{\Omega_{i-1}})^c\), \(\Omega_0=\Omega_{-1}=\varnothing\) eine Überdeckung von \(\Omega\) durch Streifen. Hilfsaussage: Damit existieren Abschneidefunktionen \(\chi_i\in\mathrm C^\infty_{c}(U_i)\) mit \(\chi_i\ge0\) und \(\sum_i \chi_i(x)=1\) in \(\Omega\).
Sei nun \(f\in\mathrm W^{k,p}(\Omega)\) gegeben. Dann hat \(\tilde f_i = \chi_if\in\mathrm W^{k,p}(\Omega)\) kompakten Träger in \(U_i\). Damit konvergiert aber \(\psi_{\rho}*\tilde f_i\) gegen \(\tilde f_i\) in \(\mathrm W^{k,p}(\Omega)\). Analog zum Beweis der \(\mathrm L^1_{loc}\)-Approximationseigenschaft schwacher Ableitungen ergibt sich \[\begin{aligned} & \psi_\rho*\partial^\alpha \tilde f_i(x) - \partial^\alpha \tilde f_i(x) = \int_\Omega \psi_\rho(y) (\partial^\alpha \tilde f_i (x-y) - \partial^\alpha \tilde f_i(x)) {\,\mathrm d}y,\\ & \| \psi_\rho*\partial^\alpha \tilde f_i(x) - \partial^\alpha \tilde f_i(x)\|_p \le\sup_{|y|\le \rho} \| \partial^\alpha \tilde f_i (x-y) - \partial^\alpha \tilde f_i(x) \|_p \to 0\end{aligned}\] als direkte Konsequenz der Stetigkeit im \(p\)-Mittel. Also existiert zu jedem \(\epsilon>0\) ein \(\rho_i\), so dass \[% \left\|\left. \psi_{\rho_i}*\tilde f_i - \tilde f_i \,\right|\, \mathrm W^{k,p}(\Omega) \right\| < 2^{-i}\epsilon .\] Betrachtet man nun die Funktion \[g(x) = \sum_{i=1}^\infty \psi_{\rho_i}*\tilde f_i (x),\] so gilt wegen der lokalen Endlichkeit der Summe \(g\in\mathrm C^\infty(\Omega)\) und nach Konstruktion und unter Ausnutzung von \(\sum_{i=1}^\infty \tilde f_i = f\) \[% \left\|\left. f-g \,\right|\, \mathrm W^{k,p}(\Omega) \right\| \le \sum_{i=1}^\infty % \left\|\left. \tilde f_i-\psi_{\rho_i}*\tilde f_i \,\right|\, \mathrm W^{k,p}(\Omega) \right\| \le \epsilon \sum_{i=1}^\infty 2^{-i} = \epsilon.\]
Beweis der Hilfsaussage. Zu jedem \(x\in U_i\) sei \(r_i(x) = \mathrm{dist}(x,\partial U_i)\). Dann bilden die Kugeln \(B_{x,i} = B_{r_i(x)}(x)\) eine Überdeckung von \(U_i\) (da alle \(x\) enthalten sind) und nach Vereinigung über alle \(i\) auch eine von \(\Omega\). Sei nun \[K_i = \overline{\Omega_{i+1}}\setminus\Omega_i.\] Dann ist \(K_i\) kompakt und \(\bigcup_i K_i=\Omega\). Aufgrund der Kompaktheit existiert eine endliche Teilüberdeckung der \(\{B_{x,j} : j\in\mathbb N, \;x\in U_j\}\), die schon \(K_i\) überdeckt. Vereinigt man alle so konstruierten endlichen Teilüberdeckungen für alle \(i\), so erhält man eine Folge \(B_{x_m,j_m}\) von Kugeln. Diese ist lokal endlich und überdeckt \(\Omega\). Sei nun \(\chi_{x_m,j_m}\in\mathrm C^\infty_{c}({\mathbb R}^n)\) mit Träger gleich \(B_{x_m,j_m}\) und \(\chi_{x_m,j_m}(x)>0\) für \(x\in B_{x_m,j_m}\). Dann ist \[\tau(x) = \sum_m \chi_{x_m,j_m}(x) > 0 ,\qquad \tau\in \mathrm C^\infty(\Omega)\] da die Summe lokal endlich und jeweils mindestens ein Summand positiv ist und \[\chi_i(x) = \frac1{\tau(x) }\sum_{m : j_m=i} \chi_{x_m,j_m}(x)\] erfüllt alle geforderten Eigenschaften. ◻
In Sobolevräumen gilt die Produktregel für schwache Ableitungen. Diese folgt direkt aus der Hölderschen Ungleichung in Verbindung mit dem soeben bewiesenen Approximationsresultat.
Korollar 2.2 ( Produktregel für schwache Ableitungen ). Sei \(f\in\mathrm W^{k,p}(\Omega)\) und \(g\in\mathrm W^{k,q}(\Omega)\). Dann ist das Produkt \(fg\in\mathrm W^{k,r}(\Omega)\) für \(0<\frac1r=\frac1p+\frac1q\le 1\) und es gilt für \(|\alpha|\le k\) \[\partial^\alpha (fg) = \sum_{\beta\le\alpha} \binom\alpha\beta (\partial^{\alpha-\beta} f )(\partial^\beta g)\] fast überall in \(\Omega\).
Proof. Wir unterscheiden zwei Fälle. Sei zuerst \(p,q<\infty\). Dann kann sowohl \(f\) als auch \(g\) durch eine Folge \(f_i,g_i\) von glatten Funktionen im entsprechenden Sobolevraum approximiert werden und die Formel gilt für alle Approximanten. Mit Hölder gilt darüberhinaus \[\begin{aligned} \| \partial^\alpha (f_ig_i)\|_r \le \sum_{\beta\le\alpha} \binom\alpha\beta \| \partial^{\alpha-\beta} f_i\|_p \|\partial^\beta g_i\|_q\end{aligned}\] und somit \[% \left\|\left. f_ig_i \,\right|\, \mathrm W^{k,r}(\Omega) \right\| \le C_{k,p,q,n} % \left\|\left. f_i \,\right|\, \mathrm W^{k,p}(\Omega) \right\| \; % \left\|\left. g_i \,\right|\, \mathrm W^{k,q}(\Omega) \right\| .\] Insbesondere konvergiert \(\partial^\alpha (f_ig_i)\) in \(\mathrm L^r(\Omega)\) für \(i\to\infty\) gegen \(\partial^\alpha (fg)\) und die Behauptung folgt.
Ist nun \(p<\infty\) und \(q=\infty\), so kann man diese Methode nicht nutzen und darf nur eine der Funktionen approximieren. Dies reicht, wir zeigen die Aussage nur für eine partielle Ableitung und verzichten auf das Induktionsargument zum Beweis der allgemeinen Produktformel. Sei dazu \(|\alpha|=1\) und \(f_i\) eine Folge glatter Funktionen die \(f\) in \(\mathrm W^{k,p}\) approximiert. Dann gilt für alle \(\varphi\in\mathrm C^\infty_{c}(\Omega)\) \[\begin{aligned} \int_\Omega \partial^{\alpha}(f_i g) (x) \varphi(x){\,\mathrm d}x &= - \int_\Omega f_i(x) g(x) \partial^\alpha\varphi(x){\,\mathrm d}x\notag\\ &= - \int_{\Omega} g(x) \big( \partial^\alpha(f_i \varphi)(x) - (\partial^\alpha f_i(x)) \varphi(x) \big) {\,\mathrm d}x\notag\\ & = \int_\Omega \big( f_i(x) \partial^\alpha g(x) + (\partial^\alpha f_i(x)) g(x)\big) \varphi(x) {\,\mathrm d}x\notag\end{aligned}\] und damit \(\partial^\alpha(f_i(x) g(x)) = (\partial^\alpha f_i(x))g(x) + f_i(x) \partial^\alpha g(x)\), \(|\alpha|=1\). Per Induktion folgt die allgemeine Produktformel und Grenzwertbildung für \(i\to\infty\) zeigt die gesuchte Aussage. ◻
Im folgenden soll der Spezialfall \(\Omega=\mathbb R^n\) betrachtet werden. Für diesen gilt eine einfacher zu beweisende und stärkere Approximationsaussage.
Satz 2.4. Die Menge \(\mathrm C^\infty_{c}({\mathbb R}^n)\) ist dicht in \(\mathrm W^{k,p}({\mathbb R}^n)\) für alle \(k\in\mathbb N\) und \(1\le p<\infty\).
Proof. Sei \(f\in\mathrm W^{k,p}({\mathbb R}^n)\). Wir definieren wiederum \[f_\rho(x) = \int_{{\mathbb R}^n} \psi_\rho(x-y) f(y){\,\mathrm d}y.\] Dann ist (in Analogie zum Beweis des Approximationssatzes auf Seite ) \(f_\rho \in \mathrm W^{k,p}({\mathbb R}^n)\cap\mathrm C^\infty({\mathbb R}^n)\) und es gilt \(f_\rho\to f\) in \(\mathrm W^{k,p}({\mathbb R}^n)\) für \(\rho\to0\).
Hat \(f\) kompakten Träger, so auch \(f_\rho\) und die Aussage folgt. Deshalb zeigen wir in einem zweiten Schritt, dass sich alle Funktionen aus \(\mathrm W^{k,p}({\mathbb R}^n)\) durch solche mit kompaktem Träger approximieren lassen. Sei dazu \(\chi_R(x) = \chi(x/R)\) mit \(\chi\in\mathrm C^\infty_{c}({\mathbb R}^n)\), \(\chi(x)=1\) für \(|x|\le 1\). Wir betrachten nun zu gegebenem \(f\in\mathrm W^{k,p}({\mathbb R}^n)\) die Funktionen \(f_{(R)}(x) = \chi_R(x) f(x)\). Dann gilt mit dem Satz über die majorisierte Konvergenz mit \(c|f(x)|^p\) als Majorante \[\lim_{R\to\infty} \| f - f_{(R)}\|_p^p = \lim_{R\to\infty} \int | (1-\chi_R(x)) f(x)|^p {\,\mathrm d}x = 0,\] entsprechend für die endlich vielen schwachen Ableitungen und unter Ausnutzung der Produktregel für schwache Ableitungen und der Minkowskiungleichung \[\begin{aligned} \lim_{R\to\infty} \| \partial^\alpha f - \partial^\alpha f_{(R)}\|_p \le& \lim_{R\to\infty}\left( \int | (1-\chi_R(x)) \partial^\alpha f(x)|^p {\,\mathrm d}x\right)^{1/p}\notag\\& + \sum_{\beta<\alpha} \binom \alpha\beta \lim_{R\to\infty}\left(\int | \partial^{\alpha-\beta} \chi_R(x) \partial^\beta f(x) |^p {\,\mathrm d}x\right)^{1/p} = 0, \end{aligned}\] wobei zur Berechnung des Limes der Satz über die majorisierte Konvergenz mit den Majoranten \(c|\partial^\beta f(x)|^p\) genutzt wurde. ◻
Insbesondere ist auch der Schwartzraum \(\mathscr S({\mathbb R}^n)\) dicht in \(\mathrm W^{k,p}({\mathbb R}^n)\) für alle \(k\) und \(1\le p<\infty\).
Im folgenden wollen wir den Satz von Plancherel ausnutzen, um den Raum \(\mathrm W^{k,2}({\mathbb R}^n)\) charakterisieren. Dazu benötigen wir vorerst eine Beschreibung schwacher Ableitungen.
Lemma 2.3. Sei \(f\in\mathrm W^{k,2}({\mathbb R}^n)\) und \(|\alpha|\le k\). Dann gilt für Fouriertransformierte der Ableitung \[\widehat{\partial^\alpha f} (\xi) = ({\mathrm i}\xi)^\alpha \widehat f(\xi).\]
Proof. Es genügt, die Aussage für \(f\in\mathscr S({\mathbb R}^n)\) zu zeigen und obiges Dichtheitsresultat zu nutzen.
Sei also \(f_i\in\mathscr S({\mathbb R}^n)\) eine Folge von Schwartzfunktionen die in \(\mathrm W^{k,2}({\mathbb R}^n)\) gegen \(f\) konvergiert. Dann gilt \[\begin{aligned} \widehat{\partial^\alpha f_i}(\xi) &= (2\pi)^{n/2} \int {\mathrm e}^{-{\mathrm i}x\xi} \partial^\alpha f_i(x) {\,\mathrm d}x\\ &= (-1)^{|\alpha|} (2\pi)^{n/2} \int (\partial_x^\alpha {\mathrm e}^{-{\mathrm i}x\xi}) f_i(x) {\,\mathrm d}x\\ & = ({\mathrm i}\xi)^\alpha \widehat f_i(\xi).\end{aligned}\] Mit Plancherel folgt nun \(\| f_i\|_2=\|\widehat f_i\|_2\) und \(\|\partial^\alpha f_i\|_2=\| ({\mathrm i}\xi)^\alpha \widehat f_i\|_2\) und somit \[\begin{aligned} \widehat {\partial^\alpha f} = \lim_{i\to\infty} \widehat{\partial^\alpha f_i} = \lim_{i\to\infty} ({\mathrm i}\xi)^\alpha \widehat f_i = ({\mathrm i}\xi)^\alpha \widehat f\end{aligned}\] mit Grenzwerten jeweils im \(\mathrm L^2({\mathbb R}^n)\). ◻
Insbesondere ist \(|\xi|^{|\alpha|}\widehat f(\xi)\) immer im \(\mathrm L^2({\mathbb R}^n)\) für \(f\in\mathrm W^{k,2}({\mathbb R}^n)\) und \(|\alpha|\le k\).
Satz 2.5 ( Fouriercharakterisierung ). Der Raum \(\mathrm W^{k,2}({\mathbb R}^n)\) besitzt die äquivalente Norm \[\|f\|_{2,k} = \left( \int_{{\mathbb R}^n} (1+|\xi|^2)^k |\widehat f(\xi)|^2{\,\mathrm d}\xi \right)^{1/2}.\]
Proof. Wegen Plancherel und obigem Lemma gilt \[\begin{aligned} % \left\|\left. f \,\right|\, \mathrm W^{k,2}({\mathbb R}^n) \right\| ^2 = \sum_{|\alpha|\le k}\int_{{\mathbb R}^n} |\xi^{\alpha} \widehat f(\xi)|^2{\,\mathrm d}\xi \end{aligned}\] und die Behauptung folgt direkt aus \[c(1+|\xi|^2)^k \le \sum_{|\alpha|\le k} |\xi^{\alpha}|^2 \le C (1+|\xi|^2)^k\] für geeignete Konstanten \(c,C>0\). ◻
Oft nutzt man die Bezeichnung \(\langle\xi\rangle = (1+|\xi|^2)^{1/2}\), um die Schreibweise noch etwas abzukürzen.
Der gerade bewiesene Satz impliziert ein Darstellungsresultat für Sobolevfunktionen aus \(\mathrm W^{k,2}({\mathbb R}^n)\). Mit der Dichtheit der Schwartz-Funktion \(\mathscr S({\mathbb R}^n)\) ergibt sich
Korollar 2.3. \(f\in\mathrm W^{k,2}({\mathbb R}^n)\) genau dann, wenn \(g(\xi) = \langle\xi\rangle^k \widehat f(\xi) \in\mathrm L^2({\mathbb R}^n)\).
Proof. Wenn \(f\in\mathrm W^{k,2}({\mathbb R}^n)\) ist, folgt aus dem vorigen Satz sofort \(g\in\mathrm L^2({\mathbb R}^n)\). Sei nun \(g_i\in\mathscr S({\mathbb R}^n)\) eine Folge von Schwartz-Funktionen, die gegen \(g\) in \(\mathrm L^2({\mathbb R}^n)\) konvergiert. Dann ist \(\widehat f_i(\xi)=\langle\xi\rangle^{-k}g_i(\xi)\) ebenso Schwartz (warum?) und \(f_i=\mathscr F^{-1}[\widehat f_i]\) eine Folge von Schwartz-Funktionen die nach obigem Satz in \(\mathrm W^{k,2}({\mathbb R}^n)\) konvergiert. Also gibt es ein zugehöriges \(f\) aus dem Sobolevraum. ◻
Ein solcher Satz ist praktisch um Aussagen über Sobolevfunktionen zu beweisen. Wir geben vorerst nur ein Beispiel einer solchen Aussage an, schwache Differenzierbarkeit impliziert Stetigkeit.
Korollar 2.4 ( Sobolevscher Einbettungssatz ). Sei \(k>\frac n2\). Dann ist jede Funktion \(f\in\mathrm W^{k,2}({\mathbb R}^n)\) stetig, strebt für \(|x|\to\infty\) gegen Null und erfüllt \[\| f\|_\infty \le C_{k,n} \|f\|_{2,k}\] mit einer Konstanten \(C_{k,n}\) die von \(k\) und \(n\) abhängt.
Proof. Wir nutzen die Notation aus vorigem Korollar. Es ist \(\widehat f(\xi) = \langle\xi\rangle^{-k}g(\xi)\) mit \(\|f\|_{2,k}=\|g\|_2\). Für \(k>\frac n2\) ist nun \(\langle \xi\rangle^{-k}\) eine \(\mathrm L^2\)-Funktion und mit \[C_{k,n} = (2\pi)^{-n/2} \| \langle\xi\rangle^{-k}\|_2 =(2\pi)^{-n/2} \left( \int_{{\mathbb R}^n} (1+|\xi|^2)^{-k} {\,\mathrm d}\xi\right)^{1/2}\] gilt somit als Konsequenz der Hölderschen Ungleichung \[\|f\|_\infty \le (2\pi)^{-n/2} \|\widehat f\|_1\le C_{k,n} \|g\|_2= C_{k,n}\|f\|_{2,k}.\] Stetigkeit und Abfallen der Funktion \(f\) ergibt sich nun direkt aus der Dichtheit von \(C^\infty_{c}({\mathbb R}^n)\) in \(\mathrm W^{2,k}({\mathbb R}^n)\). ◻
Wir wollen den Spezialfall \(p=2\) zum Anlass nehmen, eine allgemeinere Fouriercharakterisierung abzuleiten. Zum Beweis benötigen wir ein Resultat, auf welches wir in Kapitel 4 zurückkommen werden. Es ist tiefliegend und wird später bewiesen.
Satz 2.6 ( Hörmander–Mikhlin 11). Sei \(m(\xi)\in \mathrm C^r({\mathbb R}^n\setminus\{0\})\), \(r>\frac n2\), und gelte \[| \partial^\alpha m(\xi) | \le C |\xi|^{-|\alpha|}\] für \(|\alpha| < \left\lfloor\frac n2\right\rfloor+1\). Sei weiter \[T_m f(x) = (2\pi)^{-n} \iint {\mathrm e}^{{\mathrm i}(x-y)\xi} m(\xi) f(y) {\,\mathrm d}y {\,\mathrm d}\xi\] für Schwartz-Funktionen \(f\in\mathscr S({\mathbb R}^n)\) definiert. Dann gibt es für \(1<p<\infty\) eine Konstante \(C_{p,n}\) die von \(p\) und \(n\) abhängt, so dass \[\| T_m f \|_p \le C_{p,n} \| f\|_p\] gilt.
Die Aussage ist falsch für \(p=1\) und \(p=\infty\). Sie gilt schon nicht für \(p=1\) und \(m(\xi)=\mathop{\mathrm{sign}}(\xi)\) (die Hilberttransformation 12). Dieses Beispiel wird uns in Kapitel 3 noch einmal begegnen.
Speziell für \(m(\xi)=\langle\xi\rangle^{-k}\) bezeichnen wir den Operator \(T_m\) als \(\mathcal G_k\). Die Familie der \(\mathcal G_k\) wird als die der Bessel-Potential e13 bezeichnet. Sie erfüllen \(\mathcal G_{k+k'} = \mathcal G_k \circ \mathcal G_{k'}\). Weiterhin gilt für den Laplace-Operator \(\Delta=\sum_j \partial_j^2\) und alle Schwartzfunktionen \(f\) die Beziehung \((1-\Delta) \mathcal G_{2} f=f\).
Wir beweisen nun folgende Charakterisierung.
Satz 2.7 ( Calderon 14). Sei \(1<p < \infty\). Dann gilt \(f\in\mathrm W^{k,p}({\mathbb R}^n)\) genau dann, wenn \(f= \mathcal G_k g\) für ein \(g\in\mathrm L^p({\mathbb R}^n)\) gilt. Das \(g\) ist eindeutig bestimmt und durch \(\|f\|_{p,k} := \|g\|_p\) wird eine äquivalente Norm auf \(\mathrm W^{k,p}({\mathbb R}^n)\) definiert.
Proof. Sei \(g\in\mathrm L^p({\mathbb R}^n)\) gegeben, wir zeigen dass \(\mathcal G_k g\) zum Sobolevraum \(\mathrm W^{k,p}({\mathbb R}^n)\) gehört. Sei dazu \(g_i\) eine Folge von Schwartz-Funktionen die in \(\mathrm L^p\) gegen \(g\) konvergiert und sei weiter \(|\alpha|\le k\). Dann gilt \[\partial^\alpha \mathcal G_k g_i (x) = \mathscr F^{-1}_{\xi\to x} [ ({\mathrm i}\xi)^\alpha \langle\xi\rangle^{-k} \widehat g_i(\xi)]\] und \(m_\alpha(\xi) = ({\mathrm i}\xi)^\alpha \langle\xi\rangle^{-k}\) erfüllt für \(|\alpha|\le k\) die Voraussetzungen des Multiplikatorensatzes von Hörmander–Mikhlin. Also gibt es eine Konstante \(C\) mit \[\| \partial^\alpha \mathcal G_k g_i \|_p \le C \| g_i\|_p,\qquad |\alpha|\le k\] und somit auch \(% \left\|\left. \mathcal G_k g_i \,\right|\, \mathrm W^{k,p}({\mathbb R}^n) \right\| \le C' \|g_i\|_p\). Also konvergiert \(\mathcal G_k g_i\) gegen eine Sobolevfunktion \(f\in\mathrm W^{k,p}({\mathbb R}^n)\).
Sei nun \(f\in\mathrm W^{k,p}({\mathbb R}^n)\). Wir approximieren \(f\) durch eine Folge \(f_i\) von Schwartzfunktionen in der \(\mathrm W^{k,p}({\mathbb R}^n)\)-Norm und wählen \(g_i\in\mathscr S({\mathbb R}^n)\), so dass \[\widehat g_i(\xi) = \langle \xi\rangle^{k} \widehat f_i(\xi).\] Wir müssen zeigen, dass \(g_i\) in \(\mathrm L^p({\mathbb R}^n)\) konvergiert, also insbesondere die \(\mathrm L^p\)-Norm von \(g_i\) durch die Sobolevnorm der \(f_i\) abgeschätzt werden werden kann. Dazu nutzen wir \[m(\xi)= \langle\xi\rangle^{-k} \bigg( 1+ {\mathrm i}\sum_{|\alpha|=k} \xi^\alpha \bigg) \le C\] und stellen als erstes fest, dass \(m(\xi)\) keine Nullstellen besitzt und \(m(\xi)\) sowie seine Inverse \(\frac1{m(\xi)}\) die Voraussetzungen des Multiplikatorensatzes erfüllen. Also folgt \[\begin{aligned} \| T_{\frac1m} T_m g_i \|_p &\le \tilde C \|T_m g_i\|_p = \tilde C \bigg\| f_i + {\mathrm i}^{1-k} \sum_{|\alpha|=k} \partial^\alpha f_i\bigg\|_p\notag\\& \le \tilde C' % \left\|\left. f_i \,\right|\, \mathrm W^{k,p}({\mathbb R}^n) \right\| .\end{aligned}\] Somit konvergiert \(g_i\) und liefert die gesuchte \(\mathrm L^p\)-Funktion.
Die obige Rechnung liefert insbesondere die Äquivalenz der Normen, beide dazu benötigte Abschätzungen wurden bewiesen. ◻
Die Voraussetzung \(1<p<\infty\) des Satzes ist notwendig. Die entsprechenden Aussagen sind sowohl für \(p=1\) als auch für \(p=\infty\) falsch.
Wir nutzen die soeben gegebene Charakterisierung, um Sobolevräume \(\mathrm W^{k,p}({\mathbb R}^n)\) für \(k>0\) reell und \(1<p<\infty\) zu definieren. Für \(p=1\) beziehungsweise für \(p=\infty\) definieren wir keine Sobolevräume mit nichtganzzahligen Exponenten.
Wir können sogar noch allgemeiner vorgehen, und Sobolevräume mit negativer Glattheit durch \[\mathrm W^{s,p}({\mathbb R}^n) = \{ f\in \mathscr S'({\mathbb R}^n) : \exists_{g\in\mathrm L^p({\mathbb R}^n)} \langle\xi\rangle^s \widehat f(\xi) = \widehat g(\xi) \}\] für \(1<p<\infty\) und \(s\in{\mathbb R}\) definieren. Für diese ist \(\mathscr S({\mathbb R}^n)\) jeweils dichte Teilmenge und die Norm für Schwartzfunktionen \(f\in\mathscr S({\mathbb R}^n)\) durch \[\begin{aligned} &\|f\|_{p,s} = \| g\|_p = % \left\|\left. \langle\xi\rangle^s \widehat f \,\right|\, \mathscr F\mathrm L^p({\mathbb R}^n) \right\| ,\\ &% \left\|\left. f \,\right|\, \mathscr F \mathrm L^p({\mathbb R}^n) \right\| = % \left\|\left. \mathscr F f \,\right|\, \mathrm L^p({\mathbb R}^n) \right\| ,\end{aligned}\] gegeben. Alle so definierten Räume sind Funktionenräume in unserem Sinne.
Der Operator \(\mathcal G_k\) kann als Faltung geschrieben werden. Es existiert also eine Funktion \(G_k\), so dass \(\mathcal G_k f = G_k*f\) gilt. Im folgenden kann ausgenutzt werden, dass die Funktion \(G_k\) explizit angegeben werden kann. Wir verzichten auf das explizite und beweisen die wichtigen Eigenschaften direkt.
Lemma 2.4 ( Eigenschaften der Besselpotentiale ). Sei \(k>0\) beliebig reell. Dann existiert eine Funktion \(G_k\in\mathrm L^1({\mathbb R}^n)\) mit \(\widehat{G_k}(\xi) = (2\pi)^{-n/2} \langle\xi\rangle^{-k}\). Die Funktion \(G_k\) erfüllt
\(G_k\in\mathrm C^\infty({\mathbb R}^n\setminus\{0\})\) und \(G_k\) ist rotationssymmetrisch.
\(G_k(x)\le C_N |x|^{-N}\) für \(|x|\ge 1\) und alle \(N\).
Für \(k>n\) ist \(G_k(x)\) stetig.
Für \(k< n\) gilt \[G_k(x) \sim \gamma_{k,n} |x|^{k-n}\qquad \text{f\"ur $|x|\to 0$}.\]
Für \(k=n\) gilt \[G_n(x) \sim \tilde \gamma_n \log|x| \qquad \text{f\"ur $|x|\to 0$}.\]
Proof. Wir konstruieren nicht \(G_k\) direkt, sondern regularisieren \(G_k\) durch Faltung und berechnen die regularisierten Funktionen. Dies führt auf \[\label{eq:Gk-def} G_k(x) = \lim_{\epsilon\to0}\; (2\pi)^{-n} \int {\mathrm e}^{{\mathrm i}x\cdot\xi} \langle\xi\rangle^{-k} \chi(\epsilon\xi){\,\mathrm d}\xi\] mit \(\chi\in\mathrm C^\infty_{c}({\mathbb R}^n)\), \(\chi(\xi)=1\) für \(|\xi|\le 1/2\). Wir zeigen, dass der Grenzwert punktweise für \(x\ne0\) existiert und die erhaltene Funktion alle Eigenschaften erfüllt. Aus \(G_k\in\mathrm L^1({\mathbb R}^n)\) folgt die Aussage über die Fouriertransformierte. Mit \(\tilde \chi = \mathscr F^{-1}\chi\) und \(\tilde\chi_\epsilon(x) = \epsilon^{-n}\tilde\chi(x/\epsilon)\) gilt \[\widehat{G_k} (\xi) = \lim_{\epsilon\to0} \widehat {G_k *\tilde\chi_\epsilon}(\xi) = \lim_{\epsilon\to 0} \langle\xi\rangle^{-k} \chi(\epsilon\xi) = \langle\xi\rangle^{-k}\] unter Ausnutzung der \(\mathrm L^1\to\mathrm L^\infty\) Stetigkeit der Fouriertransformation und der Fourierschen Inversionsformel.
Integrale der obigen Bauart werden als oszillierende Integrale bezeichnet. Die nachfolgenden Rechnungen sind typisch zum Behandeln solcher Ausdrücke. Für alle \(\epsilon>0\) und \(x\ne0\) kann man partiell integrieren und erhält wegen \[\Delta_\xi {\mathrm e}^{{\mathrm i}x\xi} = - |x|^2 {\mathrm e}^{{\mathrm i}x\cdot \xi}\] für alle \(\ell\in\mathbb N_0\) \[\begin{aligned} \int &{\mathrm e}^{{\mathrm i}x\cdot\xi} \langle\xi\rangle^{-k} \chi(\epsilon\xi){\,\mathrm d}\xi= |x|^{-2\ell} \int \big( (-\Delta_\xi)^\ell {\mathrm e}^{{\mathrm i}x\cdot\xi} \big)\langle\xi\rangle^{-k} \chi(\epsilon\xi){\,\mathrm d}\xi \notag\\ & =| x|^{-2\ell} \int {\mathrm e}^{{\mathrm i}x\cdot\xi} \big( (- \Delta_\xi)^\ell\langle\xi\rangle^{-k} \chi(\epsilon\xi) \big) {\,\mathrm d}\xi.\end{aligned}\] Der letzte Integrand kann durch \[\big| \Delta_\xi^\ell\langle\xi\rangle^{-k} \chi(\epsilon\xi) \big|\le C_\ell \langle\xi\rangle^{-k-2\ell}\] abgeschätzt werden. Für \(k+2\ell > n\) liefert dies eine integrierbare Majorante und erlaubt die Berechnung des Grenzwertes für \(\epsilon\to0\) mittels majorisierter Konvergenz. Insbesondere ergibt sich direkt die Abschätzung 2. Für \(\ell\) groß genug können Ableitung nach \(x\) und Integration vertauscht werden, woraus sich direkt 1 ergibt. Aussage 3 kennen wir schon.
Für Aussagen 4 und 5 benötigen wir eine genauere Analyse. Wir schreiben \(\langle\xi\rangle^{-k}\) als Summe \[|\xi|^{-k} + c_1 |\xi|^{-k-1} + \cdots \quad(\quad +c_{n-k}(1-\chi(\xi)) |\xi|^{-n}\quad)\quad + \mathcal O(|\xi|^{-n-1}).\] Das Restglied gehört zu \(\mathrm L^1({\mathbb R}^n)\), alle zu \(\mathrm L^1_{loc}({\mathbb R}^n)\). Das Restglied liefert somit direkt eine stetige Funktion nach Fouriertransformation. Die vorherigen sind zu berechnen. Nun gilt für \[I_k(x) = \lim_{\epsilon\to0}\; (2\pi)^{-n} \int {\mathrm e}^{{\mathrm i}x\cdot\xi} |\xi|^{-k} \chi(\epsilon\xi) {\,\mathrm d}\xi\] offenbar \[\begin{aligned} I_k(\delta x) &= \lim_{\epsilon\to0}\; (2\pi)^{-n} \int {\mathrm e}^{{\mathrm i}\delta x \cdot\xi} |\xi|^{-k} \chi(\epsilon\xi){\,\mathrm d}\xi \notag\\ &=\delta^{k-n}\lim_{\epsilon\to0}\; (2\pi)^{-n} \int {\mathrm e}^{{\mathrm i}x \cdot\xi} |\xi|^{-k} \chi(\epsilon \xi ){\,\mathrm d}\xi \notag\\ & = \delta^{k-n} I_k(x) \end{aligned}\] vermittels der Substitution \(\xi \to \delta\xi\), was zusammen mit der offensichtlichen Rotationssymmetrie auf \[I_k(x) = \gamma_{k,n} |x|^{k-n}\] führt. Die anderen Terme (bis eventuell auf den vorletzten) sind analog. Es bleibt also \[\tilde I_n(x) = \lim_{\epsilon\to0}\; (2\pi)^{-n} \int (1-\chi(\xi)) {\mathrm e}^{{\mathrm i}x\cdot\xi} |\xi|^{-n} \chi(\epsilon\xi) {\,\mathrm d}\xi\] zu betrachten. Hier gilt entsprechend \[\begin{aligned} \tilde I_n(\delta x) &= \lim_{\epsilon\to0}\; (2\pi)^{-n} \int (1-\chi(\xi/\delta)) {\mathrm e}^{{\mathrm i}x\cdot\xi} |\xi|^{-n} \chi(\epsilon\xi) {\,\mathrm d}\xi\notag\\ &= \tilde I_n(x) + \lim_{\epsilon\to0}\; (2\pi)^{-n} \int (\chi(\xi)-\chi(\xi/\delta)) {\mathrm e}^{{\mathrm i}x\cdot\xi} |\xi|^{-n} \chi(\epsilon\delta^{-1}\xi) {\,\mathrm d}\xi\\ &= \tilde I_n(x) + (2\pi)^{-n} \int (\chi(\xi)-\chi(\xi/\delta)) {\mathrm e}^{{\mathrm i}x\cdot\xi} |\xi|^{-n} {\,\mathrm d}\xi.\end{aligned}\] Für \(x\to0\) strebt das verbleibende Integral gegen eine Konstante \(\tilde \gamma_n \log \delta + d\). Wir wissen also für kleine \(x\) \[\tilde I_n(\delta x) = \tilde I_n(x) + \tilde \gamma_n \log \delta + d + o(1),\] was zusammen mit der Rotationssymmetrie auf \[\tilde I_n(x) \sim \tilde\gamma_n \log|x|\] führt. ◻
Korollar 2.5. Es gilt \(G_k\in\mathrm L^p({\mathbb R}^n)\) genau dann, wenn \(k>n-\frac np\) gilt.
Wir kommen zu einem weiteren Hauptresultat, dem Sobolevschen Einbettungssatz. Die Fälle mit \(p=1\) benötigen eine leichte Modifikation, da wir für diese nur Räume ganzzahliger Glattheitsordnung definiert haben. Wir beginnen mit den einfachen Fällen, diese ergeben sich direkt aus der Faltungsdarstellung von Sobolev-Funktionen
Korollar 2.6 ( Sobolevscher Einbettungssatz ). Sei \(1<p<\infty\) und \(k>0\).
Sei \(k p \le n\) und \(p\le q < \frac{np}{n-pk}\). Dann gilt \(\mathrm W^{k,p}({\mathbb R}^n) \subset \mathrm L^q({\mathbb R}^n)\).
Sei \(kp > n\). Dann gilt \(\mathrm W^{k,p}({\mathbb R}^n) \subset \mathrm L^\infty({\mathbb R}^n)\cap \mathrm C({\mathbb R}^n)\).
Proof. Beide Aussagen folgen direkt aus \(G_k\in\mathrm L^p({\mathbb R}^n)\) für \(k>n-\frac np\) verbunden mit der Youngschen Ungleichung für Faltungen15 \[\| f*g\|_r \le \|f\|_p \|g\|_q \qquad\qquad \frac 1r = \frac1p+\frac1q-1.\] Ist \(kp<n\), so ist \(k<n\) und \(G_k\in\mathrm L^r({\mathbb R}^n)\) für \(r< \frac{n}{n-k}\). Mit Youngscher Ungleichung folgt daraus aber für jedes \(f=G_k*g\in\mathrm W^{k,p}({\mathbb R}^n)\) die Abschätzung \[\begin{gathered} \|f\|_q\le \|g\|_p \|G_k\|_r = \|f\|_{p,k} \|G_k\|_r,\\ \frac1q = \frac1p+\frac1r -1 > \frac1p + \frac{n-k}n - 1= \frac{n-kp}{np}.\end{gathered}\] Für \(kp>n\) ist \(G_k\in\mathrm L^q({\mathbb R}^n)\) mit \(\frac1p+\frac1q=1\) und somit gilt für jedes \(f=G_k *g \in\mathrm W^{k,p}({\mathbb R}^n)\) sofort \(\|f\|_\infty \le \|g\|_p \|G_k\|_q = \|f\|_{p,k}\|G_k\|_q\) und die Dichtheit der \(\mathrm C^\infty_{c}\)-Funktionen impliziert Stetigkeit und Abfallen von \(f\).
Beweis der Hilfsaussage: ( Young-Ungleichung ) Wir beschränken uns auf den Fall \(r<\infty\), der Fall \(r=\infty\) war Übungsaufgabe. Sei also \(f\in\mathrm L^p({\mathbb R}^n)\) und \(g\in\mathrm L^q({\mathbb R}^n)\) und \(r\) wie oben. Dann gilt wegen \(\frac{r-p}{r}+\frac pr = 1 = \frac{r-p}{pr} + \frac1r + \frac{r-q}{qr}\) unter mehrfacher Ausnutzung der Hölderschen Ungleichung \[\begin{aligned} \int &| f(x-y) g(y) |{\,\mathrm d}y = \int | f(x-y)|^{\frac{r-p}r} |f(x-y)|^{\frac pr} |g(y)|^{\frac qr} |g(y)|^{\frac{r-q}r} {\,\mathrm d}y\\ &= \left(\int |f(x-y)|^p{\,\mathrm d}y\right)^{\frac{r-p}{rp}} \left( \int |f(x-y)|^p |g(y)|^q{\,\mathrm d}y\right)^{\frac1r} \left(\int |g(y)|^q{\,\mathrm d}y\right)^{\frac{r-q}{rq}}\\\end{aligned}\] und damit \[\begin{aligned} \int\left( \int | f(x-y) g(y) |{\,\mathrm d}y \right)^r{\,\mathrm d}x& \le \|f\|_p^{r-p} \|g\|_q^{r-q} \int \int |f(x-y)|^p |g(y)|^q{\,\mathrm d}y {\,\mathrm d}x \\ & = \|f\|_p^{r-p} \|g\|_q^{r-q} \|f\|_p^p \|g\|_q^q = \|f\|_p^r\|g\|_q^r.\end{aligned}\] ◻
Es verbleiben die scharfen Grenzfälle. Diese bilden den eigentlichen Sobolevschen Einbettungssatz. Wir zeigen hier eine einfachere Fassung, zu einer Funktion \(f\in\mathrm L^1_{loc}({\mathbb R}^n)\) definieren wir die Verteilungsfunktion
\[\mu_f(\lambda) = % \!\left\bracevert\!\{ x\in{\mathbb R}^n : |f(x)|>\lambda \}\!\right\bracevert\!\!.\] als Maß der Menge großer Funktionswerte. Offenbar gilt dann \[\| f\|_1 = \int_0^\infty \mu_f(\lambda){\,\mathrm d}\lambda\] und entsprechend mit einer Substitution für \(1\le p<\infty\). \[\label{eq:2.2.42} \| f\|_p^p =\int_0^\infty \mu_f(\lambda^{1/p}){\,\mathrm d}\lambda = p \int_0^\infty \lambda^p \mu_f(\lambda) \frac{{\,\mathrm d}\lambda}\lambda.\] Man kann auch aus der \(p\)-Norm die Verteilungsfunktion abschätzen. Es gilt \[\label{eq:2.2.43} \|f\|_p^p = \int |f(x)|^p {\,\mathrm d}x \ge \int_{\{|f(x)|>\lambda\}} |f(x)|^p {\,\mathrm d}x \ge \lambda^p \mu_f(\lambda),\] also insbesondere \(\mu_f(\lambda) \le \lambda^{-p}\|f\|_p^p\). Dies kann man leicht abschwächen. Wir sagen, eine Funktion sei schwach \(\mathrm L^p\), falls \[\label{eq:weakLP} [f]_{p,\infty}^p = \sup_{\lambda>0} \lambda^p \mu_f(\lambda) <\infty\] gilt. Im folgenden bezeichne \(\mathrm L^{p,\infty}({\mathbb R}^n)\) die Menge der schwachen \(\mathrm L^p\)-Funktionen.
Achtung: Die linke Seite in [eq:weakLP] definiert keine Norm auf dieser Menge. Es gilt allerdings \([f+g]_{p,\infty}\le 2([f]_{p,\infty}+[g]_{p,\infty})\). Schwache \(\mathrm L^p\)-Räume sind Spezialfälle sogenannter Lorentz-Räume 16 \(\mathrm L^{p,q}({\mathbb R}^n)\) definiert durch die Bedingungen \[_{p,q} = \left( \int_0^\infty \lambda^{q} \mu_f(\lambda)^{q/p} \frac{{\,\mathrm d}\lambda}\lambda \right)^{1/q} < \infty.\] In dieser Notation gilt \(\mathrm L^{p}({\mathbb R}^n)=\mathrm L^{p,p}({\mathbb R}^n)\).
Satz 2.8 ( Sobolevscher Einbettungssatz ). Sei \(1<p<\infty\) und \(k>0\) mit \(kp<n\). Dann gilt \(\mathrm W^{k,p}({\mathbb R}^n) \subset \mathrm L^{p^*,\infty}({\mathbb R}^n)\) für \(p^*=\frac{np}{n-pk}\).
Proof. Sei \(f\in\mathrm W^{k,p}({\mathbb R}^n)\). Dann gilt \(f=G_k*g\) für ein \(g\in\mathrm L^p({\mathbb R}^n)\). Sei \(r>0\) ein noch zu wählender Parameter. Dann gilt wegen der Rotationssymmetrie von \(G_k\) und dessen bekannten Abschätzungen mit \(p'\) dual zu \(p\) für \(r<1\) \[\begin{aligned} \int_{|y|>r} G_k(y) |g(x-y)| {\,\mathrm d}y &\le C \|g\|_p \left(\int_r^\infty G_k(\rho)^{p'} \rho^{n-1} {\,\mathrm d}\rho \right)^{1/p'}\notag\\ &\le C' \|g\|_p \left(\int_r^2 \rho^{\frac{(k-n)p}{p-1}} \rho^{n-1} {\,\mathrm d}\rho \right)^{\frac{p-1}p}\notag\\ &\le C'' \| g\|_p r^{k-n/p}.\end{aligned}\] Wir wählen \(r\) in Abhängigkeit von \(\lambda\) so, dass die letzte Zeile \(=\lambda/2\) gilt. Damit impliziert aber \[\begin{aligned} \lambda < |f(x)| \le \int_{|y|>r} G_k(y) |g(x-y)| {\,\mathrm d}y + \int_{|y|<r} G_k(y) |g(x-y)| {\,\mathrm d}y \end{aligned}\] schon \[f_r(x) = \int_{|y|<r} G_k(y) |g(x-y)| {\,\mathrm d}y > \frac\lambda2\] und wir erhalten wegen \[\|G_k1_{B_r}\|_1 \le C \int_0^r \rho^{k-n+n-1}{\,\mathrm d}\rho \le C' r^k\] somit die Behauptung \[\begin{aligned} \mu_f(\lambda) &\le \mu_{f_r}(\lambda/2) \le C (\lambda/2)^{-p} \| f_r \|_p^p \notag\\ & \le C' (\lambda/2)^{-p} \|G_k1_{B_r}\|_1^p \| g \|_p^p \notag\\ & \le C'' \lambda^{-p} r^{kp} \|g\|_p^p\notag\\& \le C''' \lambda^{-\frac{np}{n-kp}} \|g\|_p^p\end{aligned}\] ◻
Mit dem Interpolationssatz von Marcinkiewicz (siehe Kapitel 4) ergibt sich daraus sogar \(\mathrm W^{k,p}({\mathbb R}^n) \subset \mathrm L^{p^*}({\mathbb R}^n)\), diese Aussage werden wir später noch beweisen.
Nun wollen wir zu Räumen auf Gebieten zurückkehren. Die erste Aussage betrifft eine Form der Gebietsmonotonie , es gilt für \(\Omega'\subset\Omega\) \[\mathrm W^{k,p}(\Omega) \subset \mathrm W^{k,p}(\Omega')\] das heißt, \[% \left\|\left. f \,\right|\, \mathrm W^{k,p}(\Omega') \right\| \le % \left\|\left. f \,\right|\, \mathrm W^{k,p}(\Omega) \right\|\] für alle \(f\in\mathrm L^1_{loc}(\Omega)\).
Ist \(\Omega'\subset\Omega\) eigentliches Teilgebiet (also präkompakt als Teilmenge von \(\Omega\)), so gilt sogar etwas mehr.
Satz 2.9 ( Lokaler Einbettungssatz ). Sei \(1<p<\infty\) und \(k\in\mathbb N\). Sei weiter \(\Omega'\subset\Omega\) eigentlich. Dann gelten die folgenden Einbettungsrelationen zusammen mit entsprechenden Normabschätzungen.
\(\mathrm W^{k,p}(\Omega)\subset \mathrm W^{\ell,q}(\Omega')\) für alle \(1\le q\le p\) und \(\ell\le k\).
\(\mathrm W^{k,p}(\Omega)\subset \mathrm L^q(\Omega')\) falls \(p\le q<p^*= np/(n-kp)\) und \(kp\le n\).
\(\mathrm W^{k,p}(\Omega)\subset \mathrm C_b(\Omega')\) für \(kp>n\).
Insbesondere sind alle Funktionen aus \(\mathrm W^{k,p}(\Omega)\) mit \(kp>n\) stetig.
Proof. Die erste Aussage folgt direkt mit Hölder, es gilt \[% \left\|\left. \partial^\alpha f \,\right|\, \mathrm L^q(\Omega') \right\| \le% \!\left\bracevert\!\Omega'\!\right\bracevert\!\!^{\frac1q-\frac1p}\;% \left\|\left. \partial^\alpha f \,\right|\, \mathrm L^p(\Omega) \right\|\] für \(f\in\mathrm W^{k,p}(\Omega)\) und \(|\alpha|\le k\). Für die beiden verbleibenden Aussagen sei \(\chi\in\mathrm C^\infty_{c}(\Omega)\) mit \(\chi(x)=1\) für alle \(x\in\Omega'\) gewählt. Dann ist \(\chi f\in\mathrm W^{k,p}(\Omega)\) mit \(\chi f(x)=f(x)\) in \(\Omega'\) und es gilt (trivial mit Null ausserhalb \(\Omega\) fortgesetzt) \(\chi f\in\mathrm W^{k,p}({\mathbb R}^n)\). Damit ist aber der Sobolevsche Einbettungssatz anwendbar und liefert \[\begin{aligned} % \left\|\left. f \,\right|\, \mathrm L^q(\Omega') \right\| &\le \|\chi f\|_q \le C_{p,k,n} \|\chi f\|_{p,k}\notag\\ &\le C_{p,k,n}' % \left\|\left. \chi f \,\right|\, \mathrm W^{k,p}(\Omega) \right\| \le C_{p,k,n}'' % \left\|\left. f \,\right|\, \mathrm W^{k,p}(\Omega) \right\| \end{aligned}\] für \(kp\le n\) und entsprechend \[\begin{aligned} % \left\|\left. f \,\right|\, \mathrm L^\infty(\Omega') \right\| \le C_{p,k,n}'' % \left\|\left. f \,\right|\, \mathrm W^{k,p}(\Omega) \right\| \end{aligned}\] für \(kp>n\). ◻
Ist das Gebiet \(\Omega\) beschränkt, so gilt die erste Aussage auch für das gesamte Gebiet.
Lemma 2.5. Sei \(\Omega\) beschränkt. Dann gilt \(\mathrm W^{k,p}(\Omega)\subset \mathrm W^{\ell,q}(\Omega)\) für \(1\le q\le p\) und \(\ell\le k\).
Globale Einbettungen (in Räume auf dem Gebiet \(\Omega\)) benötigen stärkere Voraussetzungen an das Gebiet. Allerdings kann man einfache globale Aussagen auf einem Teilraum des \(\mathrm W^{k,p}(\Omega)\) erzielen. Dazu definieren wir \[\mathrm W^{k,p}_0(\Omega) = \overline{\mathrm C^\infty_{c}(\Omega)}^{\mathrm W^{k,p}(\Omega)}\] als den Abschluß der \(\mathrm C^\infty_{c}(\Omega)\) Funktionen im \(\mathrm W^{k,p}(\Omega)\). Da für \(f\in\mathrm C^\infty_{c}(\Omega)\) offenbar \(% \left\|\left. f \,\right|\, \mathrm W^{k,p}(\Omega) \right\| =% \left\|\left. f \,\right|\, \mathrm W^{k,p}({\mathbb R}^n) \right\|\) gilt, ist jede Funktion aus \(\mathrm W^{k,p}_0(\Omega)\) durch Null auf ganz \({\mathbb R}^n\) fortsetzbar und die (ebenso bezeichnete Fortsetzung) erfüllt \[% \left\|\left. f \,\right|\, \mathrm W^{k,p}({\mathbb R}^n) \right\| =% \left\|\left. f \,\right|\, \mathrm W^{k,p}(\Omega) \right\| \qquad \forall f\in\mathrm W^{k,p}_0(\Omega).\] Damit kann man wiederum den Sobolevschen Einbettungssatz anwenden und erhält analog zum obigen Beweis
Satz 2.10 ( Einbettungssatz f"ur \(\mathrm W^{k,p}_0(\Omega)\) ). Sei \(1<p<\infty\) und \(k\in\mathbb N\). Dann gilt
\(\mathrm W^{k,p}_0(\Omega)\subset \mathrm L^q(\Omega)\) falls \(p\le q< p^*= np/(n-kp)\) und \(kp\le n\);
sowie \[\mathrm W^{k,p}_0(\Omega)\subset \mathrm C_0(\Omega) = \{f\in \mathrm C(\overline\Omega) : f(x) = 0, x\in\partial\Omega ,\;\text{und} \; \lim_{|x|\to\infty}f(x)=0\}\] für \(kp>n\).
Eine kurze Schlussbemerkung. Es ist einfach zu sehen, dass ein entsprechendes Resultat für \(\mathrm W^{k,p}(\Omega)\) anstatt \(\mathrm W^{k,p}_0(\Omega)\) im allgemeinen falsch sein muss. Dazu betrachte man ein ebenes Gebiet mit einer Spitze , \[\Omega_{\alpha} = \{ (x_1,x_2) : 0<x_1<1,\; |x_2|< x_1^{1+\alpha} \}\] für \(\alpha>0\) und die Funktion \(f(x) = x_1^{-\beta}\) für ein \(\beta>0\). Diese gehört zu \(\mathrm L^p(\Omega_\alpha)\) falls \[\int_0^1 x_1^{-p\beta+\alpha+1} {\,\mathrm d}x_1 = x_1^{-p\beta + \alpha + 2}\big|_0^1 <\infty\] ist, also falls \(p\beta < 2+\alpha\). Sie gehört zu \(\mathrm W^{k,p}(\Omega_\alpha)\) falls sogar \[p\beta\le p(\beta+k) < 2+\alpha\] erfüllt ist. Für jedes \(p\) und \(k\) finden wir \(\alpha,\beta>0\), so dass dies gilt. Die Funktion ist aber nicht beschränkt. Hat das Gebiet nur eine Ecke und keine Spitze, gilt also \(\alpha=0\), so muss für obige Konstruktion \(pk < 2-p\beta < 2\) gelten, was wiederum zum Sobolevschen Einbettungssatz passt.
Wir wissen, dass für jedes Gebiet \(\Omega\) die Menge \(\mathrm C^\infty(\Omega)\cap\mathrm W^{k,p}(\Omega)\) in \(\mathrm W^{k,p}(\Omega)\) dicht ist. Die approximierenden glatten Funktionen können dabei allerdings am Rand singulär sein (und sind es für allgemeine Gebiete auch). Wir wollen nun der Frage nachgehen, wann die bis zum Rand glatten Funktionen \(\mathrm C^\infty(\overline{\Omega})\) dicht in \(\mathrm W^{k,p}(\Omega)\) sind. Dazu muss man Voraussetzungen an das Gebiet beziehungsweise an den Rand des Gebietes stellen.
Wir betrachten zuerst Gebiete, die als Epigraph einer stetigen Funktion dargestellt werden können.
Lemma 2.6. Sei \(h: {\mathbb R}^{n-1}\to{\mathbb R}\) stetig und \(\Omega=\{x=(x',x_n)\in{\mathbb R}^n : x_n>h(x')\}\). Dann ist für alle \(1\le p<\infty\) und \(k\in\mathbb N\) die Menge \(\mathrm W^{k,p}(\Omega)\cap \mathrm C^\infty(\overline\Omega)\) dicht in \(\mathrm W^{k,p}(\Omega)\).
Proof. Sei \(\epsilon>0\) und \(f\in\mathrm W^{k,p}(\Omega)\). Dann existiert nach dem Satz von Meyers und Serrin eine Funktion \(f_\epsilon\in\mathrm W^{k,p}(\Omega)\cap \mathrm C^\infty(\Omega)\) mit \[% \left\|\left. f-f_\epsilon \,\right|\, \mathrm W^{k,p}(\Omega) \right\| \le \epsilon/2.\] Wir betrachten nun die Translate \(f_{\epsilon,\tau} (x) = f_\epsilon(x', x_n+\tau)\), also die um \(\tau\) in \(x_n\)-Richtung verschobenen Funktionen. Dann gilt mit \(\Omega_\tau = \{ x_n>h(x')+\tau\}\) \[\begin{aligned} % \left\|\left. f_{\epsilon,\tau} \,\right|\, \mathrm W^{k,p}(\Omega) \right\| = % \left\|\left. f_\epsilon \,\right|\, \mathrm W^{k,p}(\Omega_\tau) \right\| \le % \left\|\left. f_{\epsilon} \,\right|\, \mathrm W^{k,p}(\Omega) \right\| \end{aligned}\] und unter Ausnutzung der Stetigkeit im \(p\)-Mittel \[\begin{aligned} \| \partial^\alpha f_\epsilon - \partial^\alpha f_{\epsilon,\tau} \|_p^p = \int_\Omega | \partial^\alpha f(x) - \partial^\alpha f(x+\tau e_n)|^p {\,\mathrm d}x \to 0 \end{aligned}\] für \(|\alpha|\le k\). Also kann man \(\tau\) so klein wählen, dass \(% \left\|\left. f_\epsilon - f_{\epsilon,\tau} \,\right|\, \mathrm W^{k,p}(\Omega) \right\| < \epsilon/2\) und somit \[% \left\|\left. f-f_{\epsilon,\tau} \,\right|\, \mathrm W^{k,p}(\Omega) \right\| \le \epsilon\] gilt. Nach Konstruktion ist die Funktion \(f_{\epsilon,\tau}\) aber auf \(\overline\Omega\subset \Omega_{-\tau}\) glatt. ◻
Wir sagen, ein Gebiet \(\Omega\) ist lokal ein (Epi-)Graph, falls es zu jedem Randpunkt \(x\in\partial\Omega\) eine Umgebung \(x\in U_x\subset{\mathbb R}^n\), eine Rotation \(R\in\mathrm{SO}(n)\) und eine stetige Funktion \(h:{\mathbb R}^{n-1}\to{\mathbb R}\) gibt, so dass \[U_x\cap \Omega = U_x \cap \{ x = R y : \text{$h(y') < y_n$ mit $y=(y',y_n)$} \}\] gilt. Die Umgebungen \(U_x\) können dabei in den \(y\)-Koordinaten offenbar als Zylinder gewählt werden, \(U_x=R ( B\times I )\) für \(B\subset {\mathbb R}^{n-1}\) offen und \(I\) offenes Intervall.
Weiterhin sei die Menge der glatten Funktionen mit kompaktem Träger im Abschluss \(\overline\Omega\) durch \(\mathrm C^\infty_{c}(\overline{\Omega}) = \{ f|_\Omega : f\in\mathrm C^\infty_{c}({\mathbb R}^n)\}\) bezeichnet. Dann gilt folgender Satz.
Satz 2.11 ( Approximierbarkeit bis zum Rand ). Erfülle \(\Omega\) die lokale Graphenbedingung. Dann ist \(\mathrm C^\infty_{c}(\overline\Omega)\) dicht in \(\mathrm W^{k,p}(\Omega)\) für alle \(1\le p<\infty\) und \(k\in\mathbb N\).
Proof. Sei \(\chi\in\mathrm C^\infty_{c}({\mathbb R}^n)\) mit \(\chi(x)=1\) für \(|x|\le 1\) und \(\chi(x)=0\) für \(|x|>2\). Dann gilt für \(f_R(x) = f(x)\chi(x/R)\) offenbar \(f_R\in \mathrm W^{k,p}(\Omega)\) und \(f_R\to f\) in \(\mathrm W^{k,p}(\Omega)\) für \(R\to\infty\). Also findet man zu \(\epsilon>0\) ein \(R\) mit \(% \left\|\left. f-f_R \,\right|\, \mathrm W^{k,p}(\Omega) \right\| <\epsilon/2\) und es genügt dieses \(f_R\) durch eine glatte Funktion zu approximieren.
Die Menge \(B_{2R}(0)\cap \Omega\) ist relativ kompakt im \({\mathbb R}^n\). Damit findet man eine endliche Überdeckung durch offene Teilmengen \(U_j\), die entweder ganz im Inneren des Gebiets liegen oder auf denen (nach Rotation) das Gebiet als Epigraph einer Funktion geschrieben werden kann. Wir nehmen an, dass die den Rand schneidenden Mengen zylindrisch sind. Sei weiter \(\psi_j\in\mathrm C^\infty({\mathbb R}^n)\) eine untergeordnete Partition, \(\sum_{j=1}^N \psi_j(x) = \chi(x/R)\) und \(f_{R,j}(x)=f(x)\psi_j(x)\). Es genügt zu zeigen, dass jede dieser endlich vielen Funktionen durch entsprechende glatte Funktionen approximiert werden kann. Für die ganz im Innern liegenden offenen Mengen ist das klar, es existiert ein glattes \(\tilde f_{R,j}\in\mathrm C^\infty_{c}(\Omega)\) mit \[% \left\|\left. f_{R,j}-\tilde f_{R,j} \,\right|\, \mathrm W^{k,p}(\Omega) \right\| < \frac{\epsilon}{2N}.\] Am Rand nutzt man das vorige Lemma. Wir finden also eine glatte Funktion \(\tilde f_{R,j}\) mit derselben Abschätzung, allerdings in der Sobolevnorm auf dem Hypergraphengebiet. Da \(f_{R,j}\) kompakten Träger in \(U_j\) besitzt, kann \(\tilde f_{R,j}\) auch mit Träger in \(U_j\) gewählt werden und die Norm entspricht der Sobolevnorm im Gebiet.17
Damit liefert die Dreiecksungleichung \[\begin{aligned} %\tnorm{f - \sum_{j=1}^N \tilde f_{R,j}}{\mathrm W^{k,p}(\Omega)} \le \tnorm{f-f_{R}}{\mathrm W^{k,p}(\Omega)} + \sum_{j=1}^N \tnorm{ f_{R,j} -\tilde f_{R,j} }{\mathrm W^{k,p}(\Omega)} <\epsilon \left\|{f - \sum_{j=1}^N \tilde f_{R,j}}\right\| \le \left\|{f-f_{R}}\right\|+ \sum_{j=1}^N \left\|{ f_{R,j} -\tilde f_{R,j} }\right\| <\epsilon\end{aligned}\] und der Satz ist bewiesen. ◻
Nur einige kurze Bemerkungen. Der obige Satz ist auf viele Gebiete anwendbar, es gibt allerdings Gebiete die die Voraussetzungen nicht erfüllen. Zum Einen sind dies Gebiete mit internen Rändern, wie \[\{ (x_1,x_2)\in{\mathbb R}^2 : x_1^2+x_2^2<1 \} \setminus ((0,1)\times\{0\}),\] für die die Aussage offenbar auch falsch ist. Hier kann der Satz gerettet werden, indem man den internen Rand doppelt zählt. Problematischer sind Gebiete mit kompliziert geformten Spitzen.
Im folgenden soll der Frage nachgegangen werden, für welche Gebiete sich Funktionen \(f\in\mathrm W^{k,p}(\Omega)\) zu Funktionen \(f_{ext}\in\mathrm W^{k,p}({\mathbb R}^n)\) fortsetzen lassen. Eine solche Fortsetzung ist offenbar nicht eindeutig, ihre Existenz impliziert aber sofort einen globalen Einbettungssatz. Wir sagen ein Gebiet \(\Omega\) sei \(\mathrm W^{k,p}\)-fortsetzbar, falls es eine Konstante \(C>1\) und zu jedem \(f\in\mathrm W^{k,p}(\Omega)\) ein \(f_{ext}\in\mathrm W^{k,p}({\mathbb R}^n)\) mit \[% \left\|\left. f_{ext} \,\right|\, \mathrm W^{k,p}({\mathbb R}^n) \right\| \le C % \left\|\left. f \,\right|\, \mathrm W^{k,p}(\Omega) \right\|\] gibt.
Satz 2.12 ( Globaler Einbettungssatz ). Angenommen, \(\Omega\) ist \(\mathrm W^{k,p}\)-fortsetzbar. Dann gilt für \(1<p<\infty\) und \(k\in\mathbb N_0\)
\(\mathrm W^{k,p}(\Omega)\subset \mathrm L^q(\Omega)\) falls \(p\le q< p^*= np/(n-kp)\) und \(kp\le n\);
\(\mathrm W^{k,p}(\Omega)\subset \mathrm C_b(\Omega) = \mathrm L^\infty(\Omega)\cap\mathrm C(\Omega)\) für \(kp>n\).
Wir beginnen mit einem Spezialfall, dem Halbraum \[\Omega={\mathbb R}^n_+=\{ x=(x',x_n)\in{\mathbb R}^n : x_n>0 \}.\] Sei nun \(f\in\mathrm W^{k,p}({\mathbb R}^n_+)\). Wir konstruieren die Fortsetzung \(f_{ext}\) durch eine Art Spiegelung und setzen \[f_{ext}(x',-x_n) = \sum_{j=1}^k c_j f(x', \lambda_j x_n)\] mit noch zu bestimmenden Konstanten \(c_j\) und \(\lambda_j\). Die Formel sollte mindestens für \(\mathrm C^{k-1}(\overline{{\mathbb R}^n_+})\)-Funktionen korrekt sein und eine \(\mathrm C^{k-1}\)-Fortsetzung liefern. Dazu müssen die ersten \(k-1\) partiellen Ableitungen \(\partial_n^\ell\) stetig sein, es muss also \[(-1)^\ell\sum_{j=1}^k \lambda_j^\ell c_j = 1% (\partial_n^\ell f)(x',0) = \partial_n^\ell f(x',0)\] für \(\ell=0,1,\ldots, k-1\) gelten. Die Koeffizientenmatriz dieses linearen Gleichungssystems ist die Vandermonde-Matrix, \[\begin{pmatrix} 1 & 1 & \cdots & 1\\ \lambda_1 & \lambda_2 & \cdots & \lambda_k \\ \vdots & \vdots & \ddots & \vdots \\ \lambda_1^{k-1} & \lambda_2^{k-1} & \cdots & \lambda_k^{k-1} \end{pmatrix} \begin{pmatrix}c_1 \\ c_2 \\ \vdots \\ c_k\end{pmatrix} =\begin{pmatrix} 1\\-1\\\vdots \\(-1)^{k-1}\end{pmatrix},\] die Determinante der Matrix gerade \(\prod_{i\ne j} (\lambda_i-\lambda_j)\). Damit ist dieses Gleichungssystem ist eindeutig lösbar falls die \(\lambda_j\) paarweise verschieden sind und bestimmt die Koeffizienten \(c_j\).
Lemma 2.7. Der Halbraum \({\mathbb R}^n_+\) ist \(\mathrm W^{k,p}\)-fortsetzbar und die gerade konstruierte Fortsetzung \(f_{ext}\) gehört zu \(\mathrm W^{k,p}({\mathbb R}^n)\).
Proof. Sei \(f\in\mathrm W^{k,p}({\mathbb R}^n_+)\) und bezeichne \[f_{ext}(x',-x_n) = \sum_{j=1}^k c_j f(x', \lambda_j x_n)\] mit den gerade bestimmten Konstanten \(c_j\) und \(\lambda_j=j\). Wir approximieren \(f\) durch eine in \(\mathrm W^{k,p}({\mathbb R}^n_+)\) konvergente Folge \(f_i\in \mathrm C^{k}({\mathbb R}^n_+)\cap\mathrm W^{k,p}({\mathbb R}^n_+)\) und betrachten die Folge der Fortsetzungen \(f_{i,ext}\in\mathrm C^{k-1}({\mathbb R}^n)\). Diese gehören zu \(\mathrm W^{k,p}({\mathbb R}^n)\).
Dabei gilt für \(|\alpha|\le k\) \[\begin{aligned} \| \partial^\alpha f_{i,ext} \|_p \le % \left\|\left. \partial^\alpha f_i \,\right|\, \mathrm L^p({\mathbb R}_+^n) \right\| + \sum_{j=1}^k |c_j| \lambda_j^{\alpha_n-1} % \left\|\left. \partial^\alpha f_i \,\right|\, \mathrm L^p({\mathbb R}_+^n) \right\| ,\end{aligned}\] also insbesondere \(% \left\|\left. f_{i,ext} \,\right|\, \mathrm W^{k,p}({\mathbb R}^n) \right\| \le C_{k} % \left\|\left. f_i \,\right|\, \mathrm W^{k,p}({\mathbb R}_+^n) \right\|\). Damit ist die Fortsetzung stetig und \(f_{i,ext}\) konvergiert für \(i\to\infty\) gegen die Fortsetzung \(f_{ext}\) im \(\mathrm W^{k,p}({\mathbb R}^n)\). ◻
Wir sagen, das Gebiet \(\Omega\) besitze eine \(\mathrm C^m\)-Rand, falls es lokal der Graph einer \(\mathrm C^m\)-Funktion ist. Solche Gebiete kann man lokal am Rand geradebiegen.
Lemma 2.8. Sei \(\Omega\) Gebiet mit \(\mathrm C^m\)-Rand. Dann existiert zu jedem \(x^*\in\partial\Omega\) eine Umgebung \(x^*\in U_{x^*}\subset{\mathbb R}^n\) und ein \(\mathrm C^m\)-Diffeomorphismus \(\Phi_{x^*}\in \mathrm C^m(U_{x^*};{\mathbb R}^n)\), welcher \(U_x\cap\Omega\) bijektiv auf \(V\cap {\mathbb R}^n_+\) für eine offene Menge \(V\) abbildet, \(\Phi_{x^*}(x^*)=0\) erfüllt und für den \(\det\Phi'_{x^*}=1\) auf \(U_{x^*}\) gilt.
Proof. Nach Rotation gilt lokal \(U_{x^*}\cap\Omega = U_{x^*} \cap \{ x=Ry : y_n > h(y') \}\), es bleibt \(\Phi_{x^*}(x)= (y',y_n-h(y))-R^{-1}x^*\) für \(x=Ry\) zu setzen. ◻
Die auftretenden Diffeomorphismen sind noch zu verstehen. Dazu nutzen wir folgendes Lemma, ein Beweis verbleibt als Übung.
Lemma 2.9. Seien \(\Omega\) und \(\tilde \Omega\) \(\mathrm C^k\)-diffeomorphe Gebiete und sei \(\Phi : \Omega \to \tilde \Omega\) ein \(\mathrm C^k\)-Diffeomorphismus mit \[0< c_0\le | \det \Phi'(x) |\le C\] für alle \(x\in\Omega\) und \[\sup_{x\in \Omega} ||\partial^\alpha \Phi(x) || < \infty\qquad \text{ f\"ur alle $|\alpha|\le k$}.\] Dann erfüllt die Inverse \(\Phi^{-1} : \tilde \Omega \to \Omega\) die Abschätzungen \(\sup_{y\in\tilde \Omega} ||\partial^\alpha \Phi^{-1}(y) || < \infty\) und es gilt weiterhin \[\frac1C % \left\|\left. f \,\right|\, \mathrm W^{k,p}(\tilde \Omega) \right\| \le % \left\|\left. f\circ\Phi \,\right|\, \mathrm W^{k,p}(\Omega) \right\| \le C % \left\|\left. f \,\right|\, \mathrm W^{k,p}(\tilde \Omega) \right\|\] für alle \(1\le p \le \infty\) und \(k\in\mathbb N\) mit einer entsprechenden Konstanten \(C>0\).
Wir beweisen nur folgende Aussage. Der Beweis ist einfach und konstruktiv, die Voraussetzungen aber viel zu strikt.
Satz 2.13 ( Fortsetzungssatz ). Sei \(\Omega\) ein beschränktes Gebiet mit \(\mathrm C^m\)-Rand. Dann ist \(\Omega\) \(\mathrm W^{k,p}\)-fortsetzbar für alle \(1\le p<\infty\) und \(k\le m\).
Proof. Wegen der Beschränktheit des Gebietes ist \(\partial\Omega\) kompakt und es existiert eine endliche Überdeckung des Randes durch offene Mengen, in denen nach Rotation der Rand Graph einer \(\mathrm C^m\)-Funktion ist. Wir wählen eine untergeordnete Partition der Eins und zerlegen \(f\in\mathrm W^{k,p}(\Omega)\) entsprechend. Es genügt damit, jede einzelne dieser Funktionen fortzusetzen.
Dazu betrachten wir ein \(f\in\mathrm W^{k,p}(\tilde \Omega)\) mit kompaktem Träger auf einem Epigraphen \(\tilde\Omega = \{ x : x_n \ge h(x')\}\) für \(h\in\mathrm C^m\). Wir nutzen den Diffeomorphismus des vorletzten Lemmas um \(\tilde\Omega\) in \({\mathbb R}^n_+\) zu deformieren und setzen die Bildfunktion entsprechend vom Halbraum fort. Der Träger der Fortsetzung kann wiederum kompakt in der entsprechenden offenen Menge der Überdeckung gewählt werden. Obiges Lemma liefert die Äquivalenz der Normen; nach Zurückdeformieren sind wir also wirklich im \(\mathrm W^{k,p}({\mathbb R}^n)\) mit ensprechender Normabschätzung und die Summe der Fortsetzungen liefert die gesuchte Funktion. ◻
Und jetzt noch der allgemeine Fall. Wir sagen ein Gebiet ist global Lipschitz , falls es ein \(\epsilon>0\) und ein \(M\) gibt, so dass für jeden Randpunkt \(x^*\in\partial\Omega\) die Menge \(B_\epsilon(x^*)\cap\Omega\) nach Rotation lokaler Epigraph einer Lipschitzfunktion ist, \[B_\epsilon(x^*)\cap\Omega = B_\epsilon(x^*)\cap \{ x= R_{x^*} y : y_n > h_{x*}(y') \},\] wobei \(R_{x^*} \in\mathrm{SO}(n)\) und \(h_{x^*}\) eine Lipschitzfunktion mit Lipschitzkonstanten \(M\) \[| h_{x^*}(\zeta)- h_{x^*}(\eta) | \le M |\zeta-\eta| ,\qquad \zeta,\eta\in{\mathbb R}^{n-1}.\] Damit gilt der Steinsche Fortsetzungssatz18 (für einen Beweis siehe , Kapitel VI.3.3.).
Satz 2.14 ( Steinscher Fortsetzungssatz ). Angenommen, das Gebiet \(\Omega\) ist global Lipschitz. Dann ist \(\Omega\) \(\mathrm W^{k,p}\)-fortsetzbar für alle \(1\le p\le \infty\) und alle \(k\in\mathbb N\).
Es gilt sogar leicht mehr, es existiert ein Fortsetzungsoperator, der für alle in Betracht kommenden Räume funktioniert.
Aussage | Voraussetzungen | ||
an \(p\), \(k\) | an \(\partial\Omega\) | ||
dichte | \(\mathrm C^\infty(\Omega)\cap\mathrm W^{k,p}(\Omega)\) in \(\mathrm W^{k,p}(\Omega)\) | \(1\le p<\infty\) | keine |
Teilmengen | (Meyers und Serrin; 1965) | ||
\(\mathrm C^\infty_c(\overline\Omega)\) in \(\mathrm W^{k,p}(\Omega)\) | \(1\le p<\infty\) | lokaler Graph | |
Fortsetzung | \(\mathrm{res}_{{\mathbb R}^n\to\Omega} \mathrm W^{k,p}({\mathbb R}^n)=\mathrm W^{k,p}(\Omega)\) | \(1\le p\le \infty\) | global Lipschitz |
(Stein; 1970) | |||
Einbettung | \(\mathrm W^{k,p}(\Omega)\subset \mathrm C_0(\overline\Omega)\) | \(kp>n\) | global Lipschitz |
\(\mathrm W^{k,p}(\Omega)\subset \mathrm L^q(\Omega)\) | \(p\le q<p^*\) | global Lipschitz | |
\(p^*=\frac{np}{n-kp}\) | |||
\(\mathrm W^{k,p}(\Omega)\subset \mathrm L^{p^*(,\infty)}\Omega)\) | \(1<p<\infty\) | global Lipschitz | |
(Sobolev; 1938) |
Ein kurzer Exkurs zu Räumen mit nichtganzzahliger Glattheitsordnung. Wir beschränken uns auf den Hilbertraumfall \(p=2\) und starten mit dem schon bekannten Raum \[\mathrm H^s({\mathbb R}^n) = \mathrm W^{s,2}({\mathbb R}^n) = \{ f\in\mathscr S'({\mathbb R}^n) : \|f\|_{\mathrm H^s}^2= \|\langle\xi\rangle^s \widehat f(\xi)\|_2^2<\infty\}\] für \(s\in{\mathbb R}\). Die Bezeichnung \(\mathrm H^s({\mathbb R}^n)\) hat sich für diesen Raum eingebürgert.
Der Schwartzraum \(\mathscr S({\mathbb R}^n)\) ist dann Teilmenge des \(\mathrm H^s({\mathbb R}^n)\), die Einbettungen \[\mathscr S({\mathbb R}^n)\hookrightarrow \mathrm H^s({\mathbb R}^n)\hookrightarrow\mathscr S'({\mathbb R}^n)\] sind beide stetig. Bezüglich der \(\mathscr S\)-\(\mathscr S'\)-Dualität sind \(\mathrm H^s({\mathbb R}^n)\) und \(\mathrm H^{-s}({\mathbb R}^n)\) zueinander dual. Genauer gilt
Lemma 2.10. Sei \(T\in(\mathrm H^s({\mathbb R}^n))'\) eine stetige Linearform, \(T:\mathrm H^s({\mathbb R}^n)\to{\mathbb C}\). Dann ist \(T:\mathscr S({\mathbb R}^n)\to{\mathbb C}\) eine temperierte Distribution und diese erfüllt \(T\in\mathrm H^{-s}({\mathbb R}^n)\).
Proof. Da die Einbettung \(\mathscr S({\mathbb R}^n)\hookrightarrow \mathrm H^s({\mathbb R}^n)\) stetig ist, ist \(T:\mathscr S({\mathbb R}^n)\hookrightarrow \mathrm H^s({\mathbb R}^n)\to {\mathbb C}\) stetig und somit eine temperierte Distribution. Bezeichnet man diese wiederum mit \(T\), so bleibt \(T\in\mathrm H^{-s}({\mathbb R}^n)\) zu zeigen.
Wir führen diese Aussage auf den Rieszschen Darstellungssatz19 im \(\mathrm L^2({\mathbb R}^n)\) zurück. Sei dazu \(f\in\mathrm H^s({\mathbb R}^n)\) und \(\widehat f(\xi) = \langle\xi\rangle^{-s}\tilde f(\xi)\) mit dem eindeutig bestimmten \(\tilde f\in\mathrm L^2({\mathbb R}^n)\). Wegen der Isometrie \(\|f\|_{\mathrm H^s} = \|\tilde f\|_2\) ist die Abbildung \(\tilde T : \tilde f \mapsto Tf\) stetig somit existiert nach dem Rieszschen Darstellungssatz im \(\mathrm L^2({\mathbb R}^n)\) ein \(\tilde g\), so dass für alle \(f\in\mathscr S({\mathbb R}^n)\) \[\begin{aligned} T f &= \tilde T\tilde f = (\tilde f,\tilde g)_{\mathrm L^2} = \int \tilde f(\xi) \overline{\tilde g(\xi)}{\,\mathrm d}\xi = \int \langle \xi\rangle^s \widehat f(\xi) \overline{\tilde g(\xi)}{\,\mathrm d}\xi \notag\\ &= \langle \mathscr F^+ T ,\widehat f \rangle =\langle T , f \rangle\end{aligned}\] mit \(\widehat T(\xi) = \langle\xi\rangle^s \overline{\tilde g(-\xi)}\) gilt. Nach Konstruktion gehört \(T\) zu \(\mathrm H^{-s}({\mathbb R}^n)\). ◻
Ausgehend vom \(\mathrm H^s({\mathbb R}^n)\) kann man nun Räume auf Gebieten konstruieren.
Definition 2.2.
Sei \(F\subset{\mathbb R}^n\) abgeschlossen. Dann bezeichne \[\mathrm H^s_F = \{ f\in \mathrm H^s({\mathbb R}^n) : \mathop{\mathrm{supp}}f\subset F\}\] die Menge der in \(F\) getragenen Distributionen aus dem Raum \(\mathrm H^s({\mathbb R}^n)\).
Sei \(\Omega\subset{\mathbb R}^n\) ein Gebiet. Dann bezeichne \[{\mathrm H}^{s}(\Omega) = \{ f|_\Omega : f \in\mathrm H^{s}({\mathbb R}^n) \}\] die Menge der Einschränkungen von \(\mathrm H^s\)-Distributionen auf das Gebiet \(\Omega\) versehen mit der Norm \[% \left\|\left. g \,\right|\, {\mathrm H}^{s}(\Omega) \right\| = \inf_{f: g=f|_\Omega} % \left\|\left. f \,\right|\, \mathrm H^{s}({\mathbb R}^n) \right\| .\]
Der Abschluss der \(\mathrm C_c^\infty(\Omega)\)-Funktion im \(\mathrm H^{s}(\Omega)\) wird als \[\mathrm H^{s}_0(\Omega) = \overline{\mathrm C^\infty_{c}(\Omega)}^{\mathrm H^{s}(\Omega)}\] bezeichnet.
Diese Menge \(\mathrm H^s_F\) bildet einen linearen Teilraum des \(\mathrm H^s({\mathbb R}^n)\) und ist wegen der stetigen Einbettung \(\mathrm H^s({\mathbb R}^n)\hookrightarrow \mathscr S'({\mathbb R}^n)\) abgeschlossen. Wir versehen sie mit der induzierten Hilbertraumtopologie. Sei nun \(\Omega\) ein Gebiet. Dann stimmen für zwei Funktionen \(f,g\in\mathrm H^{s}({\mathbb R}^n)\) die Einschränkungen \(f|_\Omega\) und \(g|_\Omega\) genau dann überein, wenn wenn ihre Differenz \(f-g\in\mathrm H^s_{{\mathbb R}^n\setminus\Omega}\) erfüllt. Also kann man den Raum \(\mathrm H^s(\Omega)\) der Einschränkungen als Quotientenraum \[{\mathrm H}^{s}(\Omega) = \mathrm H^s({\mathbb R}^n) / \mathrm H^s_{{\mathbb R}^n\setminus\Omega}\simeq (\mathrm H^s_{{\mathbb R}^n\setminus\Omega})^\perp\] auffassen. Bezeichnet \(\mathrm P_F^s\) die Orthogonalprojektion des \(\mathrm H^s({\mathbb R}^n)\) auf den \(\mathrm H^s_F\) (Orthogonalität bezüglich des Hilbertraums \(\mathrm H^s({\mathbb R}^n)\)), so gilt \[% \left\|\left. f|_\Omega \,\right|\, {\mathrm H}^{s}(\Omega) \right\| = % \left\|\left. (1-\mathrm P^s_{{\mathbb R}^n\setminus\Omega}) f \,\right|\, \mathrm H^s({\mathbb R}^n) \right\| .\] Dass das Infimum in der Normdefinition für den \(\mathrm H^s(\Omega)\) ist also insbesondere ein Minimum.
Als erstes sollen diese Räume mit den bisher betrachteten in Beziehung gesetzt werden. Sei dazu \(s=k\in\mathbb N\). Dann sind die Sobolevinnenprodukte in \(\mathrm H^k({\mathbb R}^n)\) lokal, \[% \left( f,g \right)_{\mathrm H^k({\mathbb R}^n)} = \int (1+|\xi|^2)^k \widehat f(\xi) \overline{\widehat g(\xi)} {\,\mathrm d}\xi = \sum_{j=0}^k \int ((-\Delta)^j f(x))\overline{ g(x)} {\,\mathrm d}x\] und es gilt \[\mathrm H^k(\Omega) \subset \mathrm W^{k,2}(\Omega),\qquad k\in\mathbb N,\] da für \(g\in{\mathrm H}^{k}(\Omega)\) mit \(g=f|_\Omega\) wegen der Gebietsmonotonie \[% \left\|\left. g \,\right|\, \mathrm W^{k,2}(\Omega) \right\| \le % \left\|\left. f \,\right|\, \mathrm W^{k,2}({\mathbb R}^n) \right\| \le C % \left\|\left. f \,\right|\, \mathrm H^{k}({\mathbb R}^n) \right\|\] gilt und somit \(% \left\|\left. g \,\right|\, \mathrm W^{k,2}(\Omega) \right\| \le C % \left\|\left. g \,\right|\, \mathrm H^{k}(\Omega) \right\|\) folgt. Ist \(\Omega\) global Lipschitz, so gilt als Konsequenz des Steinschen Fortsetzungssatzes \[\mathrm H^k(\Omega) = \mathrm W^{k,2}(\Omega),\qquad k\in\mathbb N,\] da jede Funktion aus \(\mathrm W^{k,2}(\Omega)\) zu einer auf dem gesamten Raum definierten Sobolevfunktion fortgesetzt werden kann. Für Gebiete mit Rändern die keine Lipschitzbedingung erfüllen, enthält der \(\mathrm H^k(\Omega)\) weniger Funktionen als der Sobolevraum \(\mathrm W^{k,2}(\Omega)\), man mache sich dies am Beispiel eines Gebiets mit einer Spitze klar.
Die Lokalität des Innenprodukts impliziert weiter, dass für \(F,G\subset{\mathbb R}^n\) abgeschlossen und separiert \[\mathrm H^k_F \perp_{\mathrm H^k} \mathrm H^k_G\] im \(\mathrm H^k({\mathbb R}^n)\) orthogonal sind. Damit ist die Fortsetzung einer \(\mathrm C_c^\infty(\Omega)\)-Funktion durch Null aber auch die Fortsetzung minimaler Norm und \(\mathrm H^k_0(\Omega) = \mathrm W^{k,2}_0(\Omega)\) für alle Gebiete \(\Omega\). Hier ist \(k\in\mathbb N_0\) wesentlich!
Die folgenden Aussagen gelten für beliebige Gebiete.
Lemma 2.11.
Es existiert ein isometrischer Fortsetzungsoperator \[\mathrm E^s_\Omega : \mathrm H^s(\Omega)\to\mathrm H^s({\mathbb R}^n).\] Zusammen mit der Restriktion \(\mathrm{res}_\Omega : \mathrm H^s({\mathbb R}^n)\ni f\mapsto f|_\Omega \in \mathrm H^s(\Omega)\) gilt \[\mathrm E^s_\Omega \circ \mathrm{res}_\Omega =1- \mathrm P^s_{{\mathbb R}^n\setminus\Omega},\qquad \mathrm{res}_\Omega\circ\mathrm E^s_\Omega = 1.\]
\(\mathrm C^\infty_c(\overline\Omega)\) ist dicht in \(\mathrm H^s(\Omega)\) für alle \(s\in{\mathbb R}\).
Proof.
Jede Funktion aus \(f|_\Omega\in\mathrm H^s(\Omega)\) ist Einschränkung einer Funktion \(f\in\mathrm H^s({\mathbb R}^n)\). Zerlegt man diese mit dem Projektionssatz in \[f=\mathrm P^s_{{\mathbb R}^n\setminus\Omega} f + (1-\mathrm P^s_{{\mathbb R}^n\setminus\Omega}) f ,\] so gilt nach Definition der Norm \[% \left\|\left. f|_\Omega \,\right|\, \mathrm H^s(\Omega) \right\| = % \left\|\left. (1-\mathrm P^s_{{\mathbb R}^n\setminus\Omega}) f \,\right|\, \mathrm H^s({\mathbb R}^n) \right\| ,\] und die Abbildung \[\mathrm E_\Omega^s : f|_\Omega \mapsto (1-\mathrm P^s_{{\mathbb R}^n\setminus\Omega}) f\] ist eine Isometrie. Sie ist wohldefiniert, stimmen zwei Funktionen \(f\) und \(g\) auf \(\Omega\) überein, so gilt \(f-g\in\mathrm H^s_{{\mathbb R}^n\setminus\Omega}\) und somit \((1-\mathrm P^s_{{\mathbb R}^n\setminus\Omega}) f= (1-\mathrm P^s_{{\mathbb R}^n\setminus\Omega}) g\).
Sei \(f\in\mathrm H^s(\Omega)\) und \(\tilde f= \mathrm E_\Omega^s f\) die isometrische Fortsetzung. Dann existiert wegen der Dichtheit von \(\mathscr S({\mathbb R}^n)\) in \(\mathrm H^s({\mathbb R}^n)\) eine Funktion \(\tilde f_\epsilon\in\mathscr S({\mathbb R}^n)\) mit \(\|{\tilde f-\tilde f_\epsilon}\|_{2,s}<\epsilon\). Also folgt \[% \left\|\left. f|_\Omega - f_\epsilon|_\Omega \,\right|\, \mathrm H^s(\Omega) \right\| = % \left\|\left. (f - f_\epsilon)|_\Omega \,\right|\, \mathrm H^s(\Omega) \right\| \le \|{\tilde f-\tilde f_\epsilon}\|_{2,s}<\epsilon\]
◻
Oft benötigt man Zerlegungen der Eins um Aussagen zu lokalisieren. Das ist in Räumen ganzzahliger Glattheit trivial, in den \(\mathrm H^s({\mathbb R}^n)\)-Räumen muss man das noch beweisen. Dazu folgendes Lemma.
Lemma 2.12. Sei \(\chi\in\mathrm C_0^\infty({\mathbb R}^n)\). Dann ist für alle \(s\in{\mathbb R}\) die Abbildung \(\mathrm H^s({\mathbb R}^n) \ni f\mapsto \chi f\in\mathrm H^s({\mathbb R}^n)\) stetig.
Proof. Dazu nutzen wir die Peetre-Ungleichung 20 \[\langle \xi \rangle ^s \le 2^{|s|} \langle \xi-\eta \rangle^{|s|} \langle \eta\rangle^s.\] Damit gilt aber unter Ausnutzung der Youngschen Ungleichung und für beliebige \(f\in\mathscr S({\mathbb R}^n)\) \[\begin{aligned} \|\chi f\|_{2,s}& = \int \langle\xi\rangle^{2s} |\widehat {\chi f}(\xi)|^2 {\,\mathrm d}\xi \notag\\&\le (2\pi)^{n/2} 2^{|s|} \int\left| \int \langle\xi-\eta\rangle^{|s|} \widehat \chi(\xi-\eta) \langle\eta\rangle^s \widehat f(\eta){\,\mathrm d}\eta\right|^2{\,\mathrm d}\xi\notag\\ &\le (2\pi)^{n/2} 2^{|s|} \left(\int \langle\xi\rangle^{|s|}|\widehat\chi(\xi)|{\,\mathrm d}\xi\right)^2 \left( \int \langle\eta\rangle^{2s} |\widehat f(\eta)|^2{\,\mathrm d}\eta \right)\notag\\ &\le C_s \|f\|_{2,s}\end{aligned}\] und wegen der Dichtheit von \(\mathscr S({\mathbb R}^n)\) im Sobolevraum somit auch für beliebige \(f\in\mathrm H^s({\mathbb R}^n)\). ◻
Korollar 2.7. Sei nun \(F\subset{\mathbb R}^n\) kompakt und \(\chi_j\in\mathrm C_0^\infty({\mathbb R}^n)\), \(j=1,\dots,N\) mit \(\sum_j \chi_j(x)=1\) auf \(F\) gegeben. Dann existiert eine Konstante \(C\) mit \[\frac1C \|f\|_{2,s} \le \sum_j \| \chi_j f\|_{2,s} \le C \|f\|_{2,s}\] für alle \(f\in\mathrm H^s_F\).
Proof. Die zweite Ungleichung folgt direkt aus vorigem Lemma. Für die erste nutzt man, dass \(f=\sum_j \chi_j f\) gilt und wendet die Dreiecksungleichung an. ◻
Dualitätsbeziehungen. Die Räume \(\mathrm H^s(\Omega)\) und \({\mathrm H}^{-s}_{\overline\Omega}\) sind für viele Gebiete zueinander dual. Dazu genauer, es gilt
Lemma 2.13. Sei \(T : \mathrm H^s(\Omega)\to{\mathbb C}\) ein stetiges lineares Funktional. Dann bestimmt \[\langle \mathcal E^s_\Omega T,f \rangle = \langle T,f|_\Omega\rangle\] eine isometrische Fortsetzung \(\mathcal E^s_\Omega T \in (\mathrm H^s({\mathbb R}^n))' \simeq \mathrm H^{-s}({\mathbb R}^n)\) mit Träger in \(\overline\Omega\).
Proof. Nach Konstruktion gilt \(\mathcal E_\Omega^s = \mathrm{res}_\Omega^\top\), also sind Linearität und Beschränkheit der Fortsetzung klar. Wir schreiben \(f=(1-\mathrm P_{{\mathbb R}^n\setminus\Omega}^s)f + \mathrm P_{{\mathbb R}^n\setminus\Omega}^s f=f_1+f_2\). Dann gilt \[\langle\mathcal E^s_\Omega T, f\rangle = \langle T ,f|_\Omega\rangle = \langle\mathcal E^s_\Omega T, f_1\rangle.\] Wegen \(% \left\|\left. f \,\right|\, \mathrm H^s({\mathbb R}^n) \right\| \ge% \left\|\left. f_1 \,\right|\, \mathrm H^s({\mathbb R}^n) \right\| =% \left\|\left. f|_\Omega \,\right|\, \mathrm H^s(\Omega) \right\|\) ergibt sich daraus die Isometrie der Fortsetzung.
Es bleibt die Trägereigenschaft. Sei dazu \(f\in\mathrm C_c^\infty({\mathbb R}^n\setminus\overline\Omega)\). Dann gilt \(\langle \mathcal E_\Omega^s T, f\rangle = \langle T, f|_\Omega\rangle = 0\) und \(\mathcal E_\Omega^s T\) verschwindet auf \({\mathbb R}^n\setminus\overline\Omega\), ist also in \(\overline\Omega\) getragen. ◻
Wir können stetige Linearformen auf \(\mathrm H^s(\Omega)\) als Distributionen in \(\mathscr D'(\overline\Omega)\) auffassen und obiges Lemma besagt gerade, dass diese auf \(\mathscr S'({\mathbb R}^n)\) fortsetzbar sind. Die Fortsetzung ist eine Isometrie von \((\mathrm H^s(\Omega))'\) in \(\mathrm H^{-s}_{\overline\Omega}\), allerdings nicht immer surjektiv. Eine schwache Voraussetzung an das Gebiet ist hier nötig.
Satz 2.15. Angenommen, \(\Omega\) erfüllt die lokale Graphenbedingung. Dann sind \(( \mathrm H^s(\Omega))'\) und \(\mathrm H^{-s}_{\overline\Omega}\) zueinander dual.
Proof. Wir skizzieren den Beweis nur. Damit die Fortsetzung surjektiv ist, muss es zu jedem \(S\in\mathrm H^{-s}_{\overline\Omega}\) ein \(T\in(\mathrm H^s(\Omega))'\) mit \(S=\mathcal E^s_\Omega T\) geben. Angenommen, dies gilt. Dann folgt aus \(f=(1-\mathrm P_{{\mathbb R}^n\setminus\Omega}^s)f + \mathrm P_{{\mathbb R}^n\setminus\Omega}^s f=f_1+f_2\) \[\begin{aligned} \langle \mathcal E^s_\Omega T, f\rangle = \langle S ,f\rangle =\langle S, f_1\rangle +\langle S ,f_2\rangle = \langle \mathcal E^s_\Omega T, f_1\rangle +\langle S ,f_2 \rangle=^! \langle\mathcal E^s_\Omega T, f_1\rangle\end{aligned}\] und damit \(\langle S,f_2\rangle=0\).
Es muss also für jedes \(f\in\mathrm H^s_{{\mathbb R}^n\setminus\Omega}\) und jedes \(S\in\mathrm H^{-s}_{\overline\Omega}\) die Beziehung \(\langle S,f\rangle =0\) gelten. Das ist eine Aussage über die ‘Größe’ des Randes \(\partial\Omega\). Sei dazu vorerst \(\Omega = \{ (x',x_n) : x_n>h(x)\}\) Epigraph einer stetigen Funktion \(h:{\mathbb R}^{n-1}\to{\mathbb R}\), \(S\in\mathrm H^{-s}_{\overline\Omega}\) und \(f\in\mathrm H^s_{{\mathbb R}^n\setminus\Omega}\) kompakt getragen. Für \(\epsilon>0\) sei \(f_\epsilon(x)=f(x',x_n+\epsilon)\) die um \(\epsilon\) in das Gebiet \({\mathbb R}^n\setminus\Omega\) hineingeschobene Funktion. Dann gilt (da die Träger disjunkt sind) \(\langle S, f_\epsilon\rangle=0\), ebenso \[\|f-f_\epsilon\|_{2,s}^2 = \int \langle\xi\rangle^{2s} |(1-{\mathrm e}^{{\mathrm i}\epsilon \xi_n}) \widehat f(\xi) |^2 {\,\mathrm d}\xi \to 0,\qquad \epsilon\to0\] nach majorisierter Konvergenz und somit wegen der Stetigkeit von \(S\) auf \(\mathrm H^s({\mathbb R}^n)\) \[\langle S,f\rangle = \lim_{\epsilon\to0} \langle S,f_\epsilon \rangle = 0.\]
Für ein beliebiges Gebiet \(\Omega\) mit lokaler Graphenbedingung zerlegt man \(f\) entsprechend mit einer Partition der Eins und wendet obige Argumentation auf jedes der Teile an. ◻
Die Voraussetzung, dass \(\Omega\) lokaler Epigraph ist, ist wesentlich. Ein einfaches Beispiel wäre ein Gebiet mit innerem Rand, z.b. \[\Omega=\{(x_1,x_2) : x_1^2+x_2^2<1\} \setminus [0,1]\times\{0\}.\] Dann ist \(\overline\Omega = \{ (x_1,x_2) : x_1^2+x_2^2\le 1\}\) die abgeschlossene Kreisscheibe und das Komplement \({\mathbb R}^n\setminus\Omega = \{(x_1,x_2) : x_1^2+x_2^2\ge 1\}\cup( [0,1]\times\{0\})\). Betrachtet man nun die Diracsche Deltadistribution \(\langle\delta,f\rangle=f(0)\), so gilt \(\delta\in\mathrm H^{-s}_{{\mathbb R}^n\setminus\Omega}\) für \(s>\frac n2\). Allerdings existieren Funktionen \(f\in\mathrm C_c^\infty(\overline\Omega)\subset\mathrm H^s_{\overline\Omega}\) mit \(\langle\delta,f\rangle\ne0\). Somit kann der Dualraum von \(\mathrm H^{-s}(\Omega)\) nicht der \(\mathrm H^s_{\overline\Omega}\) sein!
(Linearformen auf dem \(\mathrm H^{-s}(\Omega)\) müssen für \(s>\frac n2\) sogar von stetigen Funktionen herrühren, die auf dem internen Rand verschwinden. Auf dem äußeren Rand tun das Funktionen aus \(\mathrm H^s_{\overline\Omega}\) für \(s>\frac n2\) sowieso, sie sind ja stetig.)
Die bisher betrachtete Norm auf \(\mathrm H^s(\Omega)\) ist nur schwer zu berechnen. Ist \(s\ge0\) und \(\Omega\) global Lipschitz, so kann man eine äquivalente Norm angeben. Sei dazu \[|f|_{\mu,\Omega} := \left(\int_\Omega \int_\Omega \frac{|f(x)-f(y)|^2}{|x-y|^{n+2\mu}}{\,\mathrm d}x{\,\mathrm d}y\right)^{1/2}\] die Slobodeckij-Seminorm 21. Dann gilt
Satz 2.16. Sei \(\Omega\) global Lipschitz und \(s\ge0\).
Ist \(k\in\mathbb N_0\), so ist die Norm in \(\mathrm H^k(\Omega)\) äquivalent zur \(\mathrm W^{k,2}(\Omega)\)-Norm.
Ist \(s=k+\mu\) mit \(k\in\mathbb N_0\) und \(\mu\in(0,1)\), so ist die Norm in \(\mathrm H^k(\Omega)\) äquivalent zu \[\frac1C % \left\|\left. f \,\right|\, \mathrm H^s(\Omega) \right\| ^2 \le % \left\|\left. f \,\right|\, \mathrm W^{k,2}(\Omega) \right\| ^2 + \sum_{|\alpha|=k} |\partial^\alpha f|^2_{\mu,\Omega} \le C % \left\|\left. f \,\right|\, \mathrm H^s(\Omega) \right\| ^2 .\]
Die erste Aussage ist nur eine erneute Fassung des Steinschen Fortsetzungssatzes. Für die zweite benötigt man die allgemeinere Fassung des Fortsetzungssatzes nach Rychkov22 und kann die Aussage auf das entsprechende Äquivalenzresultat im \({\mathbb R}^n\) zurückführen.
Sei vorerst \({\mathbb R}^n_+\) der Halbraum und \(f\in\mathrm H^s({\mathbb R}^n_+)\). Ist \(s\) groß genug (z.B. \(s>\frac n2\)), dann kann \(f\) auf den Rand des Halbraums \({\mathbb R}^{n-1}=\partial{\mathbb R}^n_+\) eingeschränkt werden. Es liegt also nahe, zu fragen, welche Regularität diese Einschränkung besitzt. Die Antwort ist verblüffend einfach. Sei dazu für glattes \(f\) \[\gamma_0 : \mathrm C_c^\infty(\overline{{\mathbb R}^n_+}) \ni f\mapsto f|_{{\mathbb R}^{n-1}} \in \mathrm C_c^\infty({\mathbb R}^{n-1})\] die Spurabbildung am Rand \({\mathbb R}^{n-1}=\partial{\mathbb R}^n_+\).
Lemma 2.14. Sei \(s>\frac12\). Dann kann die Abbildung \(\gamma_0\) stetig zur Spurabbildung
\[\gamma_0 : \mathrm H^s({\mathbb R}^n_+) \mapsto \mathrm H^{s-\frac12}({\mathbb R}^{n-1})\] fortgesetzt werden. Diese ist surjektiv.
Proof. Schritt 1, Stetigkeit: Die erste Aussage ist eine Stetigkeitsaussage, es genügt die entsprechende Abschätzung für den auf \(\mathrm C_c^\infty(\overline{{\mathbb R}^n_+})\) definierten Spuroperator zu beweisen. Sei dazu vorerst \(f\in\mathrm C_c^\infty({\mathbb R}^n)\). Dann liefert die Fouriersche Inversionsformel \[\gamma_0 f(x') = (2\pi)^{-n/2} \int \int {\mathrm e}^{{\mathrm i}x'\cdot\xi'} \widehat f(\xi',\xi_n) {\,\mathrm d}\xi'{\,\mathrm d}\xi_n\] und somit \[\begin{aligned} \widehat {\gamma_0 f}(\xi')= (2\pi)^{-1/2} \int \widehat f(\xi',\xi_n){\,\mathrm d}\xi_n.\end{aligned}\] Dies kann man mit Cauchy-Schwarz abschätzen. Es gilt \[| \widehat {\gamma_0 f}(\xi') |^2 \le \frac1{2\pi} \left( \int \langle\xi\rangle^{-2s} {\,\mathrm d}\xi_n \right) \left(\int \langle\xi\rangle^{2s} | \widehat f(\xi',\xi_n) | ^2 {\,\mathrm d}\xi_n\right) % = M_s(\xi')\left(\int \langle\xi\rangle^{2s} | \widehat f(\xi',\xi_n) | ^2 \d \xi_n\right)\] und mit der Substitution \(\xi_n = \langle\xi'\rangle t\), \(\langle \xi\rangle = \langle \xi'\rangle \langle t\rangle\), für alle \(s>\frac12\) \[\int \langle\xi\rangle^{-2s} {\,\mathrm d}\xi_n = \langle\xi'\rangle^{-2s+1} \int \langle t\rangle^{-2s} {\,\mathrm d}t = M_s \langle\xi'\rangle^{-2s+1}.\] Also folgt nach Integration über \(\xi'\) \[\begin{aligned} % \left\|\left. \gamma_0 f \,\right|\, \mathrm H^{s-\frac 12}({\mathbb R}^{n-1}) \right\| ^2 &= \int \langle\xi'\rangle^{2s-1} \widehat{\gamma f}(\xi'){\,\mathrm d}\xi' \notag\\ &\le \frac{M_s}{2\pi} \iint \langle\xi\rangle^{2s} | \widehat f(\xi',\xi_n) | ^2 {\,\mathrm d}\xi_n {\,\mathrm d}\xi' \notag\\ &= \frac{M_s}{2\pi} % \left\|\left. f \,\right|\, \mathrm H^s({\mathbb R}^n) \right\| .\end{aligned}\] Also kann man \(\gamma_0\) zu einer stetigen Abbildung \(\mathrm H^s({\mathbb R}^n)\to\mathrm H^{s-\frac12}({\mathbb R}^{n-1})\) fortsetzen. Verknüpft mit dem (isometrischen) Fortsetzungsoperator ergibt dies aber gerade die gesuchte Spurabbildung.
Da \(\mathrm C_c^\infty(\overline{{\mathbb R}^n_+})\) dicht in \(\mathrm H^s({\mathbb R}^n_+)\) ist, ist der Spuroperator von der gewählten Fortsetzung unabhängig.
Schritt 2, Surjektivität: In einem zweiten Schritt bleibt die Surjektivität des Spuroperators \(\mathrm H^s({\mathbb R}^n)\to\mathrm H^{s-\frac12}({\mathbb R}^{n-1})\). Sei dazu \(g\in\mathrm H^{s-\frac12}({\mathbb R}^{n-1})\) mit \(s>\frac12\). Wir zeigen, dass dann durch \[f(x) = (2\pi)^{-(n-1)/2} \int \widehat g(\xi') { \theta( \langle\xi'\rangle x_n ) } {\mathrm e}^{{\mathrm i}x'\cdot\xi'} {\,\mathrm d}\xi',\qquad x\in{\mathbb R}^n\] für eine Abschneidefunktion \(\theta\in\mathrm C_c^\infty({\mathbb R})\) mit \(\theta(t)=1\) für \(|t|\le 1\) eine entsprechende Fortsetzung mit \(\gamma_0 f = g\) definiert ist. Das geschieht in zwei Schritten. Sei zuerst \(g\in\mathrm C_c^\infty({\mathbb R}^{n-1})\). Dann ist obiges Integral sinnvoll und es gilt auf Grund der Fourierschen Inversionsformel \[\gamma f(x') = f(x',0) = (2\pi)^{-(n-1)/2} \int \widehat g(\xi') {\mathrm e}^{{\mathrm i}x'\cdot\xi'} {\,\mathrm d}\xi' =g(x').\] Weiterhin ist die Zuordnung \(g\mapsto f\) stetig zwischen Sobolevräumen. Mit der Fouriersche Inversionsformel folgt \[\begin{aligned} \widehat{f}(\xi) = (2\pi)^{-1/2} {\widehat g(\xi')} \int {\mathrm e}^{-{\mathrm i}x_n\xi_n} \theta(\langle\xi\rangle x_n){\,\mathrm d}x_n = \widehat g(\xi'){\langle\xi'\rangle^{-1}} {\widehat \theta(\langle\xi'\rangle^{-1} \xi_n)}\end{aligned}\] und somit \[\begin{aligned} % \left\|\left. f \,\right|\, \mathrm H^s({\mathbb R}^n) \right\| ^2 &= \iint \langle\xi\rangle^{2s} | \widehat g(\xi')|^2 {\langle\xi'\rangle^{-2}} |{\widehat \theta(\langle\xi'\rangle^{-1} \xi_n)}|^2 {\,\mathrm d}\xi'{\,\mathrm d}\xi_n \notag\\ &=\int |\widehat g(\xi')|^2 \langle\xi'\rangle^{2s-1} \int \langle t\rangle^{2s} |{\widehat \theta(t)}|^2 {\,\mathrm d}t {\,\mathrm d}\xi' \notag\\ &=C_s % \left\|\left. g \,\right|\, \mathrm H^{s-\frac 12}({\mathbb R}^{n-1}) \right\| \end{aligned}\] unter Ausnutzung der Substitution \(\xi_n = \langle\xi'\rangle t\). Damit ist aber obiger Fortsetzungsoperator stetig und liefert eine Rechtsinverse zum Spuroperator \(\gamma_0\). ◻
Nun noch der allgemeine Satz. Wir beschränken uns auf Gebiete mit glattem Rand , sonst kann man auf dem Rand selbst nicht alle Sobolevräume definieren.
Lemma 2.15. Seien \(\Omega\) und \(\tilde\Omega\) diffeomorphe Gebiete und \(\Phi : \Omega \to \tilde\Omega\) ein Diffeomorphismus mit \[0< c_0 \le | \det \Phi'(x) | \le C\] für alle \(x\in\Omega\) sowie \[\sup_{x\in\Omega} || \partial^\alpha \Phi(x) || <\infty \qquad\text{f\"ur alle $\alpha\in\mathbb N_0^n$}.\] Dann gibt es zu jedem \(s\in{\mathbb R}\) eine Konstante \(C_s\), so dass \[\frac1{C_s} % \left\|\left. f \,\right|\, \mathrm H^s(\tilde\Omega) \right\| \le % \left\|\left. f\circ\Phi \,\right|\, \mathrm H^s(\Omega) \right\| \le C_s % \left\|\left. f \,\right|\, \mathrm H^s(\tilde\Omega) \right\|\] für alle \(f\in\mathrm H^s(\tilde\Omega)\) gilt.
Beweisskizze. Ein Diffeomorphismus mit diesen Bedingungen ist in Umgebungen \(\Omega'\) und \(\tilde\Omega'\) der Gebiete \(\Omega\) und \(\tilde\Omega\) fortsetzbar. Wir nehmen eine in der Umgebung \(\tilde\Omega'\) von \(\tilde\Omega\) getragene Abschneidefunktion \(\chi\), welche auf \(\tilde\Omega\) identisch gleich \(1\) ist und betrachten die Fortsetzung \(\chi(x) \mathrm E^s_{\tilde\Omega} f (x)\in\mathrm H^s({\mathbb R}^n)\) und die entsprechend mit dem Diffeomorphismus transformierte Funktion \(\chi(\Phi(x)) \mathrm E^s_{\tilde\Omega} f (\Phi(x))\). Dabei ist nach Konstruktion \[\frac1{C_s'} \|\chi(x) \mathrm E^s_{\tilde\Omega} f (x)\|_{2,s} \le \| \mathrm E^s_{\tilde\Omega} f (x)\|_{2,s} = % \left\|\left. f \,\right|\, \mathrm H^s(\tilde \Omega) \right\| \le \| \chi(x) \mathrm E^s_{\tilde\Omega} f (x)\|_{2,s}\] und ebenso \[% \left\|\left. f\circ\Phi \,\right|\, \mathrm H^s(\Omega) \right\| \le \| \chi(\Phi(x)) \mathrm E^s_{\tilde\Omega} f (\Phi(x)) \|_{2,s}.\] Aus der Diffeomorphieäquivalenz der \(\mathrm H^s({\mathbb R}^n)\)-Norm würde also sofort \[% \left\|\left. f\circ\Phi \,\right|\, \mathrm H^s(\Omega) \right\| \le C_s % \left\|\left. f \,\right|\, \mathrm H^s(\tilde\Omega) \right\|\] folgen. Die andere Ungleichung ergibt sich direkt durch Nutzung des Diffeomorphismus \(\Phi^{-1}\).
Es bleibt die Äquivalenz der entsprechenden \(\mathrm H^s({\mathbb R}^n)\)-Normen zu zeigen. Für \(s=k\in\mathbb N\) folgt dies aus dem entsprechenden Resultat für \(\mathrm W^{k,2}({\mathbb R}^n)\), für \(s=-k\) aus Dualität. Die verbleibenden Fälle folgen daraus vermittels reeller oder komplexer Interpolation (siehe Kapitel 4). ◻
Damit kann man aber auf beliebigen Mannigfaltigkeiten Sobolevräume definieren, indem man diese mit einer Partition der Eins in Kartengebiete zerlegt und damit auf Gebiete des \({\mathbb R}^n\) reduziert. Mit dieser Definition gilt nun
Satz 2.17 ( Spursatz ). Sei \(\Omega\) ein Gebiet mit kompaktem \(\mathrm C^\infty\)-Rand \(\Gamma=\partial\Omega\). Dann ist für \(s>\frac12\) der Spuroperator \[\gamma_0 : \mathrm H^s(\Omega) \mapsto \mathrm H^{s-\frac12}(\Gamma)\] beschränkt und surjektiv.
Wir benötigen eine Anleihe aus der Funktionalanalysis. In einem (separablen) Hilbertraum \(\mathbb H\) ist die Einheitskugel schwach folgenkompakt, das heißt aus jeder Folge \(f_j\in\mathbb H\) mit \(% \left\|\left. f_j \,\right|\, \mathbb H \right\|\) kann eine Teilfolgen \(f_{j_k}\) ausgewählt werden, so dass \[% \left( f_{j_k}, g \right)_{\mathbb H} \to % \left( f,g \right)_{\mathbb H}\] für ein \(f\in\mathbb H\) und alle \(g\in\mathbb H\) gilt. Wir werden dies im folgenden nutzen um ein Kompaktheitskriterium für \(\mathrm H^s(\Omega)\)-Räume zu beweisen. Es sei noch darauf hingewiesen, dass für Banach- und Hilberträume Folgen- und Überdeckungskompaktheit äquivalent sind.
Ziel dieses Abschnitts ist der folgende Satz.
Satz 2.18 ( Rellich’scher Auswahlsatz 23). Sei \(\Omega\) beschränkt. Dann ist die Einbettung \(\mathrm H^s(\Omega)\to\mathrm L^2(\Omega)\) für \(s>0\) kompakt. Jede Folge \(f_n\in\mathrm H^s(\Omega)\) mit \(\sup_n% \left\|\left. f_n \,\right|\, \mathrm H^s(\Omega) \right\| <\infty\) besitzt also eine in \(\mathrm L^2(\Omega)\) konvergente Teilfolge.
Zum Beweis benötigen wir einen weitereren wichtiger Satz verpackt in folgendem Lemma.
Lemma 2.16 ( Kompaktheitskriterium im \(\mathrm L^2\) ). Sei \(h\in\mathrm C({\mathbb R}_+)\) positiv, monoton wachsend mit \(\lim_{r\to\infty} h(r) = \infty\). Dann ist die Teilmenge \[M_h = \{ f\in\mathrm L^2({\mathbb R}^n) : \int |f(x)|^2 h(|x|){\,\mathrm d}x\le 1\;\text{und}\; \int | \widehat f(\xi)|^2 h(|\xi|){\,\mathrm d}\xi\le 1 \}\] kompakt im \(\mathrm L^2({\mathbb R}^n)\).
Proof. Schritt 1: Sei \(f_j\in M_h\) eine Folge. Sei weiter in einem ersten Schritt mit gemeinsamem kompakten Träger \(\mathop{\mathrm{supp}}f_j\subseteq K\). Da \(\| f_j\|_2\le M\) gleichmäßig beschränkt ist, existiert eine in \(\mathrm L^2({\mathbb R}^n)\) schwach konvergente Teilfolge. Wir bezeichnen diese wieder mit \(f_{j}\). Für diese gilt (da \({\mathrm e}_\xi = x\mapsto {\mathrm e}^{{\mathrm i}x\cdot\xi}\in\mathrm L^2(K)\)) \[\begin{aligned} &|\widehat f_j(\xi)| = (2\pi)^{-n/2} | % \left( f_j, {\mathrm e}_\xi \right)_{\mathrm L^2(K)} | \le C \|f_j\|_2\le CM\\ &|\widehat f_j(\xi) - \widehat f_i(\xi)| = (2\pi)^{-n/2} | % \left( f_j- f_i, {\mathrm e}_\xi \right)_{\mathrm L^2(K)} | \to 0,\qquad i,j\to\infty.\end{aligned}\] Die Folge der Funktionen \(\widehat f_j(\xi)\) konvergiert also punktweise. Wir zeigen, dass damit auch \(f_j\) in \(\mathrm L^2({\mathbb R}^n)\) konvergiert. Dazu nutzen wir Plancherel und erhalten \[\begin{aligned} \| f_j - f_i\|_2^2 &= \|\widehat f_j - \widehat f_i\|_2^2 \notag\\ &=\int_{|\xi|\le r} |\widehat f_j(\xi)-\widehat f_i(\xi)|^2{\,\mathrm d}\xi + \int_{|\xi|>r} \frac1{h(|\xi|)} h(|\xi|) |\widehat f_j(\xi)-\widehat f_i(\xi)|^2{\,\mathrm d}\xi \notag\\ &\le \int_{|\xi|\le r} |\widehat f_j(\xi)-\widehat f_i(\xi)|^2{\,\mathrm d}\xi + \frac 4{h(r)}.\end{aligned}\] Da \(\widehat f_j(\xi)\) gleichmäßig beschränkt ist und punktweise konvergiert, strebt der erste Summand gegen Null für \(i,j\to\infty\). Für \(r\) groß wird der zweite beliebig klein. Damit ist aber \(f_j\) eine Cauchy-Folge in \(\mathrm L^2({\mathbb R}^n)\). Damit ist aber die Teilmenge \(M_{h,K}=\{ f\in M_h : \mathop{\mathrm{supp}}f\subseteq K\}\) kompakt.
Schritt 2: Sei \(B_r\) die Kugel vom Radius \(r\) und \(\chi_r\) eine in \(B_{2r}\) getragene Abschneidefunktion mit \(\chi(x)=1\) für \(x\in B_r\) und \(0\le\chi(x)\le1\). Dann gilt für alle \(f\in M_h\) \[\| f - \chi_r f \|_2^2 = \int_{|x|>r} | (1-\chi_r(x)) f(x)|^2 {\,\mathrm d}x \le \sup_{|x|>r} \frac {(1-\chi_r(x))^2}{h(|x|)} \le \frac1{h(r)}\] sowie unter Ausnutzung der Youngschen Ungleichung (und für moderat wachsende submultiplikative24 \(h\) mit \(h(|\xi|) \le C_h h(|\xi-\eta|) h(|\eta|)\)) \[\begin{aligned} \int h(|\xi|) |\widehat{\chi_r f}(\xi)|^2{\,\mathrm d}\xi &=c \int h(|\xi|) \left| \int \widehat {\chi_r}(\xi-\eta) \widehat f(\eta) {\,\mathrm d}\eta\right|^2{\,\mathrm d}\xi\notag\\ &=c \int \left| \int \sqrt{ h(|\xi-\eta|) } \widehat {\chi_r}(\xi-\eta) \sqrt{h(|\eta|)} \widehat f(\eta) {\,\mathrm d}\eta\right|^2{\,\mathrm d}\xi\notag\\ &\le cC_h \left(\int \sqrt{ h(|\xi|)} |\widehat{\chi_r}(\xi)|{\,\mathrm d}\xi\right)^2 \left(\int h(|\eta|) |\widehat f(\eta)|^2{\,\mathrm d}\eta\right) \notag\\& =C <\infty.\end{aligned}\] Damit existiert aber zu jedem \(\epsilon>0\) ein \(K\), so dass \(M_h\) in einer \(\epsilon\)-Umgebung der kompakten Menge \(C M_{h,K}\subset\mathrm L^2({\mathbb R}^n)\) liegt. Damit ist aber \(M_h\) selbst kompakt. ◻
Beweis des Auswahlsatzes von Rellich. Sei \(s>0\) und \(\Omega\subset{\mathbb R}^n\) beschränkt, sowie \(\chi\in\mathrm C_c^\infty({\mathbb R}^n)\) mit \(\chi(x)=1\) für \(x\in\Omega\). Sei weiter \(f_k\in\mathrm H^s(\Omega)\) mit \(% \left\|\left. f_k \,\right|\, \mathrm H^s(\Omega) \right\| \le 1\). Wir betrachten die Folge \(\tilde f_k(x) = \chi(x) \mathrm E^s_\Omega f_k(x)\in\mathrm H^s({\mathbb R}^n)\) mit gemeinsamem kompakten Träger. Auf diese Folge kann voriges Lemma angewandt werden, sie besitzt also eine in \(\mathrm L^2({\mathbb R}^n)\) konvergente Teilfolge. Die Einschränkung dieser Folge auf \(\Omega\) ist die gesuchte in \(\mathrm L^2(\Omega)\) konvergente Teilfolge von \(f_k\). ◻
Die Voraussetzung der Beschränktheit von \(\Omega\) ist nicht erforderlich. Wichtig ist ein gleichmäßiges Abklingen der Funktionen im Unendlichen. Wir formulieren wiederum einen Satz der sich direkt aus obigem Lemma ableiten läßt.
Satz 2.19 ( Rellich ). Angenommen, das Gebiet \(\Omega\) besitzt endliches Volumen, \(% \!\left\bracevert\!\Omega\!\right\bracevert\!\!<\infty\). Dann ist für \(s>0\) die Einbettung \(\mathrm H^s_{\overline\Omega} \to \mathrm L^2(\Omega)\) kompakt.
Proof. Wir zeigen die Aussage wiederum für \(s'=0\). Sei also \(f_k\in\mathrm H^s_{\overline\Omega}\) eine Folge mit \(% \left\|\left. f_k \,\right|\, \mathrm H^s({\mathbb R}^n) \right\| \le 1\). Wir wollen auf \(f_k\) obiges Lemma anwenden. Offenbar erfüllt \(\widehat{ f_k}(\xi)\) eine gewichtete \(\mathrm L^2({\mathbb R}^n)\)-Bedingung, (das ist ja gerade die Definition des \(\mathrm H^s({\mathbb R}^n)\)), es bleibt eine entsprechende Bedingung für \(f_k(x)\) zu zeigen. Dazu nutzen wir den Sobolevschen Einbettungssatz, es ist \(\| f_k\|_q<C\) beschränkt für \(2<q<\frac{2n}{n-2s}\) und damit nach Hölder \[\int_{|x|>r} | f_k(x)|^2{\,\mathrm d}x \le % \!\left\bracevert\!\Omega\setminus B_r(0)\!\right\bracevert\!\!^{1-2/q} \| f_k\|_q^2\to 0\] gleichmäßig in \(k\). Damit liegt \(f_k\) aber in einem gewichteten \(\mathrm L^2\) und das obige Lemma liefert die Existenz einer konvergenten Teilfolge. ◻
Für \(s>0\) und \(s\ne\frac12,\frac32,\ldots\), kann der Raum \(\mathrm H^s_{\overline\Omega}\) mit \(\mathrm H^s_0(\Omega)\) identifiziert werden. Dies wollen wir hier nicht zeigen, für einen Beweis siehe das Buch von McLean.
Zur Vollständigkeit noch folgender Satz. Er folgt aus dem Satz von Arzela–Ascoli und hätte ebenso zum Beweis verwendet werden können.
Satz 2.20 ( Fréchet–Kolmogorov–Riesz 25). Eine Teilmenge \(B\subset\mathrm L^p({\mathbb R}^n)\), \(1\le p<\infty\), ist relativ kompakt genau dann, wenn sie
beschränkt ist, \[\sup_{f\in B} \|f\|_p<\infty;\]
gleichmäßig abklingt, d.h., \[\lim_{R\to\infty} \sup_{f\in B} \int_{|x|\ge R} |f(x)|^p {\,\mathrm d}x = 0\] gilt; und
gleichgradig im \(p\)-Mittel stetig ist \[\lim_{h\to0} \sup_{f\in B} \int |f(x+h)-f(x)|^p {\,\mathrm d}x = 0.\]
Der Satz von Fréchet–Kolmogorov–Riesz impliziert insbesondere, dass die Einschränkungen \(\mathrm W^{s,p}({\mathbb R}^n) \to \mathrm L^p(\Omega)\) für \(s>0\) und beschränkte \(\Omega\) kompakt sind.
Damit kann man aber nun zeigen, dass alle Nicht-Grenzfälle des Sobolevschen Einbettungssatzes kompakt sind. Wir formulieren eine Fassung, überlassen den Beweis aber als Übung.
Satz 2.21 ( Rellich–Kondrachov 26). Sei das Gebiet \(\Omega\) beschränkt. Sei weiter für ein \(1\le p<\infty\) und \(s>0\) eine Folge \(f_j\in\mathrm W^{s,p}({\mathbb R}^n)\) mit \(\sup_j % \left\|\left. f_j \,\right|\, \mathrm W^{s,p}({\mathbb R}^n) \right\| <\infty\) gegeben.
Ist \(s>np\), so besitzt die Folge \(f_j|_{\overline\Omega}\) eine in \(\mathrm C(\overline\Omega)\) konvergente Teilfolge.
Ist \(s<np\) und \(p\le q<p^*=\frac{np}{n-sp}\). Dann besitzt die Folge \(f_j|_\Omega\) eine in \(\mathrm L^q(\Omega)\) konvergente Teilfolge.
Wir wollen kurz drei typische Anwendungen von Sobolevräumen skizzieren. Funktionen sind hier der Einfachheit halber reell.
Variationsproblem e. Sei \(\Omega\subset{\mathbb R}^n\) ein Gebiet mit glattem Rand und \(f\in\mathrm H^{\frac12}(\partial\Omega)\). Dann ist \(f\) Randwert einer Funktion \(\tilde f\in\mathrm H^1(\Omega)\) und wir können nach allen Funktionen \[u \in \tilde f + \mathrm H^1_0(\Omega)\] suchen, für die das Funktional \[J(u) = \sum_{j=1}^n \int_\Omega |\partial_j u(x)|^2{\,\mathrm d}x\] minimal wird. Ist das Gebiet \(\Omega\) beschränkt, so gilt für alle in Betracht kommenden \(u\) die Friedrichssche Ungleichung (siehe Übung) \[\int_\Omega |u(x)|^2{\,\mathrm d}x \le C J(u)\] und jede Minimalfolge für \(J(u)\) ist in \(\mathrm H^1(\Omega)\) beschränkt. Sie besitzt damit eine schwach konvergente Teilfolge und für deren schwachen Grenzwert \(u^*\) gilt \[J(u^*) \le J(u^*+\epsilon\varphi)\] für alle Testfunktionen \(\varphi\in\mathrm C_c^\infty(\Omega)\). Da die rechte Seite als Funktion von \(\epsilon\) differenzierbar ist, folgt daraus aber \[0 = \sum_{j=1}^n \int \partial_j u^*(x) \partial_j\varphi(x) {\,\mathrm d}x\] und damit ist \(u^*\) schwache Lösung des Randwertproblems \[\Delta u = 0,\qquad \gamma_0 u = f.\]
Dirichlet-Problem 27 für den Laplace-Operator. Das Dirichlet-Problem ist die Aufgabe, zu gegebenem \(f\) eine Funktion \(u\in\mathrm H^1_0(\Omega)\) mit \[\label{eq:2.5.7} \Delta u = f\] zu finden. Ist das Gebiet beschränkt, so gilt wiederum eine Friedrichssche Ungleichung 28 \[\int_\Omega |u(x)|^2{\,\mathrm d}x \le C J(u)\] für alle \(u\in\mathrm H^1_0(\Omega)\). Damit erzeugt aber das Innenprodukt \[( u,v )_\nabla = \sum_{j=1}^n \int_\Omega \partial_j u(x) \partial_j v(x) {\,\mathrm d}x\] die Hilbertraumstruktur des \(\mathrm H^1_0(\Omega)\). Weiß man nun, dass \(f\) durch \[\varphi \mapsto \int_\Omega \varphi(x) f(x) {\,\mathrm d}x\] eine stetige Linearform auf dem \(\mathrm H^1_0(\Omega)\) erzeugt (weil zum Beispiel \(f\in\mathrm L^2(\Omega)\) oder \(f\in\mathrm H^{-1}(\Omega)\) ist), so existiert nach dem Rieszschen Darstellungssatz genau ein \(u\) mit \[\label{eq:2.5.11} (u,\varphi)_\nabla = - \int_\Omega \varphi(x) f(x) {\,\mathrm d}x\] für alle \(\varphi\in\mathrm H^1_0(\Omega)\). Speziell für \(\varphi\in\mathrm C_c^\infty(\Omega)\) ist dies aber gerade die schwache Formulierung des Dirichlet-Problems und somit \(u\) dessen (eindeutig bestimmte) Lösung.
Neumann-Problem 29 für den Laplace-Operator. Betrachtet man die schwache Formulierung [eq:2.5.11] auf ganz \(\mathrm H^1(\Omega)\) und fordert die Gleichung für alle \(\varphi\in\mathrm H^1(\Omega)\), so ist das dabei entstehende Problem nicht eindeutig lösbar. Jede konstante Funktion \(u\) erfüllt die Bedingung.
Allerdings gilt für \(u\in\mathrm H^1(\Omega)\) auf beschränkten Gebieten \(\Omega\) eine Poincare-Ungleichung 30 \[\int_\Omega |u(x)-u_\Omega|^2{\,\mathrm d}x \le C \sum_{j=1}^n \int_\Omega |\partial_j u(x)|^2{\,\mathrm d}x,\qquad u_\Omega = \frac1{% \!\left\bracevert\!\Omega\!\right\bracevert\!\!} \int u(x){\,\mathrm d}x.\] Damit erzeugt das \(\nabla\)-Innenprodukt auf \(\mathrm H^1_{vm}(\Omega)=\{u\in\mathrm H^1(\Omega) : u_\Omega = 0\}\) die Hilbertraumstruktur und der Rieszsche Darstellungssatz impliziert die eindeutige Lösbarkeit von [eq:2.5.11] auf diesem Teilraum. Dieses Problem wird als Neumann-Problem für den Laplace-Operator bezeichnet.
Seine Lösung \(u\) ist bezüglich \(\Delta\) schwach differenzierbar und es gilt [eq:2.5.7]. Statt der Dirchlet-Randbedingung erfüllen die Lösungen aber eine sogenannte freie Randbedingung. Man kann zeigen, dass Lösungen im \(\mathrm H^2(\Omega)\) sind und am Rand die schwache äußere Normalenableitung verschwindet.
Hardyräume und Fourierreihen. Sei \(f\in\mathrm L^2(-\pi,\pi)\) gegeben. Dann besitzt \(f\) die Reihendarstellung \[\label{eq:3:FReihe} f(t) = \sum_{k\in\mathbb Z} c_k( f) {\mathrm e}^{{\mathrm i}kt}\] mit den komplexen Fourier-Koeffizienten \[c_k( f) = \frac1{{2\pi}} \int_{-\pi}^{\pi} \mathrm e^{- \mathrm ikt} f(t) {\,\mathrm d}t.\] Im folgenden betrachten wir den Teilraum \[\widetilde{\mathcal H}^2 = \{ f : \forall_{k<0}\; c_k( f)=0 \}.\] Wir schreiben im folgenden kurz \(c_k\) für die Koeffizienten \(c_k(f)\).
Betrachtet man statt der reellen Variablen \(t\) die komplexe Variable \(z = {\mathrm e}^{{\mathrm i}t}\), so wird die Fourierreihe [eq:3:FReihe] formal zur Potenzreihe \[\varphi(z) = \sum_{k=0}^\infty c_k z^k.\] Diese Potenzreihe hat Konvergenzradius größer oder gleich 1, da für die Fourier-Koeffizienten die Abschätzung \[|c_k( f)| \le \frac1{2\pi} \int_{-\pi}^\pi |f(t)|{\,\mathrm d}t \le \frac1{\sqrt{2\pi}} \| f\|_2\] und somit für ihren Konvergenzradius \[\frac1R = \limsup_{k\to\infty} \sqrt[k]{|c_k|} \le 1\] gil. Sie stellt damit eine analytische Funktion auf \(\mathbb D = \{ z\in{\mathbb C}: |z|<1\}\) dar. Wir bezeichnen die Menge der so erhaltenen analytischen Funktionen mit \(\mathcal H^2(\mathbb D)\).
Weiter bezeichne \(\mathcal A(\mathbb D)\) die Menge aller auf der offenen Kreisscheibe \(\mathbb D\) holomorphen Funktionen.
Lemma 3.1. Der Raum \(\mathcal H^2(\mathbb D)\) besteht aus allen \(\varphi\in\mathcal A(\mathbb D)\) mit \[\label{eq:3:H2-cond} \sup_{r<1} \int_{-\pi}^\pi |\varphi(r {\mathrm e}^{{\mathrm i}t})|^2 {\,\mathrm d}t <\infty.\] Weiterhin gilt \[\label{eq:3.1.7} \lim_{r \to 1} \varphi(r {\mathrm e}^{{\mathrm i}t} ) = f(t)\] in \(\mathrm L^2(-\pi,\pi)\).
Proof. Sei \(\varphi\in\mathcal A(\mathbb D)\) mit der MacLaurin-Reihe \(\varphi(z) = \sum_{k=0}^\infty c_k z^k\). Dann gilt für alle \(r<1\) auf Grund der Parseval-Identität 31 für Fourierreihen \[\int_{-\pi}^\pi |\varphi(r {\mathrm e}^{{\mathrm i}t} )|^2 {\,\mathrm d}t = 2\pi \sum_{k=0}^\infty |c_k|^2 r^{2k}.\] Mit dem Satz über die monotone Konvergenz (angewandt auf Reihen) folgt also \[\sup_{r<1} \int_{-\pi}^\pi |\varphi(r {\mathrm e}^{{\mathrm i}t} )|^2 {\,\mathrm d}t = 2\pi\lim_{r\to1} \sum_{k=0}^\infty |c_k|^2 r^{2k} = 2\pi \sum_{k=0}^\infty |c_k|^2\] und [eq:3:H2-cond] ist äquivalent zu \[\sum_{k=0}^\infty |c_k|^2<\infty,\qquad\text{d.h.}\quad f(t) = \sum_{k=0}^\infty c_k {\mathrm e}^{{\mathrm i}kt}\in\mathrm L^2(-\pi,\pi).\]
Weiterhin folgt aus dem Satz über die majorisierte Konvergenz \[\int | \varphi(r{\mathrm e}^{{\mathrm i}t}) - f(t)|^2{\,\mathrm d}t = 2\pi \sum_{k=0}^\infty (r^k-1)^2 |c_k|^2 \to 0,\qquad r\to1\] und das Lemma ist bewiesen. ◻
Der Hardy-Raum 32 \(\mathcal H^2(\mathbb D)\) besteht also gerade aus all den analytischen Funktionen in \(\mathbb D\), die ihre Randwerte auf \(\mathbb T=\partial\mathbb D\) im \(\mathrm L^2\)-Sinne annehmen. Die Cauchysche Integralformel erlaubt natürlich die Rekonstruktion der Funktion aus ihren Randwerten (warum?), allerdings ist für unsere Zwecke die nachfolgende Poissonsche Integraldarstellung 33 besser.
Sei \(g\) analytisch in einer Umgebung von \(\overline{\mathbb D}\). Dann gilt \[\label{eq:3:Poisson-Komplex} g(z) = \frac1{2\pi} \int_{-\pi}^\pi \frac{{\mathrm e}^{{\mathrm i}\theta}+z}{{\mathrm e}^{{\mathrm i}\theta}-z} \Re g({\mathrm e}^{{\mathrm i}\theta}){\,\mathrm d}\theta + {\mathrm i}\Im g(0).\] Der dabei auftretende Integralkern wird als komplexer Poissonkern bezeichnet.
Proof. Es gilt mit der Formel für die geometrische Reihe \[\frac{{\mathrm e}^{{\mathrm i}\theta}+z}{{\mathrm e}^{{\mathrm i}\theta}-z} =\frac{1+ z{\mathrm e}^{-{\mathrm i}\theta}}{1-z{\mathrm e}^{-{\mathrm i}\theta}} = 1 + 2\sum_{k=1}^\infty z^k {\mathrm e}^{-{\mathrm i}k\theta}\] lokal gleichmäßig in \(|z|< 1\) und \(\theta\in{\mathbb R}\). Ist nun \(g(z) = \sum_{k=0}^\infty c_k z^k\), so folgt \[\begin{aligned} \frac1{2\pi} \int_{-\pi}^\pi {\mathrm e}^{-{\mathrm i}n\theta} \Re g({\mathrm e}^{{\mathrm i}\theta}){\,\mathrm d}\theta &= \frac1{4\pi} \int_{-\pi}^\pi {\mathrm e}^{-{\mathrm i}n\theta} \big( g({\mathrm e}^{{\mathrm i}\theta}) + \overline{g({\mathrm e}^{{\mathrm i}\theta})}\big){\,\mathrm d}\theta \notag\\ &= \sum_{k=0}^\infty \frac1{4\pi} \int_{-\pi}^\pi {\mathrm e}^{-{\mathrm i}n\theta} \big( c_k{\mathrm e}^{{\mathrm i}k\theta} + \overline c_k {\mathrm e}^{-{\mathrm i}k\theta}\big) {\,\mathrm d}\theta \notag\\ &=\begin{cases} \Re c_0 ,\qquad &n=0,\\ \frac 12 c_n,\qquad &n=1,2,\ldots. \end{cases}\end{aligned}\] und somit \[\begin{aligned} \frac1{2\pi} \int_{-\pi}^\pi \frac{{\mathrm e}^{{\mathrm i}\theta}+z}{{\mathrm e}^{{\mathrm i}\theta}-z} \Re g({\mathrm e}^{{\mathrm i}\theta}){\,\mathrm d}\theta &= \Re c_0 +\frac1{\pi} \sum_{k=1}^\infty z^k \int_{-\pi}^\pi {\mathrm e}^{-{\mathrm i}k\theta} \Re g({\mathrm e}^{{\mathrm i}\theta}){\,\mathrm d}\theta\notag\\ &= g(z) - {\mathrm i}\Im c_0 = g(z) - {\mathrm i}\Im g(0). \end{aligned}\] Damit ist die (komplexe) Poissonsche Integralformel gezeigt. ◻
Im folgenden bezeichne \[P_r(t-\theta) = \Re\left(\frac{{\mathrm e}^{{\mathrm i}\theta}+r{\mathrm e}^{{\mathrm i}t}}{{\mathrm e}^{{\mathrm i}\theta}-r{\mathrm e}^{{\mathrm i}t}}\right)\] den reellen Poissonkern . Damit gilt \[\Re g(z) = \frac1{2\pi} \int_{-\pi}^\pi P_r(t-\theta) \Re g({\mathrm e}^{{\mathrm i}\theta}){\,\mathrm d}\theta\] und somit wegen \(\Im g = \Re(-{\mathrm i}g)\) auch \[\Im g(z) = \frac1{2\pi} \int_{-\pi}^\pi P_r(t-\theta) \Im g({\mathrm e}^{{\mathrm i}\theta}){\,\mathrm d}\theta.\] Nach Addition beider Formeln erhält man die reelle Poissonsche Integralformel \[\label{eq:3:PoissonInt} g(r{\mathrm e}^{{\mathrm i}t}) = \frac1{2\pi} \int_{0}^{2\pi} P_r(t-\theta) g({\mathrm e}^{{\mathrm i}\theta}) {\,\mathrm d}\theta\] für alle in einer Umgebung von \(\overline{\mathbb D}\) analytische Funktionen. Diese wird im folgenden von besonderer Bedeutung sein, der Poissonkern ist dabei nur nur reellwertig sondern besitzt darüberhinaus besondere Approximationseigenschaften.
Lemma 3.2 ( Eigenschaften des Poissonkerns ). Es gelten
die Darstellung \[P_r(t) = \frac{1-r^2}{1-2r\cos t+r^2}\] und damit \(P_r(t)>0\) für alle \(r<1\) und alle \(t\);
die Integralformeln \[\frac1{2\pi} \int_{-\pi}^\pi P_r(t){\,\mathrm d}t = 1,\qquad \frac1{2\pi} \int_{-\pi}^\pi |P_r(t)|^2{\,\mathrm d}t = \frac{1+r^2}{1-r^2};\]
für jedes \(\delta>0\) gilt \[\lim_{r\to1} \sup_{t\in[\delta,\pi]} P_r(t) = 0;\]
für jede stetige Funktion \(f\in\mathrm C_{per}(-\pi,\pi)\) gilt \[\lim_{r\to1} \int_{-\pi}^\pi P_r(t) f(t){\,\mathrm d}t = 2\pi f(0).\]
(Beweis als Übung)
Satz 3.1 ( Poissonsche Integraldarstellung ). Sei \(\varphi\in\mathcal H^2(\mathbb D)\) und sei \(f\in\widetilde{\mathcal H}^2\) durch [eq:3.1.7] definiert. Dann gilt die Poissonsche Integralformel \[%\label{eq:3:PoissonInt} \varphi(r{\mathrm e}^{{\mathrm i}t}) = \frac1{2\pi} \int_{0}^{2\pi} P_r(t-\theta) f(\theta) {\,\mathrm d}\theta.\]
Proof. Es gilt für \(\rho<1\) und \(r<1\) die Poissonsche Integralformel (für \(\varphi(\rho z)\)) \[\varphi(r\rho{\mathrm e}^{{\mathrm i}t}) = \frac1{2\pi} \int_{-\pi}^\pi P_r(t-\theta) \varphi(\rho{\mathrm e}^{{\mathrm i}\theta}){\,\mathrm d}\theta.\] Weiterhin gilt \(P_r\in\mathrm L^2(-\pi,\pi)\) und somit kann der Grenzwert für \(\rho\to1\) gebildet werden; es gilt \[\begin{gathered} \varphi(r{\mathrm e}^{{\mathrm i}t}) = \lim_{\rho\to1} \varphi(r\rho{\mathrm e}^{{\mathrm i}t}) = \lim_{\rho\to1} \frac1{2\pi} \int_{-\pi}^\pi P_r(t-\theta) \varphi(\rho{\mathrm e}^{{\mathrm i}\theta}){\,\mathrm d}\theta\\ = \frac1{2\pi} \int_{0}^{2\pi} P_r(t-\theta) f(\theta) {\,\mathrm d}\theta.\end{gathered}\] unter Ausnutzung von \(\varphi(\rho{\mathrm e}^{{\mathrm i}\cdot}) \to f\) in \(\mathrm L^2(-\pi,\pi)\). ◻
Für \(p\ne 2\) definiert man die Hardyräume entsprechend durch gleichmäßige Schranken an die \(p\)-Normen über konzentrische Kreise in \(\mathbb D\).
Definition 3.1. Sei nun \(p\in[1,\infty)\). In Analogie zum letzten Abschnitt definieren wir den Raum \(\mathcal H^p(\mathbb D)\) durch die Forderung \[% \left\|\left. \varphi \,\right|\, \mathcal H^p(\mathbb D) \right\| = \sup_{r<1} \left(\int_{-\pi}^\pi |\varphi(r {\mathrm e}^{{\mathrm i}t})|^p{\,\mathrm d}t\right)^{1/p} < \infty ,\qquad p<\infty\] für analytische Funktionen \(\varphi\in\mathcal A(\mathbb D)\). Weiter sei \(\mathcal H^\infty(\mathbb D)\) die Menge der beschränkten analytischen Funktionen aus \(\mathcal A(\mathbb D)\), \[% \left\|\left. \varphi \,\right|\, \mathcal H^\infty(\mathbb D) \right\| = \sup_{z\in\mathbb D} | \varphi(z) |.\]
Es gilt folgender (auf den ersten Blick vielleicht überraschende) Satz. Die Voraussetzung \(\varphi\in\mathcal A(\mathbb D)\) ist in jedem Schritt notwendig, nicht jede durch ein Poissonintegral dargestellte Funktion ist auch holomorph. (Dazu muß der Randwert zum reellen Hardyraum \(\widetilde{\mathcal H}^p\) gehören, siehe Abschnitt 3.2.1).
Satz 3.2 ( Randwertcharakterisierung des \(\mathcal H^p(\mathbb D)\) ). Sei \(1< p<\infty\). Dann sind äquivalent
\(\varphi\in\mathcal A(\mathbb D)\) und es gilt \[\label{eq:3.1.18} w-\lim_{r\to1} \varphi(r{\mathrm e}^{{\mathrm i}t}) = f(t)\] schwach in \(\mathrm L^p(-\pi,\pi)\).
\(\varphi\in\mathcal A(\mathbb D)\) und es gilt \[\varphi(r{\mathrm e}^{{\mathrm i}t}) = \frac1{2\pi} \int_{0}^{2\pi} P_r(t-\theta) f(\theta) {\,\mathrm d}\theta\] für ein \(f\in\mathrm L^p(-\pi,\pi)\).
\(\varphi\in\mathcal A(\mathbb D)\) und es gilt \[%\label{eq:3.1.18} \lim_{r\to1} \varphi(r{\mathrm e}^{{\mathrm i}t}) = f(t)\] in der \(\mathrm L^p\)-Norm.
\(\varphi\in\mathcal H^p(\mathbb D)\).
Beweisskizze. \([1\to2]\) Für analytische Funktionen \(\varphi\in\mathcal A(\mathbb D)\) gilt die (skalierte) Poissonsche Integralformel \[\varphi(\rho r {\mathrm e}^{{\mathrm i}t}) = \frac1{2\pi} \int_{-\pi}^\pi P_\rho(t-\theta) \varphi( r{\mathrm e}^{{\mathrm i}\theta}){\,\mathrm d}\theta\] für alle \(\rho<1\) und \(r<1\). Da der Poissonkern zu \(\mathrm L^{p'}(-\pi,\pi)\) gehört, impliziert schwache Konvergenz punktweise in \(\rho\) und \(t\) \[\varphi(\rho {\mathrm e}^{{\mathrm i}t}) = \lim_{r\to1} \varphi(\rho r {\mathrm e}^{{\mathrm i}t}) = \frac1{2\pi} \int_{-\pi}^\pi P_\rho(t-\theta) f (\theta) {\,\mathrm d}\theta\] und damit [2].
\([2\to3]\) Der Poissonkern ist positiv und hat Integral 1. Damit gilt mit der Minkowski-Ungleichung für Integrale \[\begin{aligned} \| f - \varphi(r {\mathrm e}^{{\mathrm i}\cdot}) \|_p &= \left\| \frac1{2\pi} \int_{-\pi}^\pi P_r(\theta) ( f(t) - f(t-\theta) ) {\,\mathrm d}\theta \right\|_p \notag\\&\le \frac1{2\pi} \int_{-\pi}^\pi P_r(\theta) \| f - f(\cdot -\theta) \|_p {\,\mathrm d}\theta \notag\\ &\le \frac1{2\pi} ( \int_{|\theta|\ge \delta} + \int_{|\theta|\le \delta} ) P_r(\theta) \| f - f(\cdot -\theta) \|_p {\,\mathrm d}\theta.\end{aligned}\] Das erste Integral strebt gegen Null, da \(P_r(\theta)\to 0\) gleichmäßig in \(|\theta|\ge \delta\) für \(r\to 1\). Wegen der Stetigkeit im \(p\)-Mittel kann man das zweite Integral durch \[\frac1{2\pi} \int_{|\theta|\le \delta} P_r(\theta) \| f - f(\cdot -\theta) \|_p {\,\mathrm d}\theta \le \sup_{|\theta|<\delta} \| f - f(\cdot -\theta) \|_p \to 0,\qquad \delta\to0\] abschätzen. Damit folgt aber [3].
\([3\to4]\) folgt, da normkonvergente Folgen auch in der Norm beschränkt sind.
\([4\to1]\) Da \(\mathrm L^p(-\pi,\pi)\) separabel und reflexiv ist, besitzt jede beschränkte Folge eine schwach konvergente Teilfolge (Satz von Banach-Alaoglu in separablen Räumen). Für diese Teilfolge kann man die Argumentation aus dem ersten Schritt anwenden, es gilt also die Poissonsche Integraldarstellung von \(\varphi\) durch den schwachen Grenzwert. Da dieser damit aber auch (starker) Randwert ist, sind die schwachen Grenzwerte eindeutig und die schwache Konvergenz folgt. ◻
Bemerkung: Für \(p=1\) scheint die Aussage falsch. Um obige Beweismethode zu retten, muss man hier in der Poissonschen Integraldarstellung [eq:3:PoissonInt] Maße statt Funktionen \(f\) zulassen. Dann gilt \[\varphi(r{\mathrm e}^{{\mathrm i}t}) = \frac1{2\pi} \int_{-\pi}^\pi P_r(t-\theta) {\,\mathrm d}\mu(\theta)\] mit einem (eindeutig bestimmten) komplexwertigen Maß \(\mu\) und \(\varphi(r{\mathrm e}^{{\mathrm i}t})\stackrel{*}{\rightharpoonup} \mu(t)\) für \(r\to1\) als schwach-* Grenzwert im Raum der beschränkten Radonmaße. Zum Beweis genügt wiederum der Satz von Alaoglu, allerdings diesmal im Raum der Maße, in welchen \(\mathrm L^1\) stetig eingebettet ist. Der \(\mathrm L^1\) ist bezüglich schwach-* Konvergenz nicht abgeschlossen. Das täuscht, wir werden im nächsten Abschnitt zeigen, dass selbst im \(\mathcal H^1(\mathbb D)\) Randwerte im \(\mathrm L^1\)-Sinn angenommen werden.
Wir beginnen mit einem auf den ersten Blick technisch erscheinenden Lemma. Es wird uns helfen, Abschätzungen für Nullstellen analytischer Funktionen anzugeben.
Lemma 3.3 ( Jensensche Formel 34). Sei \(\varphi\) analytisch mit Konvergenzradius größer \(r\), \(\varphi(0)\ne0\), und seien \(\alpha_1,\ldots, \alpha_N\) die Nullstellen von \(\varphi\) gezählt mit Vielfachheit. Dann gilt \[|\varphi(0)| \prod_{k=1}^N \frac{r}{|\alpha_k|} = \exp\left( \frac1{2\pi} \int_{-\pi}^{\pi} \log | \varphi(r {\mathrm e}^{{\mathrm i}t})|{\,\mathrm d}t\right).\]
Proof. Sei \(|\alpha_k|<r\) für \(k\le m\) und \(|\alpha_{m+1}|=\cdots=|\alpha_N|=r\). Dann ist \[\psi(z) = \varphi(z) \prod_{k=1}^m \frac{r^2-\overline\alpha_k z}{r(\alpha_k-z)} \prod_{k=m+1}^N \frac{\alpha_k}{\alpha_k-z}\] analytisch in einer Umgebung der Kreisscheibe \(|z|\le r\) und nach Konstruktion nullstellenfrei. Also ist auch die Funktion \(\log\psi(z)\) analytisch und es gilt mit der Mittelwerteigenschaft für deren Realteil \(\log|\psi(z)|\) \[\log |\psi(0)| = \frac{1}{2\pi} \int_{-\pi}^{\pi} \log| \psi(r {\mathrm e}^{{\mathrm i}t})| {\,\mathrm d}t.\] Weiter ist \[|\psi(0)| = |\varphi(0)| \prod_{k=1}^m \frac{r}{|\alpha_k|} = |\varphi(0)| \prod_{k=1}^N \frac{r}{|\alpha_k|}\] und mit \(\alpha_k=r{\mathrm e}^{{\mathrm i}t_k}\), \(k>m\), \[\log|\psi(r{\mathrm e}^{{\mathrm i}t})| = \log|\varphi(r {\mathrm e}^{{\mathrm i}t})| - \sum_{k=m+1}^N \log| 1-{\mathrm e}^{{\mathrm i}(t-t_k)}|.\] Die Behauptung folgt damit aus \[\int_{-\pi}^\pi \log| 1-{\mathrm e}^{{\mathrm i}t}| {\,\mathrm d}t = \Im \int_{\mathbb T} \frac{ \log(1-z) }z {\,\mathrm d}z = 0.\] ◻
Korollar 3.1. Sei \(\varphi\in\mathcal A(\mathbb D)\). Dann gilt für alle \(r<1\) \[\log |\varphi(0)| \le \frac1{2\pi} \int_{-\pi}^\pi \log |\varphi(r {\mathrm e}^{{\mathrm i}t})| {\,\mathrm d}t.\]
Proof. In der Jensenschen Formel ist \(\prod_{k} \frac{r}{|\alpha_k|}\ge 1\). ◻
Korollar 3.2. Sei \(\varphi\in\mathcal A(\mathbb D)\). Dann ist für alle monoton wachsenden konvexen Funktionen \(\Phi:{\mathbb R}\to{\mathbb R}\) das Integral \[\frac1{2\pi} \int_{-\pi}^\pi \Phi( \log |\varphi(r {\mathrm e}^{{\mathrm i}t})| ) {\,\mathrm d}t\] monoton wachsend bezüglich \(r\).
Beweisskizze. Die Mittelwerteigenschaft charakterisiert harmonische Funktionen. Damit impliziert das vorige Korollar, dass \(\log|\varphi(z)|\) stets kleiner ist als die durch die Randwerte \(\log|\varphi(r{\mathrm e}^{{\mathrm i}t})|\) auf dem Kreis \(|z|\le r\) definierte harmonische Funktion. Also gilt \[\log |\varphi(r\rho{\mathrm e}^{{\mathrm i}t})| \le \frac1{2\pi} \int_{-\pi}^\pi P_r(t-\theta) \log |\varphi(\rho {\mathrm e}^{{\mathrm i}\theta})| {\,\mathrm d}\theta.\] Die Jensensche Ungleichung für konvexe Funktionen impliziert damit aber (wegen \(P_r(t)>0\) und \(\int P_r(t){\,\mathrm d}t= 2\pi\)) zusammen mit der Monotonie von \(\Phi\) \[\begin{aligned} \Phi(\log |\varphi(r\rho{\mathrm e}^{{\mathrm i}t})|) &\le \Phi\left( \frac1{2\pi} \int_{-\pi}^\pi \log |\varphi(r {\mathrm e}^{{\mathrm i}t})| {\,\mathrm d}t \right)\notag\\&\le \frac1{2\pi} \int_{-\pi}^\pi P_r(t-\theta) \Phi( \log |\varphi(\rho {\mathrm e}^{{\mathrm i}\theta})| ) {\,\mathrm d}\theta,\end{aligned}\] und somit nach nochmaliger Integration und Vertauschen der Integrationsreihenfolge die Behauptung, \[\int_{-\pi}^\pi \Phi(\log |\varphi(r \rho{\mathrm e}^{{\mathrm i}t})|) \le \int_{-\pi}^\pi \underbrace{\bigg( \frac1{2\pi} \int_{-\pi}^\pi P_r(t-\theta){\,\mathrm d}t \bigg)}_{=1}\;\Phi( \log |\varphi(\rho {\mathrm e}^{{\mathrm i}\theta})| ) {\,\mathrm d}\theta\] ◻
Korollar 3.3. Sei \(\varphi\in\mathcal H^p(\mathbb D)\) mit \(p\in(1,\infty)\) und \(f\in\widetilde{\mathcal H}^p\) der zugehörige Randwert. Dann gilt \[\label{eq:H=Lp} % \left\|\left. \varphi \,\right|\, \mathcal H^p(\mathbb D) \right\| = \sup_{r<1} \left( \int_{-\pi}^\pi |\varphi(r{\mathrm e}^{{\mathrm i}t})|^p {\,\mathrm d}t\right)^{1/p} = \| f\|_p.\]
Proof. Die Funktion \(s\mapsto {\mathrm e}^{p s}\) ist konvex für alle in Betracht kommenden \(p\), also ist das Supremum tatsächlich ein Limes. Da wir schon wissen, dass Randwerte in \(\mathrm L^p\) angenommen werden, folgt die Behauptung. ◻
Wir betrachten zuerst einen Raum der analog zu Hardy-Räumen definiert ist und Aussagen über die Verteilung der Nullstellen erlaubt. Hier und im folgenden bezeichne \(\log^+(s)=\max\{0,\log s\}\).
Definition 3.2. Mit \(\mathcal N(\mathbb D)\) bezeichnen wir die Menge aller analytischen Funktionen \(\varphi\in\mathcal A(\mathbb D)\) mit \[\label{eq:3:N-bound} \sup_{\rho<1} \exp\left( \int_{-\pi}^\pi \log^+|\varphi(\rho{\mathrm e}^{{\mathrm i}t}) |{\,\mathrm d}t \right) < \infty .\]
Die Menge \(\mathcal N(\mathbb D)\) wird als Nevanlinna-Klasse 35 bezeichnet. Es gilt \(\mathcal H^\infty(\mathbb D) \subset \mathcal H^p(\mathbb D) \subset\mathcal N(\mathbb D)\) für alle \(p\).
Satz 3.3 ( Konvergenz von Blaschkeprodukten ). Sei \(\varphi\in\mathcal N(\mathbb D)\) und sei \(\alpha_k\in\mathbb D\) die Folge der von Null verschiedenen Nullstellen der Funktion \(\varphi\). Dann gilt \[\prod_k |\alpha_k| > 0\qquad\left(\text{d.h.,}\qquad \sum_k (1-|\alpha_k|)<\infty\right)\] und das unendliche Blaschke-Produkt 36 \[\label{eq:3-Blaschke} B(z) = \prod_{k} \frac{\alpha_k-z}{1-\overline{\alpha_k}z}\frac{|\alpha_k|}{\alpha_k}\] konvergiert lokal gleichmäßig in \(\mathbb D\) und definiert eine Funktion aus \(\mathcal H^\infty(\mathbb D)\).
Proof. Hat \(\varphi\) in \(z=0\) eine Nullstelle der Ordnung \(m\), so betrachten wir \(z^{-m}\varphi(z)\), was wiederum zu \(\mathcal N(\mathbb D)\) gehört. Wir können also annehmen, dass \(\varphi(0)\ne0\) gilt. Sei weiter \(n( r)\) die Zahl der Nullstellen vom Betrag kleiner oder gleich \(r\) und seien die Nullstellen vom Betrag her geordnet. Dann gilt mit der Jensenschen Formel \[|\varphi(0)| \prod_{k=1}^{n( r)}\frac{ r}{|\alpha_k|} = \exp\left(\frac1{2\pi} \int_{-\pi}^{\pi} \log| \varphi( r{\mathrm e}^{{\mathrm i}t})| {\,\mathrm d}t \right) .\] Nach Voraussetzung ist die rechte Seite gleichmäßig in \(r\) beschränkt. Es gibt also eine Konstante \(C\), so dass für \(n\le n(r)\) \[|\varphi(0)| \prod_{k=1}^n \frac{ r}{|\alpha_k|} \le |\varphi(0)| \prod_{k=1}^{n( r)}\frac{ r}{|\alpha_k|} \le C\] und damit \[\prod_{k=1}^n |\alpha_k| \ge C^{-1} |\varphi(0)| r^n.\] Mit \(n\to\infty\) folgt die erste Behauptung.
Betrachtet man nun endliche Blaschke-Produkte, so gilt für alle \(|z|\le r<1\) und hinreichend große \(k\) \[\log \prod_{k} \frac{\alpha_k-z}{1-\overline{\alpha_k}z} \frac{|\alpha_k|}{\alpha_k}= \sum_{k} \log\frac{\alpha_k-z}{1-\overline{\alpha_k}z}\frac{|\alpha_k|}{\alpha_k}\] und \[\begin{gathered} \left| \log\frac{\alpha_k-z}{1-\overline{\alpha_k}z}\frac{|\alpha_k|}{\alpha_k}\right| \le c \left| 1 - \frac{\alpha_k-z}{1-\overline{\alpha_k}z}\frac{|\alpha_k|}{\alpha_k}\right| \\= c \left| \frac{\alpha_k+|\alpha_k|z}{(1-\overline{\alpha_k }z)\alpha_k}\right| (1-|\alpha_k|) \le c \frac{1+ r}{1- r} (1-|\alpha_k|).\end{gathered}\] Damit konvergiert aber die Reihe der Logarithmen auf jedem Kreis \(|z|\le r\) für \(r<1\) gleichmäßig und somit auch das unendliche Produkt. Weiterhin sind alle Faktoren betragsmäßig kleiner \(1\) und damit \(|B(z)| \le 1\). ◻
Lemma 3.4. Sei \(B\in \mathcal H^\infty(\mathbb D)\) ein Blaschke-Produkt. Dann gilt \[\lim_{r\to1} |B(r{\mathrm e}^{{\mathrm i}t})| =1\] in \(\mathrm L^p(-\pi,\pi)\) für alle \(1<p<\infty\).
Proof. Für endlich viele Nullstellen ist die Aussage trivial, wir nehmen also an, dass \(B(z)\) unendlich viele Nullstellen in \(\mathbb D\) besitzt. Da \(|B(z)|\le 1\) gilt, folgt die Behauptung aus \[% \left\|\left. B \,\right|\, \mathcal H^p(\mathbb D) \right\| ^p = \lim_{r\to1} \int_{-\pi}^\pi | B(r{\mathrm e}^{{\mathrm i}t})|^p{\,\mathrm d}t = 2\pi\] für \(p<\infty\). Wir nutzen die Monotonie des Integrals bezüglich \(r\), \[% \left\|\left. B \,\right|\, \mathcal H^p(\mathbb D) \right\| ^p \ge 2\pi |B(0)|^p.\] Schreibt man nun \(B(z) = B_n(z)R_n(z)\) mit \(B_n(z)\) dem Blaschke-Produkt über die ersten \(n\) betragsmäßig kleinsten Nullstellen \(\alpha_1,\ldots,\alpha_n\), so gilt \[|R_n(0)|=|\alpha_{n+1}\alpha_{n+2}\cdots|\] und wegen \(B_n({\mathrm e}^{{\mathrm i}t})=1\) \[% \left\|\left. B \,\right|\, \mathcal H^p(\mathbb D) \right\| ^p = % \left\|\left. R_n \,\right|\, \mathcal H^p(\mathbb D) \right\| ^p \ge 2\pi |R_n(0)|^p = 2\pi |\alpha_{n+1}\alpha_{n+2}\cdots|^p.\] Für \(n\to\infty\) strebt das Produkt der Nullstellen gegen \(1\) und die Behauptung folgt. ◻
Damit kommen zu einigen Hauptresultaten über Hardy-Räume.
Korollar 3.4 ( Faktorisierung von Hardy-Funktionen ). Sei \(\varphi \in\mathcal H^p(\mathbb D)\), \(p\in[1, \infty)\), und \(B\in\mathcal H^\infty(\mathbb D)\) das Blaschke-Produkt über die Nullstellen von \(\varphi\). Dann ist der Quotient \(\psi = \varphi / B \in\mathcal H^p(\mathbb D)\) eine Hardy-Funktion ohne Nullstellen mit \(% \left\|\left. \psi \,\right|\, \mathcal H^p \right\| = % \left\|\left. \varphi \,\right|\, \mathcal H^p \right\|\).
Proof. Wir nutzen die Zerlegung von \(B(z)\) des letzten Beweises und schreiben \(\varphi(z) = B_n(z) R_n(z) \psi(z)\) mit einer offenbar holomorphen Funktion \(\psi\in\mathcal A(\mathbb D)\). Damit ist (wegen der Monotonie des Integrals bezüglich \(r\) und \(|B_n(r{\mathrm e}^{{\mathrm i}t})|\to1\) gleichmäßig in \(t\) für \(r\to1\)) \[% \left\|\left. \varphi \,\right|\, \mathcal H^p \right\| ^p = \lim_{r\to1} \int_{-\pi}^\pi |\varphi(r{\mathrm e}^{{\mathrm i}t})|^p{\,\mathrm d}t = % \left\|\left. R_n\psi \,\right|\, \mathcal H^p \right\| ^p.\] Da weiterhin \(|R_n(z)\psi(z)|\) punktweise monoton gegen \(|\psi(z)|\) strebt, folgt mit dem Satz über monotone Konvergenz für \(r<1\) \[\int_{-\pi}^\pi |\psi(r{\mathrm e}^{{\mathrm i}t})|^p {\,\mathrm d}t = \sup_n \int_{-\pi}^\pi |R_n(r{\mathrm e}^{{\mathrm i}t}) \psi(r{\mathrm e}^{{\mathrm i}t})|^p {\,\mathrm d}t \le % \left\|\left. \varphi \,\right|\, \mathcal H^p \right\| ^p % \tnorm{\psi}{\mathcal H^p} = \sup_n \tnorm{R_n\psi}{\mathcal H^p} = \tnorm{\varphi}{\mathcal H^p} .\] und damit \(% \left\|\left. \psi \,\right|\, \mathcal H^p \right\| \le % \left\|\left. \varphi \,\right|\, \mathcal H^p \right\|\). Das Lemma ist gezeigt, die umgekehrte Richtung \(% \left\|\left. \varphi \,\right|\, \mathcal H^p \right\| =% \left\|\left. B\psi \,\right|\, \mathcal H^p \right\| \le % \left\|\left. \psi \,\right|\, \mathcal H^p \right\|\) folgt direkt aus \(|B(z)|\le 1\). ◻
Bemerkung: So kann man auch mehr zeigen; ist \(\varphi\in\mathcal N(\mathbb D)\) und \(B(z)\) das Blaschke-Produkt über die Nullstellen von \(\varphi\), so ist \(\psi=\varphi/B\in\mathcal N(\mathbb D)\) und besitzt dieselbe Schranke [eq:3:N-bound] wie \(\varphi\). (Man verifiziere dies!)
Korollar 3.5. Sei \(\varphi\in\mathcal H^1(\mathbb D)\). Dann existieren zwei Funktionen \(\psi_1,\psi_2\in\mathcal H^2(\mathbb D)\) mit \(\varphi=\psi_1\psi_2\).
Proof. Sei \(\varphi(z)=\psi(z)B(z)\) die Faktorisierung von \(\varphi\). Dann folgt die Behauptung mit \(\psi_1(z)=\sqrt{\psi(z)}\), \(\psi_2(z)=\psi_1(z)B(z)\). ◻
Korollar 3.6. Sei \(\varphi\in\mathcal H^1(\mathbb D)\). Dann werden die Randwerte im \(\mathrm L^1\)-Sinn angenommen, es gilt also \[\label{eq:3:H1RW} \lim_{r\to 1} \varphi(r{\mathrm e}^{i t}) = f(t)\] in \(\mathrm L^1(-\pi,\pi)\).
Proof. Man zerlegt \(\varphi\) in ein Produkt von zwei \(\mathcal H^2\)-Funktionen. Für diese gilt \(\mathrm L^2\)-Konvergenz für Randwerte und die Behauptung folgt mit der Hölderschen Ungleichung. ◻
Korollar 3.7 ( Riesz 37). Sei \(\mu\) ein komplexes und periodisches Maß mit \[\widehat\mu(k) = \int {\mathrm e}^{-{\mathrm i}k t} {\,\mathrm d}\mu(t) = 0\] für \(k=-1,-2,\ldots\). Dann ist \(\mu\) absolutstetig bezüglich des Lebesguemaßes.
Proof. Wir betrachten das Poissonintegral \[\varphi(r{\mathrm e}^{{\mathrm i}t}) = \frac1{2\pi} \int_{-\pi}^\pi P_r(t-\theta) {\,\mathrm d}\mu(\theta).\] Dies erfüllt \(\| \varphi(r{\mathrm e}^{{\mathrm i}\cdot}) \|_1 \le \|\mu\|\). Weiterhin gilt \(|\widehat \mu(k)|\le \|\mu\|\) und damit \[\varphi(z) = \sum_{n=0}^\infty \widehat\mu(k) z^k\] auf \(\mathbb D\). Also folgt \(\varphi(z)\in\mathcal H^1(\mathbb D)\), \(\varphi(r{\mathrm e}^{{\mathrm i}\cdot})\stackrel*\rightharpoonup \mu\), und somit \({\,\mathrm d}\mu(t) = f(t) {\,\mathrm d}t\) mit dem Grenzwert \(f\) aus [eq:3:H1RW] ◻
Zum Schluss noch ein tiefer Satz.
Satz 3.4 ( Beurling-Faktorisierung 38). Sei \(\varphi\in\mathcal N(\mathbb D)\) und \(B\in\mathcal H^\infty(\mathbb D)\) definiert durch das Blaschke-Produkt über die Nullstellen von \(\varphi\). Dann gilt \[\varphi(z) = \varphi_{in}(z) \varphi_{out}(z)\] mit einer inneren Funktion \(\varphi_{in}\) und einer äußeren Funktion \(\varphi_{out}\). Diese sind durch \[\begin{aligned} \varphi_{in}(z) &= B(z) \exp\left( \frac1{2\pi} \int_{-\pi}^\pi \frac{{\mathrm e}^{{\mathrm i}\theta}+z}{{\mathrm e}^{{\mathrm i}\theta}-z} {\,\mathrm d}\mu(\theta) \right)\\ \varphi_{out}(z) & = \exp\left( \frac1{2\pi} \int_{-\pi}^\pi \frac{{\mathrm e}^{{\mathrm i}\theta}+z}{{\mathrm e}^{{\mathrm i}\theta}-z} f(\theta) {\,\mathrm d}\theta \right) .\end{aligned}\] für ein reelles \(2\pi\)-periodisches Radon-Maß \(\mu\), welches singulär bezüglich des Lebesgue-Maßes ist, und eine Funktion \(f\in\mathrm L^1(-\pi,\pi)\) bestimmt.
Beweisskizze. Sei \(\varphi\in\mathcal N(\mathbb D)\) und sei \(B(z)\) das Blaschke-Produkt über die Nullstellen von \(\varphi\). Dann ist \(\psi(z) = \varphi(z) / B(z)\in\mathcal N(\mathbb D)\) nullstellenfrei und somit \(\log|\psi(z)|\) harmonisch. Also gilt die Poissonsche Integralformel \[\log|\psi(r\rho{\mathrm e}^{{\mathrm i}t})| = \frac1{2\pi} \int_{-\pi}^\pi P_r(t-\theta) \log|\psi(\rho{\mathrm e}^{{\mathrm i}\theta})| {\,\mathrm d}\theta\] für alle \(\rho<1\) und \(r<1\). Wir wollen \(\rho\to1\) streben lassen. Da \[\log|\psi(0)| =\frac1{2\pi} \int_{-\pi}^\pi \log|\psi(r{\mathrm e}^{{\mathrm i}t})|{\,\mathrm d}t\] unabhängig von \(r\) ist, folgt aus der Nevanlinna-Bedingung [eq:3:N-bound] sogar \[\sup_{r<1} \int_{-\pi}^\pi |\log|\psi(r{\mathrm e}^{{\mathrm i}t})||{\,\mathrm d}t < \infty\] und somit ist \(\log|\psi(r{\mathrm e}^{{\mathrm i}\cdot})|\) in \(\mathrm L^1(-\pi,\pi)\) gleichmäßig beschränkt. Damit existiert aber nach dem Satz von Alaoglu eine schwach-* konvergente Folge mit einem reellen Radon-Maß \(\nu\) als Grenzwert und es folgt die Poissonsche Integraldarstellung \[\log|\psi(r{\mathrm e}^{i t})| = \frac1{2\pi} \int_{-\pi}^\pi P_r(t-\theta) {\,\mathrm d}\nu(\theta).\] Die Eigenschaften des Poissonkerns implizieren die Eindeutigkeit des Grenzwerts und somit die schwach-* Konvergenz \(\log|\psi(r{\mathrm e}^{{\mathrm i}\cdot})| \stackrel*\rightharpoonup \nu\).
Die Behauptung folgt nun durch Anwenden des Lebesgueschen Zerlegungssatzes auf \(\nu\), es existieren also ein eindeutig bestimmtes Maß \(\mu\) welches singulärstetig zum Lebesgue-Maß ist und nach dem Satz von Radon-Nikodym eine Dichtefunktion \(f\in\mathrm L^1(-\pi,\pi)\) mit \[{\,\mathrm d}\nu(\theta) = f(\theta) {\,\mathrm d}\theta + {\,\mathrm d}\mu(\theta)\] und die Behauptung folgt. ◻
Bemerkung: Diese Faktorisierung ist fundamental für die Charakterisierung invarianter Unterräume des Shift-Operators auf \(\ell^2(\mathbb N)\). Identifiziert man den \(\ell^2\) mit dem Hardy-Raum \(\mathcal H^2(\mathbb D)\), so ist der Shift-Operator gerade \[\mathcal H^2(\mathbb D) \ni \varphi(z) \mapsto z\varphi(z) \in \mathcal H^2(\mathbb D)\] und jeder nichttriviale invariante Unterraum \(Y\ne \{0\}\) ist durch Nullstellen oder Nullrandwerte der darin enthaltenen Funktionen charakterisierbar. Genauer gilt zu jedem solchen \(Y\) existiert eine innere Funktion \(\varphi_{in}\in\mathcal H^\infty(\mathbb D)\), so dass \[Y = \varphi_{in} \mathcal H^2(\mathbb D) = \{ \varphi_{in}(z) \psi(z) : \psi\in\mathcal H^2(\mathbb D)\}\] gilt. Bis auf Faktoren ist \(\varphi_{in}(z)\) eindeutig bestimmt. (Siehe Rudin, Kap. 17)
\(\mathcal H^p(\mathbb D)\) | \(\mathcal H^p({\mathbb C}_+)\) | |
Definition | \(\varphi\in\mathcal A(\mathbb D)\) mit | \(\varphi\in\mathcal A({\mathbb C}_+)\) mit |
\(\displaystyle \sup_{r<1} \int_{-\pi}^\pi |\varphi(r{\mathrm e}^{{\mathrm i}t})|^p {\,\mathrm d}t < \infty\) | \(\displaystyle \sup_{y>0} \int_{-\infty}^\infty |\varphi(x+{\mathrm i}y)|^p {\,\mathrm d}x < \infty\) | |
Poissonintegrale | \(\varphi\in\mathcal A(\overline{\mathbb D})\) erfüllt | \(\varphi\in\mathcal A(\overline{{\mathbb C}_+})\) erfüllt |
\(\displaystyle\varphi(r{\mathrm e}^{{\mathrm i}t}) = \frac1{2\pi} \int_{-\pi}^\pi P_r(t-\theta) \varphi({\mathrm e}^{{\mathrm i}\theta}){\,\mathrm d}\theta\) | \(\displaystyle\varphi(x+{\mathrm i}y) = \frac1{\pi} \int_{-\infty}^\infty \frac{y}{(x-t)^2+y^2} \varphi(t) {\,\mathrm d}t\) | |
Randwerte | \(\varphi(r{\mathrm e}^{{\mathrm i}t}) \to f(t)\) in \(\mathrm L^p(-\pi,\pi)\) | \(\varphi(x+{\mathrm i}y) \to \varphi(x)\) in \(\mathrm L^p({\mathbb R})\) |
Blaschke-Faktoren | \(B_\alpha(z) = \frac{\alpha-z}{1-\overline\alpha z}\frac{|\alpha|}{\alpha}\) | \(b_\alpha(z) = \frac{\alpha-z}{\overline\alpha-z} \frac{|\alpha^2+1|}{\alpha^2+1}\) |
Nullstellenzerlegung | \(\varphi\in\mathcal H^p(\mathbb D)\) erfüllt | \(\varphi\in\mathcal H^p({\mathbb C}_+)\) erfüllt |
\(\varphi(z) = \prod_\alpha B_\alpha(z) \psi(z)\) mit \(\psi\in\mathcal H^p(\mathbb D)\) | \(\varphi(z) = \prod_\alpha b_\alpha(z) \psi(z)\) mit \(\psi\in\mathcal H^p({\mathbb C}_+)\) | |
\(\mathcal H^p(\mathbb D)\) | \(\mathcal H^p({\mathbb C}_+)\) | |
Satz von | \(\varphi\in\mathcal H^2(\mathbb D)\) genau dann, wenn | \(\varphi\in\mathcal H^2({\mathbb C}_+)\) genau dann, wenn |
Paley–Wiener | \(f\in\mathcal L^2(-\pi,\pi)\) mit \(\widehat f(k)=0\), \(k=-1,-2,\ldots\) | \(\varphi\in\mathrm L^2({\mathbb R})\) und \(\widehat \varphi(\xi)=0\), \(\xi<0\) |
Satz von | \(\mu\) per. Radonmaß mit \(\widehat\mu(k)=0\), \(k=-1,-2,\ldots\) | \(\mu\) endliches Radonmaß mit \(\widehat\mu(\xi)=0\), \(\xi\le0\) |
M. Riesz | impliziert \({\,\mathrm d}\mu = f(t){\,\mathrm d}t\) mit \(f\in\mathrm L^1(-\pi,\pi)\) | impliziert \({\,\mathrm d}\mu = f(t){\,\mathrm d}t\) mit \(f\in\mathrm L^1({\mathbb R})\) |
Hardy-Ungleichung | \(\varphi\in\mathcal H^1(\mathbb D)\) erfüllt | \(\varphi\in\mathcal H^1({\mathbb C}_+)\) erfüllt |
\(\displaystyle \sum_{k=0}^\infty \frac{|\widehat f(k)|}{1+k}\le \frac 12 \int_{-\pi}^\pi f(t){\,\mathrm d}t\) | \(\displaystyle \int_{0}^\infty \frac{|\widehat \varphi(\xi)|}\xi{\,\mathrm d}\xi \le \frac12 \int_{-\infty}^\infty |\varphi(x)|{\,\mathrm d}x\) | |
Die (reellen)39 Hardy-Räume \(\widetilde{\mathcal H}^p\) sind für die Behandlung singulärer Integraloperatoren von Bedeutung. Wir wollen dies hier nur kurz skizzieren. Eine Funktion \(f\in\mathrm L^p(-\pi,\pi)\) gehört genau dann zum reellen Hardy-Raum \(\widetilde{\mathcal H}^p\), wenn die durch das Poissonintegral \[\varphi(r{\mathrm e}^{{\mathrm i}t}) = \frac1{2\pi} \int_{-\pi}^\pi P_r(t-\theta) f({\mathrm e}^{{\mathrm i}\theta}){\,\mathrm d}\theta\] definierte Funktion holomorph ist, also ebenso \[\varphi(r{\mathrm e}^{{\mathrm i}t}) = \frac1{2\pi} \int_{-\pi}^\pi \frac{1+r{\mathrm e}^{{\mathrm i}( t-\theta)}}{1-r{\mathrm e}^{{\mathrm i}(t-\theta)}} \Re f({\mathrm e}^{{\mathrm i}\theta}){\,\mathrm d}\theta + {\mathrm i}\Im \varphi(0)\] gilt. Damit kann man aber \(\Im f\) durch \(\Re f\) ausdrücken, es muß also \[\Im f({\mathrm e}^{{\mathrm i}t}) = \lim_{r\to1} \frac1{2\pi} \int_{-\pi}^\pi \Im \frac{1+r{\mathrm e}^{{\mathrm i}( t-\theta)}}{1-r{\mathrm e}^{{\mathrm i}(t-\theta)}} \Re f({\mathrm e}^{{\mathrm i}\theta}){\,\mathrm d}\theta + \Im \frac1{2\pi} \int_{-\pi}^\pi f(\theta){\,\mathrm d}\theta\] gelten. Der erste Term ist dabei ein Hauptwertintegral mit dem Hilbert-Kern \[H(t) = \Im \frac{1+{\mathrm e}^{{\mathrm i}t}}{1-{\mathrm e}^{{\mathrm i}t}} = \cot\frac t2,\] die sogenannte Hilberttransformation . Die schon bekannten Abschätzungen und die Eigenschaften des Poissonkerns implizieren damit, dass auf dem (nun reellen und reellwertigen) Raum \(\Re \widetilde{\mathcal H}^p\), \(p\in[1,\infty)\), die Hilberttransformation beschränkt ist. Es gilt sogar mehr:
Satz 3.5 ( Abbildungseigenschaften der Hilberttransformation ). Die Hilbert-Transformation \[H f(t) = \mathrm{p.V. } \frac1{2\pi} \int_{-\pi}^\pi H(t-\theta) f(\theta) {\,\mathrm d}\theta\] ist
beschränkte als Abbildung \(\Re \widetilde{\mathcal H}^p\to \Re \widetilde{\mathcal H}^p\);
beschränkt als Abbildung \(\mathrm L^p(-\pi,\pi)\to \mathrm L^p(-\pi,\pi)\) für alle \(1<p<\infty\);
nicht beschränkt auf \(\mathrm L^1(-\pi,\pi)\) und \(\mathrm L^\infty(-\pi,\pi)\).
Proof. [1.] Wir fassen den Hardy-Raum als Banach-Raum über \({\mathbb R}\) auf und schreiben \(\widetilde{\mathcal H}^p = \Re \widetilde{\mathcal H}^p \oplus {\mathrm i}\Im \widetilde{\mathcal H}^p \simeq \Re \widetilde{\mathcal H}^p\oplus \Re \widetilde{\mathcal H}^p\). Da \[|\varphi(0)| \le % \left\|\left. \varphi \,\right|\, \mathcal H^p \right\|\] gilt, ist der Teilraum \(\widetilde{\mathcal H}^p_0 = \{f \in \widetilde{\mathcal H}^p : \Im\varphi(0)=0\}\) abgeschlossen und in ihm die Zuordnung \(\Re f\mapsto \Im f\) bijektiv. Dieser Teilraum ist aber gerade der Graph der Hilbert-Transformation (bezüglich obiger Zerlegung des Raums) und somit diese nach dem Satz vom abgeschlossenen Graphen beschränkt.
[2.] Dies ist ein auf M. Riesz zurückgehende Satz, wir geben den Originalbeweis. Weiter genügt es, den Beweis für \(1<p<2\) zu führen.40 Sei also \(f\in\mathrm L^p(-\pi,\pi)\) mit \(f(t)\ge0\) und \(f\ne0\). Sei weiter \(\varphi\) durch das komplexe Poisson-Integral definiert, \[\varphi(z) = \frac1{2\pi} \int_{-\pi}^\pi \frac{{\mathrm e}^{{\mathrm i}\theta}+z}{{\mathrm e}^{{\mathrm i}\theta}-z} f(\theta){\,\mathrm d}\theta ,\qquad |z|<1.\] Es genügt zu zeigen, dass \(\varphi\in\mathcal H^p(\mathbb D)\).
Dann gilt \(\Re \varphi(z) > 0\) und die Funktion \(\varphi(z)^p\) ist holomorph (und so gewählt, dass \(\varphi(0)^p>0\)). Sei weiter \(\gamma\) eine reelle Zahl mit \(0<\gamma<\pi/2\) und \(p\gamma>\pi/2\) und weiterhin \(I_r = \{ t : |\arg\varphi(r{\mathrm e}^{{\mathrm i}t})|<\gamma\}\). Dann gilt auf \(I_r\) \[| \varphi (z) | < \Re \varphi (z) (\cos\gamma)^{-1}\] und somit \[\frac1{2\pi} \int_{I_r} |\varphi(r {\mathrm e}^{{\mathrm i}t})|^p {\,\mathrm d}t \le (\cos\gamma)^{-p} \|\Re \varphi (r{\mathrm e}^{{\mathrm i}\cdot})\|_p^p \le (\cos\gamma)^{-p} \|f\|_p^p.\]
Weiterhin gilt da \(\Re\varphi^p\) harmonisch und auf \(I_r^c\) negativ ist \[\label{eq:3:eee} (\varphi(0))^p = \frac1{2\pi} \int_{-\pi}^\pi\Re (\varphi(r {\mathrm e}^{{\mathrm i}t})^p) {\,\mathrm d}t \le \frac1{2\pi} \int_{I_r} | \varphi(r {\mathrm e}^{{\mathrm i}t})|^p {\,\mathrm d}t \le (\cos\gamma)^{-p} \|f\|_p^p.\]
Auf dem Komplement \(I_r^c\) gilt andererseits \[|\varphi(z)|^p \le \Re (\varphi(z)^p) \cos(p\gamma)^{-1}\] (wobei beide Faktoren negativ sind) und wegen [eq:3:eee] \[\frac1{2\pi} \int_{I_r^c} |\Re \varphi(r{\mathrm e}^{{\mathrm i}t})^p| {\,\mathrm d}t \le ( 1 + (\cos\gamma)^{-p} ) \|f\|_p^p.\] Zusammengefasst erhält man daraus \[\frac1{2\pi} \int_{-\pi}^\pi |\varphi(r{\mathrm e}^{{\mathrm i}t})|^p {\,\mathrm d}t\le \big( (\cos\gamma)^{-p} - (\cos p\gamma)^{-1} (1+(\cos\gamma)^{-p})\big) \|f\|_p^p %c_p \|f\|_p^p.\] und damit \(% \left\|\left. \varphi \,\right|\, \mathcal H^p \right\| \le c_p\|f\|_p\) mit einer von \(p\) abhängenden Konstanten \(c_p\). Linearität erlaubt die Ausweitung auf beliebige komplexwertige \(f\) (mit der vierfachen Konstanten).
[3.] Für \(p=\infty\) folgt dies direkt vermittels \(\varphi(z) = {\mathrm i}\log \frac{1+z}{1-z}\). Dann ist \(|\Re\varphi(z)|\le \frac\pi2\), aber \(\Im\varphi(z)\) unbeschränkt. Der Fall \(p=1\) folgt aus der Dualität, wäre \(H\) auf \(\mathrm L^1\) beschränkt, so müsste für \(f\in\mathrm L^1(-\pi,\pi)\) und \(g\in\mathrm L^\infty(-\pi,\pi)\) \[|\langle Hg,f\rangle| = | \langle g, Hf \rangle | \le c \|g\|_\infty \|f\|_1\] gelten und \(H\) wäre auch auf \(\mathrm L^\infty\) beschränkt. ◻
Bemerkung: Auf \({\mathbb R}\) wäre dies einfacher zu sehen, die Hilberttransformation multiplizert im Fourierbild mit \(\mathop{\mathrm{sign}}\xi\), was die Stetigkeit in \(\xi=0\) verletzt. Im hier behandelten periodischen Fall muss man sich Beispiele zu Fourierreihen anschauen. So bestimmt \[\sum_{k=2}^\infty \frac{\cos kt}{\log k} = \lim_{r\to1} \Re \sum_{k=2}^\infty \frac{r^k{\mathrm e}^{{\mathrm i}kt}}{\log k}\] eine Funktion in \(\mathrm L^1(-\pi,\pi)\). Die zugeordnete Hilberttransformierte \[\sum_{k=2}^\infty \frac{\sin kt}{\log k} = \lim_{r\to1} \Im \sum_{k=2}^\infty \frac{r^k{\mathrm e}^{{\mathrm i}kt}}{\log k}\] ist aber nicht integrierbar. Beides können wir hier nicht ohne weiteres beweisen.
Korollar 3.8. Es gilt \(\Re\mathrm L^p(-\pi,\pi)=\Re \widetilde{\mathcal H}^p\) für alle \(1<p<\infty\).
Für \(p=1\) ist dies falsch und somit der \(\widetilde{\mathcal H}^1\) der einzige wirklich interessante Hardy-Raum.
Nur ein kurzer Exkurs zum höherdimensionalen Fall. Der (reelle) Hardy-Raum \(\widetilde{\mathcal H}^p({\mathbb R}^{n})\) wurde intensiv von Fefferman41 und Stein studiert und besteht aus den Randwerten von speziellen in \({\mathbb R}^{n+1}_+\) harmonischen Funktionen \(u\). Wir folgen dem Buch von Stein zu singulären Integralen bzw. zur harmonischen Analysis und bezeichnen Variablen in \({\mathbb R}^{n+1}_+ \ni (x,t)\) mit \(x\in{\mathbb R}^n\). Mitunter schreibt man \(x_0\) für \(t\) um Formeln einfacher zu machen.
Seien nachfolgend \(u_j : {\mathbb R}^{n+1}_+ \to {\mathbb R}\) differenzierbare reellwertige Funktionen. Wir bezeichnen diese als zueinander konjugiert, wenn sie ein verallgemeinertes Cauchy–Riemann-System
\[\label{eq:3:nd-CR} \sum_{j=0}^n \frac{\partial u_j}{\partial x_j} =0,\qquad\qquad \frac{\partial u_j}{\partial x_k} = \frac{\partial u_k}{\partial x_j}, \quad j\ne k\] erfüllen. Dies implizert insbesondere \(\Delta u_j = 0\) und die Funktionen \(u_j\) sind somit harmonisch . Im Folgenden betrachten wir die vektorwertige Funktion \[\Phi(x,t) = \big( u_0(x,t), u_1(x,t), \ldots, u_n(x,t) \big)^\top\] und sagen \(\Phi\in \mathcal H^p({\mathbb R}^{n+1}_+)\), \(1\le p<\infty\), falls \[\label{eq:3:Hardy-schr} \sup_{t>0} \int_{{\mathbb R}^n} | \Phi(x,t) |^p {\,\mathrm d}x < \infty\] gilt. Eine vektorwertige Funktion, deren Komponenten das System [eq:3:nd-CR] erfüllen, heißt monogenes System .
Wiederum gilt eine Poissonsche Integraldarstellung der Funktionen \(u_j\) durch entsprechende Randwerte, für \(p>1\) ist der Beweis vollkommen analog zu dem im ersten Abschnitt gegebenen. Es gilt
Satz 3.6 ( Poissonsche Integraldarstellung ). Sei \(\Phi\in\mathcal H^p({\mathbb R}^{n+1}_+)\), \(1\le p<\infty\). Dann konvergieren \[\lim_{t\to0} \Phi(x,t) = \Phi(x),\qquad \lim_{t\to\infty} \Phi(x,t)=0\] in \(\mathrm L^p({\mathbb R}^n;{\mathbb R}^{n+1})\) und es gilt die Poissonsche Integraldarstellung42 \[\label{eq:3:poisson-nd} \Phi(x,t) = \int_{{\mathbb R}^n} P_t(x-y) \Phi(y){\,\mathrm d}y \qquad P_t(x)= c_n t^{-n} \langle x/t\rangle^{-n-1}.\] Darüberhinaus erfüllen die Randwerte \(\Phi(x) = (u_0(x),\ldots,u_n(x))^\top\) \[\label{eq:3:R-trafo} u_j(x) = R_j u_0(x) = c_n \; \mathrm{p.V.} \int_{{\mathbb R}^n} \frac{x_j-y_j}{|x-y|^{n+1}} \tilde u_0(y){\,\mathrm d}y.\] Sind umgekehrt \(u_j\in\mathrm L^p({\mathbb R}^n)\) Funktionen mit [eq:3:R-trafo], so definiert [eq:3:poisson-nd] ein monogenes System aus \(\mathcal H^p({\mathbb R}^{n+1}_+)\).
Im folgenden Beweis beschränken wir uns auf den Fall \(p>1\), dieser ist im wesentlichen analog zum Vorgehen im eindimensionalen Fall. Der Fall \(p=1\) benötigt andere Hilfsmittel, da wir hier keine Produktformeln nutzen können.
Beweis für \(1<p<\infty\). Schritt 1. Sei \(w:\overline{{\mathbb R}^{n+1}_+}\to{\mathbb R}\) harmonisch und gelte eine Schranke der Form \(\sup_{t} \| w(\cdot,t)\|_p <\infty\). Sei weiter \(\chi\in \mathrm C_0^\infty({\mathbb R}^n)\) mit \(0\not\in\mathop{\mathrm{supp}}\chi\). Dann ist \(\mathscr F^{-1}[\chi]*w\) ebenso harmonisch und es gilt für die partielle Fouriertransformation bezüglich \(x\) \[\partial_t^2 \chi(\xi)\widehat w(\xi,t) = |\xi|^2\chi(\xi)\widehat w(\xi,t)\] und damit (da \({\mathrm e}^{\pm t|\xi|} \chi(\xi)\in \mathrm C^\infty({\mathbb R}^n)\)) \[\chi(\xi) \widehat w(\xi,t) = {\mathrm e}^{t|\xi|} \chi(\xi) \widehat w_+(\xi) + {\mathrm e}^{-t|\xi|} \chi(\xi) \widehat w_-(\xi),\qquad \widehat w_\pm\in\mathscr D'({\mathbb R}^n\setminus 0).\] Betrachtet man nun die beiden Summanden getrennt und bezeichnet diese entsprechend mit \(w_{\chi,\pm}(x,t)\), so ist \(w_{\chi,+}(\cdot,t)\) für \(w\ne0\) unbeschränkt in \(\mathscr S'({\mathbb R}^n)\) und \(w_{\chi,-}(\cdot,t)\to0\) in \(\mathscr S'({\mathbb R}^n)\). Also muss \(\widehat w_+(\xi)=0\) auf \({\mathbb R}^n\setminus\{0\}\) gelten.
Damit bestimmen die Randwerte \(w(x,0)\) aber die harmonische Funktion \(w\). Sind \(f,g\in\mathrm L^p({\mathbb R}^n)\) mit \(\widehat f(\xi)=\widehat g(\xi)\) auf \({\mathbb R}^n\setminus\{0\}\), so folgt \(\mathop{\mathrm{supp}}(\widehat f-\widehat g)\subset\{0\}\) und somit ist \(f-g\) ein Polynom. Das einzige in \(\mathrm L^p\) liegende Polynom ist aber das Nullpolynom und damit \(f=g\).
Betrachtet man nun Poissonintegrale \[w(x,t) = \int_{{\mathbb R}^n} P_t(x-y) f(y){\,\mathrm d}y\] für gegebenes \(f\in\mathrm L^p({\mathbb R}^n)\), so sind die entstehenden Funktionen harmonisch und erfüllen (da \(P_t(x)>0\) für \(t>0\) gilt und \(\int P_t(x){\,\mathrm d}x=1\) gesetzt wurde) \[\lim_{t\to0} w(x,t) = f(x),\qquad \lim_{t\to\infty} w(x,t)=0\] in \(\mathrm L^p({\mathbb R}^n)\). Damit gilt aber (wegen der Eindeutigkeit aus Schritt 1) für jede Komponente \(u_j\) eines monogenen Systems \[u_j(x,t+t_0) = \int_{{\mathbb R}^n} P_t(x-y) u_j(y,t_0){\,\mathrm d}x.\] Es bleibt der Grenzwert für \(t_0\to0\) zu betrachten. Da \(\mathrm L^p({\mathbb R}^n)\) für \(1<p<\infty\) reflexiv ist, folgt aus der gleichmäßigen Schranke an die \(\mathrm L^p\)-Norm die Existenz einer Folge \(t_k\to0\) für \(u_j(x,t_k)\to \tilde u_j(x)\) in schwach in \(\mathrm L^p\) konvergiert. Damit folgt aber wegen \(P_t(x)\in\mathrm L^q({\mathbb R}^n)\) zusammen mit der Stetigkeit harmonischer Funktionen \[u_j(x,t) = \int_{{\mathbb R}^n} P_t(x-y) \tilde u_j(y){\,\mathrm d}x\] und damit \(u_j(\cdot,t)\to \tilde u_j\) in der \(\mathrm L^p\)-Norm. Wir bezeichnen den Grenzwert deshalb mit \(u_j\) und haben die Poissonsche Integraldarstellung gezeigt.
Für \(p=1\) folgt analog die schwach-* Konvergenz im Raum der beschränkten Radonmaße, \(u_j(x,t){\,\mathrm d}x\stackrel*\rightharpoonup {\,\mathrm d}\mu_j\), und die entsprechende Randintegraldarstellung \[u_j(x,t) = \int_{{\mathbb R}^n} P_t(x-y) {\,\mathrm d}\mu_j(y)\] durch Maße als Randwerte.
Sei nun \(\Phi\in\mathcal H^p({\mathbb R}^{n+1}_+)\) ein monogenes System mit den Komponenten \(u_j(t,x)\). Für \(\xi\ne0\) gilt dann im Fourierbild \[\widehat u_j(\xi,t) = {\mathrm e}^{-t|\xi|} \widehat u_j(\xi).\] Das verallgemeinerte Cauchy–Riemann-System kann damit aber in den Randkomponenten geschrieben werden. Es muss also \[-|\xi| \widehat u_0(\xi) - {\mathrm i}\sum_{j=1}^n \xi_j \widehat u_j(\xi) =0,\qquad \xi_j \widehat u_k(\xi) = \xi_k \widehat u_j(\xi)\] gelten. Dies ist ein lineares Gleichungssystem, welches \(\widehat u_j(\xi)\) durch \(\widehat u_0(\xi)\) bestimmt, es folgt \[|\xi| \widehat u_0(\xi) = -{\mathrm i}\sum_{j=1}^n \xi_j \widehat u_j(\xi) = -{\mathrm i}\sum_{j=1}^n \frac{\xi_j^2}{\xi_k} \widehat u_k(\xi) = -{\mathrm i}\frac{|\xi|^2}{\xi_k} \widehat u_k(\xi)\] und damit \[\widehat u_j(\xi) = {\mathrm i}\frac{\xi_j}{|\xi|} \widehat u_0(\xi), \qquad \xi\ne0.\] Die Behauptung folgt nun durch Fourierrücktransformation. Es gilt \[\lim_{t\to0} \int_{{\mathbb R}^n} {\mathrm e}^{{\mathrm i}x\cdot\xi -t|\xi|} \frac{{\mathrm i}\xi_j}{|\xi|} {\,\mathrm d}\xi = c_n \frac{x_j}{|x|^{n+1}},\] da die entstehende Distribution als oszillierendes Integral außerhalb der Null glatt ist, homogen vom Grad \(-n\) sein muss und sich entsprechend unter orthogonalen Transformationen der \(x\) bzw. \(\xi\) verhält.
Angenommen, die Funktionen \(u_j\in\mathrm L^p({\mathbb R}^n)\) erfüllen [eq:3:R-trafo] und \(\Phi\) ist durch [eq:3:poisson-nd] definiert. Dann sind die Komponenten von \(\Phi\) harmonisch und die Eigenschaften des Poissonkerns liefern die gesuchte Schranke an die \(\mathrm L^p\)-Normen. Weiterhin impliziert Schritt 3 rückwärts gelesen die (distributionelle) Gültigkeit des verallgemeinerten Cauchy–Riemann-Systems und der Satz ist für \(1<p<\infty\) bewiesen. ◻
Beweisskizze für \(p=1\). Für \(p=1\) liefern die Schritte 3 und 4 entsprechende Aussagen für die nach Schritt 2 existierenden Maße \(\mu_j\), es gilt also \(\mu_j = R_j\mu_0\). Es wäre zu zeigen, dass diese absolutstetig sind oder (was äquivalent dazu ist), dass die Randwerte im \(\mathrm L^1\)-Sinn angenommen werden. Dazu betrachtet man zu \(\Phi\in\mathcal H^1({\mathbb R}^{n+1}_+)\) die Maximalfunktion \[\Phi^*(x) = \sup_{t>0} |\Phi(x,t)|\] und zeigt, dass \(\Phi^*\in \mathrm L^1({\mathbb R}^n)\) gilt. Der Satz über die majorisierte Konvergenz liefert daraus sofort \(\lim_{t\to0} \Phi(t,x) = \Phi(x)\) in \(\mathrm L^1({\mathbb R}^n)\) und die Aussage ist gezeigt.
Bleiben die Eigenschaften der Maximalfunktion. Diese wird nur kurz skizziert. Ist \(\Phi\in\mathcal H^1({\mathbb R}^{n+1})\), so impliziert das verallgemeinerte Cauchy–Riemann-System, dass \(|\Phi|^r\), \(r\ge\frac{n-1}n\), subharmonisch43 ist (\(\Delta |\Phi|^r\ge c_r |\Phi|^{r-2} |\nabla\Phi|^2\ge 0\)) und für \(t\to\infty\) gegen Null strebt. Damit folgt \[|\Phi(x,t+\epsilon)|^r \le \int_{{\mathbb R}^n} P_t(x-y) |\Phi(y,\epsilon)|^r {\,\mathrm d}y.\] Wir wählen \(\frac{n-1}n <r <1\). Dann ist nach Voraussetzung \(|\Phi(\cdot,\epsilon)|^r\) gleichmäßig beschränkt in \(\mathrm L^{q}\) für \(q=1/r>1\). Aufgrund der Reflexivität existiert eine Folge \(\epsilon_k\to0\) mit \(|\Phi(\cdot,\epsilon_k)|^r\rightharpoonup h\) schwach in \(\mathrm L^{q}\) und somit \[|\Phi(x,t)|^r \le \int_{{\mathbb R}^n} P_t(x-y) h(y) {\,\mathrm d}y.\] Damit folgt aber unter Ausnutzung der \(\mathrm L^q\)-Beschränktheit der Maximalfunktion des Poissonintegrals44 \[\Phi^*(x)^r \le \sup_{t>0} \int_{{\mathbb R}^n} P_t(x-y) h(y) {\,\mathrm d}y = h^*(x) \in \mathrm L^{q}({\mathbb R}^n)\] und die Behauptung folgt. ◻
Wir bezeichnen im folgenden die Menge der nullten Komponenten der Randwerte von \(\mathcal H^p({\mathbb R}^{n+1}_+)\)-Funktionen mit \(\Re \widetilde{\mathcal H}^p({\mathbb R}^n)\). Die Riesztransformationen \(R_j\) sind beschränkt auf \(\mathrm L^p({\mathbb R}^n)\) für \(1<p<\infty\) (dies folgt zum Beispiel aus dem Multiplikatorensatz von Hörmander–Mikhlin oder dem Interpolationssatz von Marcinkiewicz, vgl. Kapitel 4), damit gilt \(\Re \widetilde{\mathcal H}^p({\mathbb R}^n) = \Re \mathrm L^p({\mathbb R}^n)\) für diese \(p\).
Für den \(\widetilde{\mathcal H}^1({\mathbb R}^n) = \Re\widetilde{\mathcal H}^1({\mathbb R}^n)\oplus {\mathrm i}\Re\widetilde{\mathcal H}^1({\mathbb R}^n)\) bleibt folgende Charakterisierung
Korollar 3.9. Es sind äquivalent
\(f\in \widetilde{\mathcal H}^1({\mathbb R}^n)\).
\(f\in \mathrm L^1({\mathbb R}^n)\) und die Riesz-Transformationen erfüllen \(R_j f\in\mathrm L^1({\mathbb R}^n)\).
\(f\in\mathrm L^1({\mathbb R}^n)\) und \(f^*(x)=\sup_t |P_t*f(x)|\) erfüllt \(f^* \in\mathrm L^1({\mathbb R}^n)\).
Weiter gilt
Korollar 3.10 ( Riesz ). Sei \(\mu_0\) ein beschränktes Radonmaß. Sind dann \(\mu_j=R_j\mu_0\) für alle \(j=1,\ldots,n\) ebenso beschränkte Radonmaße (d.h. gelte \(|\xi|\widehat\mu_j(\xi) = {\mathrm i}\xi_j \widehat \mu_0(\xi)\) für \(\xi\ne0\) für solche Maße \(\mu_j\)), so sind alle \(\mu_j\) absolutstetig und es existieren \(f_j\in\mathrm L^1({\mathbb R}^n)\), \(j=0,\ldots,n\) mit \({\,\mathrm d}\mu_j(t) = f_j(t){\,\mathrm d}t\).
Interpolationstheorie in Raumskalen erlaubt Aussagen über Operatoren in zwischen zwei Räumen liegenden Interpolationsräumen. So kann man zwischen \(\mathrm L^p\)-Räumen mit verschiedenen \(p\) oder Sobolevräumen mit verschiedener Glattheit interpolieren.
Der Interpolationssatz von Riesz und Thorin ist der klassische Interpolationssatz schlechthin. Er trifft Aussagen über Operatoren zwischen \(\mathrm L^p\)-Räumen für verschiedene Exponenten \(p\).
Seien dazu \((\Omega_j, \mathcal B_j, \mu_j)\), \(j=1,2\), zwei \(\sigma\)-endliche Maßräume und \(\mathrm L^p(\Omega_j,{\,\mathrm d}\mu_j)\) die Räume der \(p\)-integrierbaren komplexwertigen Funktionen auf \(\Omega_j\). Die \(\sigma\)-Endlichkeit impliziert, dass für \(1\le p<\infty\) die Menge der Treppenfunktionen \(\mathcal T(\Omega_j,{\,\mathrm d}\mu_j)\) dicht im Raum \(\mathrm L^p(\Omega_j,{\,\mathrm d}\mu_j)\) ist; dies wird im folgenden explizit genutzt werden.
Satz 4.1 ( Riesz–Thorin 45). Seien \(p_0,p_1,q_0,q_1\in[1,\infty]\), \(\{p_0,p_1\},\{q_0,q_1\}\ne \{1\}, \{\infty\}\), und seien weiter \[T_j : \mathrm L^{p_j}(\Omega_1,{\,\mathrm d}\mu_1) \to \mathrm L^{q_j}(\Omega_2,{\,\mathrm d}\mu_2),\qquad j=0,1\] beschränkte Operatoren für die \(T_0f(x) =T_1f(x)\) f.ü. für alle \(f\in\mathcal T(\Omega_1,{\,\mathrm d}\mu_1)\) gilt. Sei weiter \(\theta\in(0,1)\) und \[\frac1p = \frac{1-\theta}{p_0} + \frac{\theta}{p_1},\qquad \frac1q = \frac{1-\theta}{q_0} + \frac{\theta}{q_1}.\] Dann existiert genau ein beschränkter Operator \(T_\theta\) \[T_\theta : \mathrm L^{p}(\Omega_1,{\,\mathrm d}\mu_1) \to \mathrm L^{q}(\Omega_2,{\,\mathrm d}\mu_2)\] welcher auf \(\mathcal T(\Omega_1,{\,\mathrm d}\mu_1)\) mit \(T_1\) und \(T_2\) übereinstimmt. Dieser erfüllt \[\| T_\theta \|_{p\to q} \le \|T_1\|_{p_0\to q_0} ^{1-\theta} \|T_1\|_{p_1\to q_1}^{\theta}.\]
Proof. Sei für \(h\in\mathrm L^q(\Omega_2,{\,\mathrm d}\mu_2)\) und \(g\in\mathrm L^{q'}(\Omega_2,{\,\mathrm d}\mu_2)\), \(qq'=q+q'\) \[\langle h,g\rangle = \int_{\Omega_2} f(y) g(y) {\,\mathrm d}\mu_2(y).\] Dann gilt bekanntlich \[\| h\|_{q} = \sup \{ |\langle h,g\rangle| : \|g\|_{q'}=1 \}\] und \(T:\mathrm L^p(\Omega_1,{\,\mathrm d}\mu_1)\to \mathrm L^q(\Omega_2,{\,\mathrm d}\mu_2)\) ist beschränkt, falls \[\|T\|_{p\to q} = \sup \{ |\langle T f,g\rangle| : \|f\|_p= \|g\|_{q'}=1 \}<\infty.\]
Aufgrund der Dichtheit der Treppenfunktionen, können wir um folgenden \(f\in\mathcal T(\Omega_1,{\,\mathrm d}\mu_1)\) und \(g\in\mathcal T(\Omega_2,{\,\mathrm d}\mu_2)\) annehmen und es reicht die gesuchte Schranke an \(|\langle T f,g\rangle|\) zu beweisen. Dazu nutzen wir komplexe Analysis und definieren für \(0\le \Re z \le 1\) \[\frac1{p(z)} = \frac {1-z}{p_0} + \frac{z}{p_1},\qquad \frac1{q(z)} = \frac {1-z}{q_0} + \frac{z}{q_1}.\] und setzen für \(x\in\Omega_1\) beziehungsweise \(y\in\Omega_2\) \[\varphi(x,z) = |f(x)|^{p/p(z)} f(x) / |f(x)|,\qquad \psi(y,z) = |g(y)|^{q'/q'(z)} g(y) / |g(y)|.\] Dann folgt \(\varphi(\cdot,z)\in \mathrm L^{p_j}(\Omega_1,{\,\mathrm d}\mu_1)\) und \(\psi(\cdot,z)\in\mathrm L^{q'_j}(\Omega_2,{\,\mathrm d}\mu_2)\), sowie \(T\varphi(\cdot,z)\in\mathrm L^{q_j}(\Omega_2,{\,\mathrm d}\mu_2)\) jeweils stetig in \(z\) und mit nur von \(\Re z\) abhängender Norm. Damit sind insbesondere die Normen auf dem Streifen \(0\le \Re z\le 1\) beschränkt. Weiter sind \(\varphi\) und \(\psi\) komplex differenzierbar für \(0<\Re z<1\) und erfüllen ebenso \(\partial_z \varphi(\cdot,z)\in \mathrm L^{p_j}(\Omega_1,{\,\mathrm d}\mu_1)\) und \(\partial_z \psi(\cdot,z)\in\mathrm L^{q'_j}(\Omega_2,{\,\mathrm d}\mu_2)\), somit ebenso \(\partial_z (T\varphi(\cdot,z))\in\mathrm L^{q_j}(\Omega_2,{\,\mathrm d}\mu_2)\). Damit ist die Funktion \[F(z) = \langle T\varphi(\cdot,z),\psi(\cdot,z)\rangle\] aber analytisch im Streifen \(0<\Re z<1\) und stetig auf \(0\le \Re z\le 1\). Weiter gilt \[\begin{aligned} &\| \varphi(\cdot,{\mathrm i}t)\|_{p_0} = \| |f|^{p/p_0} \|_{p_0} = \|f\|_{p}^{p/p_0} = 1, \\ & \|\varphi(\cdot,1+{\mathrm i}t)\|_{p_1}= \| |f|^{p/p_1}\|_{p_1} = \|f\|_p^{p/p_1}=1\end{aligned}\] sowie entsprechend für \(\psi\) \[\| \psi(\cdot,{\mathrm i}t)\|_{q_0'} = \| \psi(\cdot,1+{\mathrm i}t) \|_{q_1'} =1.\] Nach Voraussetzung wissen wir damit \[\begin{aligned} & |F({\mathrm i}t)|\le \| T\varphi(\cdot,{\mathrm i}t)\|_{q_0} \|\psi(\cdot,{\mathrm i}t)\|_{q_0'} \le \|T_0\|_{p_0\to q_0},\\ & |F(1+{\mathrm i}t)|\le \| T\varphi(\cdot,1+{\mathrm i}t)\|_{q_1} \|\psi(\cdot,1+{\mathrm i}t)\|_{q_1'} \le \|T_1\|_{p_1\to q_1}.\end{aligned}\] Weiter ist \(\varphi(\cdot,\theta)=f\) und \(\psi(\cdot,\theta)=g\), also \(F(\theta) = \langle T f,g\rangle\). Der nachfolgend angegebene Hadamardsche 3-Linien-Satz impliziert damit aber sofort die Behauptung \[|F(\theta)| = |\langle T f,g\rangle| \le \|T_1\|_{p_0\to q_0} ^{1-\theta} \|T_1\|_{p_1\to q_1}^{\theta}\] für alle \(f\in\mathcal T(\Omega_1,{\,\mathrm d}\mu_1)\) und \(g\in\mathcal T(\Omega_2,{\,\mathrm d}\mu_2)\) mit Norm 1. Damit ist \(T\) stetig fortsetzbar als Operator \(\mathrm L^p(\Omega_1,{\,\mathrm d}\mu_1)\to\mathrm L^q(\Omega_2,{\,\mathrm d}\mu_2)\) und der Satz bewiesen. ◻
Lemma 4.1 ( Hadamardscher Dreiliniensatz 46). Sei \(F(z)\) analytisch in \(0<\Re z<1\) und beschränkt und stetig auf dem Abschluss des Streifens \(0\le \Re z\le 1\). Dann impliziert \[|F({\mathrm i}t)| \le M_0,\qquad |F(1+{\mathrm i}t)|\le M_1\] für alle \(t\in{\mathbb R}\) die Abschätzung \(|F(\theta+{\mathrm i}t)| \le M_0^{1-\theta} M_1^\theta\) für alle \(t\in{\mathbb R}\).
Proof. Setzt man für \(\epsilon>0\) und \(\lambda\in{\mathbb R}\) \[F_\epsilon(z) = {\mathrm e}^{\epsilon z^2 +\lambda z} F(z),\] so ist die entstehende Funktion analytisch und erfüllt \(F_\epsilon(z)\to 0\), \(\Im z\to\pm\infty\) zusammen mit \(|F_\epsilon({\mathrm i}t)|\le M_0\) und \(|F_\epsilon(1+{\mathrm i}t)|\le M_1 {\mathrm e}^{\epsilon+\lambda}\). Damit liefert das Maximumprinzip \(|F_\epsilon(z)|\le \max\{ M_0, M_1 {\mathrm e}^{\epsilon+\lambda}\}\) und für \(\epsilon\to0\) folgt \[\begin{gathered} |F(\theta+{\mathrm i}t) | \le {\mathrm e}^{-\epsilon(\theta^2-t^2)} \max\{ M_0 {\mathrm e}^{-\theta\lambda}, M_1 {\mathrm e}^{(1-\theta)\lambda+\epsilon}\} \\ \to \max \{ M_0 \rho^{-\theta} M_1\rho^{1-\theta}\}\end{gathered}\] mit \(\rho={\mathrm e}^\lambda\). Die rechte Seite wird minimal für \(M_0\rho^{-\theta}=M_1\rho^{1-\theta}\), d.h., \(\rho=M_0/M_1\), und die Behauptung folgt. ◻
Es bleibt, Beispiele für die Anwendung des Satzes zu geben. Sie sind alle klassisch und als Aussagen im Verlaufe der Vorlesung teilweise benutzt worden.
Eine erste Anwendung ist die Beschränktheit der Fouriertransformation zwischen \(\mathrm L^p\)-Räumen.
Satz 4.2 ( Hausdorff–Young-Ungleichung 47). Die Fouriertransformation \(\mathscr F\) ist ein stetiger linearer Operator \(\mathrm L^p({\mathbb R}^n)\to \mathrm L^{p'}({\mathbb R}^n)\) für alle \(1\le p\le 2\) und erfüllt \[\| \mathscr F f \|_{p'} \le (2\pi)^{-n(\frac1p-\frac12)} \|f\|_p.\]
Proof. Für \(p=p'=2\) gilt der Satz von Plancherel, \(\|\mathscr Ff\|_2=\|f\|_2\), sowie \[\|\mathscr Ff\|_\infty = (2\pi)^{-n/2} \sup_\xi\left| \int_{{\mathbb R}^n} {\mathrm e}^{{\mathrm i}x\cdot\xi} f(x){\,\mathrm d}x\right| \le (2\pi)^{-n/2} \|f\|_1.\] Damit folgt die Behauptung mit dem Satz von Riesz–Thorin. ◻
Als zweites Beispiel geben wir einen kurzen Beweis der Faltungsungleichung. Man mache sich eine Skizze für die Beweisschritte in einem \(1/p\)–\(1/q\)–Diagramm.
Satz 4.3 ( Young-Ungleichung ). Seien \(f\in\mathrm L^p({\mathbb R}^n)\) und \(g\in\mathrm L^q({\mathbb R}^n)\) mit \(\frac1r=\frac1p-\frac1{q'}=\frac1p+\frac1q-1\ge 0\). Dann gilt \(f*g\in\mathrm L^r({\mathbb R}^n)\) sowie \[\|f*g\|_r \le \|f\|_p \|g\|_q.\]
Proof. Es bleibt wiederum Grenzfälle zu betrachten. Es gilt für \(p=q=r=1\) \[\| f*g\|_1 \le \|f\|_1 \|g\|_1,\] wie man für nichtnegative Funktionen sofort mit Hilfe des Satzes von Fubini zeigen kann. Weiter gilt offensichtlich für \(p=1\) und \(q=\infty\) \[\| f*g\|_\infty = \sup_x \left| \int f(x-y) g(y){\,\mathrm d}y\right| \le \|f\|_1 \|g\|_\infty.\] Damit liefert aber Riesz–Thorin \(\mathrm L^1*\mathrm L^p \subset \mathrm L^p\) mit der entsprechenden Ungleichung (hier nach Vertauschen der Indices) \[\| f*g\|_p \le \|f\|_p \|g\|_1.\] Weiterhin gilt die Hölder-Ungleichung und damit für \(p=q'\) und \(r=\infty\) \[\| f*g\|_\infty \le \|f\|_p \|g\|_{p'}.\] Damit kann man wiederum Riesz–Thorin anwenden und die Behauptung folgt. ◻
Man kann Riesz–Thorin auch nutzen, um auf Räumen mit verschiedenen Maßen zu interpolieren. Dazu benötigt man allerdings positive Dichtefunktionen bezüglich gemeinsamer \(\sigma\)-endlicher Maße.
Satz 4.4 ( Interpolationssatz von Stein und Weiss 48). Seien \(p_0,p_1,q_0,q_1\in[1,\infty]\), \(\{p_0,p_1\},\{q_0,q_1\}\ne\{1\},\{\infty\}\), \(\omega_j(x)>0\) \(\mu_1\)-f.ü., \(\varpi_j(x)>0\) \(\mu_2\)-f.ü., und seien weiter \[T_j : \mathrm L^{p_j}(\Omega_1, \omega_j(x) {\,\mathrm d}\mu_1(x)) \to \mathrm L^{q_j}(\Omega_2,\varpi_j(x){\,\mathrm d}\mu_2(x)),\qquad j=0,1\] beschränkte Operatoren für die \(T_0f(x) =T_1f(x)\) f.ü. für alle \(f\in\mathcal T(\Omega_1,{\,\mathrm d}\mu_1)\) gilt. Sei weiter \(\theta\in(0,1)\) und \[\frac1p = \frac{1-\theta}{p_0} + \frac{\theta}{p_1}\ne0,\qquad \frac1q = \frac{1-\theta}{q_0} + \frac{\theta}{q_1}\ne0\] und \[\omega_\theta(x) = \omega_0(x)^{1-\theta}\omega_1(x)^{\theta},\qquad \varpi_\theta(x) = \varpi_0(x)^{1-\theta}\varpi_1(x)^{\theta}.\] Dann existiert genau ein beschränkter Operator \(T_\theta\) \[T_\theta : \mathrm L^{p}(\Omega_1,\omega_\theta(x){\,\mathrm d}\mu_1(x)) \to \mathrm L^{q}(\Omega_2,\varpi_\theta(x){\,\mathrm d}\mu_2(x))\] welcher auf \(\mathcal T(\Omega_1,{\,\mathrm d}\mu_1)\) mit \(T_1\) und \(T_2\) übereinstimmt. Dieser erfüllt \[\| T_\theta \|_{p\to q} \le \|T_1\|_{p_0\to q_0} ^{1-\theta} \|T_1\|_{p_1\to q_1}^{\theta}.\]
Proof. Wir bemerken nur die Unterschiede im Beweis: Man steckt die Dichtefunktion mit in die Funktionen \(\varphi\) und \(\psi\), setzt also \[\varphi(x,z) = |f(x)|^{p/p(z)} \frac{f(x)}{|f(x)|} \omega_\theta(x)^{1/p(z)}% \omega_0(x)^{-(1-z)/p_0} \omega_1(x)^{-z/p_1}\] und entsprechend \[\psi(y,z) = |g(y)|^{q'/q'(z)} \frac{g(x)}{|g(x)|} \varpi_\theta(x)^{1/q'(z)}% \omega_0(x)^{-(1-z)/p_0} \omega_1(x)^{-z/p_1}\] Die Argumentation bleibt dieselbe. ◻
Eine typische Anwendung betrifft die Sobolevräume \(\mathrm H^s({\mathbb R}^n)\). Diese sind isometrisch zu \(\mathrm L^2({\mathbb R}^n, \langle\xi\rangle^{2s}{\,\mathrm d}\xi)\). Also folgt direkt (allerdings mit Schwartz-Funktionen als genutzte dichte Teilmenge)
Korollar 4.1. Seien \(s_j, t_j\in{\mathbb R}\), \(j=0,1\) und seien \(T_j : \mathrm H^{s_j}({\mathbb R}^n)\to \mathrm H^{t_j}({\mathbb R}^n)\) zwei beschr"ankte Operatoren, welche auf Schwartz-Funktionen \(\mathscr S({\mathbb R}^n)\) übereinstimmen. Dann gibt es zu \(s_\theta= (1-\theta)s_0+\theta s_1\) und \(t_\theta = (1-\theta) t_0+\theta t_1\), \(\theta\in(0,1)\) genau einen beschränkten Operator \[T_\theta : \mathrm H^{s_\theta}({\mathbb R}^n)\to \mathrm H^{t_\theta}({\mathbb R}^n),\] welcher ebenso auf \(\mathscr S({\mathbb R}^n)\) mit den Operatoren \(T_j\) übereinstimmt. Dieser erfüllt \[\| T_\theta\|_{2,s_\theta\to 2,t_\theta} \le \| T_0\|_{2,s_0\to 2,t_0}^{1-\theta} \|T_1\|_{2,s_1\to2,t_1}^\theta.\]
Beispiel 4.1. Multiplikation mit Funktionen aus \[\mathcal B^k({\mathbb R}^n) = \{ f\in\mathrm C^k({\mathbb R}^n) : \forall_{|\alpha|\l\le k}\; \partial^\alpha f\in\mathrm L^\infty\}\] ist beschränkt auf \(\mathrm H^s({\mathbb R}^n)\) für alle \(-k\le s\le k\). Dies folgt aus der (offensichtlichen) Tatsache für \(s=k\), einem Dualitätsargument für \(s=-k\) und dann durch Interpolation.
Es gibt ein zweites fundamentales Interpolationsresultat, welches keine komplexe Analysis nutzt.
Für eine komplexwertige messbare Funktion \(f\) auf einem Maßraum \((\Omega,\mathcal B,\mu)\) definiert man die Verteilungsfunktion 49 \[\mu_f(\lambda) = \mu_f(\lambda;\mu) = \mu(\{ x\in \Omega : |f(x)|> \lambda \}).\] Damit gilt (siehe [eq:2.2.42] und [eq:2.2.43]) \[\| f\|_p^p = p \int_0^\infty \lambda^p \mu_f(\lambda) \frac{{\,\mathrm d}\lambda}\lambda \qquad\text{ und }\qquad [f]_{p,\infty} = \sup_{\lambda>0} \lambda \mu_f(\lambda)^{1/p} \le \|f\|_p.\]
Eine Abbildung \(T\) messbarer Funktionen von \((\Omega_1,\mathcal B_1,\mu_1)\) nach \((\Omega_2,\mathcal B_2,\mu_2)\) heißt sublinear , falls \[|T(f_1+f_2)(x)| \le |Tf_1(x)| + |Tf_2(x)|\] punktweise fast überall gilt. Eine sublineare Abbildung heißt vom schwachen \((p,q)\)-Typ , falls es eine Konstante \(C\) mit \[_{q,\infty} \le C \|f\|_p\] für alle Treppenfunktionen \(f\in\mathrm L^p(\Omega_1,{\,\mathrm d}\mu_1)\) gibt und entsprechend vom starken \((p,q)\)-Typ falls \[\| Tf\|_{q} \le C \|f\|_p\] gilt. Dies verallgemeinert den Begriff eines beschränkten Operators \(\mathrm L^p\to \mathrm L^p\). Die jeweils kleinsten dabei zulässigen Konstanten werden als \((p,q)\)-Norm beziehungsweise als schwache \((p,q)\)-Norm des sublinearen Operators bezeichnet. Man beachte: schwacher \((p,\infty)\)-Typ ist dasselbe wie starker \((p,\infty)\)-Typ.
Angewandt auf lineare Operatoren besagt der nachfolgende Interpolationssatz von Marcinkiewicz50, dass die Interpolation von Operatoren von schwachem \((p_j,p_j)\)-Typ beschränkte Operatoren auf allen dazwischenliegenden Räumen liefert. Genauer gilt
Satz 4.5 ( Marcinkiewicz ). Sei \(T\) sublinear vom schwachen Typ \((p_j,q_j)\), \(j=0,1\), für gegebene \(1\le p_j\le q_j\le\infty\) und \(q_0\ne q_1\). Dann ist \(T\) vom starken \((p_\theta,q_\theta)\)-Typ für alle \[\frac1{p_\theta} = \frac{1-\theta}{p_0} + \frac{\theta}{p_1},\qquad \frac1{q_\theta}=\frac{1-\theta}{q_0}+\frac\theta{q_1}\] mit \(\theta\in(0,1)\).
Proof. OBdA sei \(p_0\le p_1\) und sei \(f\in\mathrm L^p(\Omega_1,{\,\mathrm d}\mu_1)\) mit \(p_0\le p\le p_1\). Für eine Zahl \(\rho>0\) betrachten wir die Zerlegung \[f=f_{0,\rho}+f_{1,\rho},\qquad f_{1,\rho}(x) = \begin{cases} f(x) ,\qquad & |f(x)|\le \rho\\\rho {\mathrm e}^{{\mathrm i}\arg f} , & \text{sonst}. \end{cases}\] Dann gilt \(|f_{1,\rho}|=\min\{ |f|,\rho \}\) und \(|f|=|f_{0,\rho}|+|f_{1,\rho}|\). Weiter gilt nach Konstruktion \[\begin{aligned} \mu_{f_{1,\rho}}(\sigma) &= \mu_f(\sigma), \qquad &&0\le\sigma\le \rho,\\ \mu_{f_{1,\rho}}(\sigma) &= 0, && \sigma>\rho,\\ \mu_{f_{0,\rho}}(\sigma) &= \mu_f(\sigma+\rho), && \sigma>0.\end{aligned}\] Damit ist \(f_{0,\rho}\in\mathrm L^1\cap \mathrm L^p\subset \mathrm L^{p_0}\) und \(f_{1,\rho}\in\mathrm L^p\cap\mathrm L^\infty\subset\mathrm L^{p_1}\).
Setzt man nun \(h_{0,\rho}=Tf_{0,\rho}\) und \(h_{1,\rho}=Tf_{1,\rho}\), so gilt wegen der Sublinearität für \(h=Tf\) schon \(|h|\le |h_{0,\rho}|+|h_{1,\rho}|\). Also gilt für \(\lambda>0\) die Ungleichung \(|h(x)|>2\lambda\) an mindestens all den Punkten \(x\) an denen \(|h_{0,\rho}(x)|>\lambda\) und \(|h_{1,\rho}(x)|>\lambda\) gilt. Also folgt für die zugehörigen Verteilungsfunktionen (für \(q_1<\infty\)) \[\mu_{h}(2\lambda) \le \mu_{h_{0,\rho}}(\lambda)+\mu_{h_{1,\rho}}(\lambda) \le M_0^{q_0} \lambda^{-q_0} \|f_{0,\rho} \|_{p_0}^{q_0} + M_1^{q_1} \lambda^{-q_1} \|f_{1,\rho} \|_{p_1}^{q_1}.\] Die rechte Seite hängt dabei natürlich von der Wahl von \(\rho\) ab, die Hauptidee des Beweises ist die richtige Wahl von \(\rho\) in Abhängigkeit von \(\lambda\). Wir nutzen die Verteilungsfunktionen zur Abschätzung der Norm \(\|h\|_q\), \[\begin{aligned} \| h\|_q^q &= q \int_0^\infty \lambda^{q-1} \mu_h(\lambda){\,\mathrm d}\lambda = q 2^q \int_0^\infty \lambda^{q-1} \mu_h(2\lambda){\,\mathrm d}\lambda,\end{aligned}\] das dabei auftretende Integral erfüllt weiter (für \(p_1<\infty\)) \[\begin{aligned} \int_0^\infty \lambda^{q-1} \mu_h(2\lambda){\,\mathrm d}\lambda &\le M_0^{q_0} \int_0^\infty \lambda^{q-q_0-1} \left( \int_{\Omega_1} |f_{0,\rho}(x)|^{p_0}{\,\mathrm d}\mu_1(x)\right)^{q_0/p_0} {\,\mathrm d}\lambda \\&\qquad + M_1^{q_1} \int_0^\infty \lambda^{q-q_1-1} \left( \int_{\Omega_1} |f_{1,\rho}(x)|^{p_1}{\,\mathrm d}\mu_1(x)\right)^{q_1/p_1} {\,\mathrm d}\lambda\\ &\le M_0^{q_0} p_0^{q_0/p_0} \int_0^\infty \lambda^{q-q_0-1} \left( \int_0^\infty\sigma^{p_0-1}\mu_f(\sigma+\rho(\lambda)){\,\mathrm d}\sigma \right)^{q_0/p_0} {\,\mathrm d}\lambda \\ &\qquad + M_1^{q_1} p_1^{q_1/p_1} \int_0^\infty \lambda^{q-q_1-1} \left( \int_0^{\rho(\lambda)} \sigma^{p_1-1}\mu_f(\sigma){\,\mathrm d}\sigma \right)^{q_1/p_1} {\,\mathrm d}\lambda \end{aligned}\] in Abhängigkeit der Wahl von \(\rho=\rho(\lambda)\). Der Beweis besteht nun in der Abschätzung der beiden auftretenden Integrale. Wir unterscheiden einige Fälle:
Fall 1: \(p_0<p_1\) und \(q_0<q_1\). Wir setzen \(\rho =( \lambda/\kappa)^{1/\delta}\) mit noch zu bestimmenden Konstanten \(\kappa,\delta>0\). Dann gilt für die beiden abzuschätzenden Integrale (nennen wir sie \(P\) und \(Q\)) durch die umgekehrte Hölder-Ungleichung (Dualität von \(\mathrm L^p\)-Räumen) \[\begin{aligned} P^{p_0/q_0} &=\sup_{\chi_0\ge0} \int_0^\infty \lambda^{q-q_0-1} \left( \int_{\rho(\lambda)}^\infty (\sigma-\rho(\lambda))^{p_0-1} \mu_f(\sigma){\,\mathrm d}\sigma\right) \chi_0(\lambda){\,\mathrm d}\lambda \\ Q^{p_1/q_1} &=\sup_{\chi_1\ge0} \int_0^\infty \lambda^{q-q_1-1} \left( \int_0^{\rho(\lambda)} \sigma^{p_1-1} \mu_f(\sigma){\,\mathrm d}\sigma\right) \chi_1(\lambda){\,\mathrm d}\lambda \end{aligned}\] jeweils mit \[\int_0^\infty \lambda^{q-q_j-1} (\chi_j(\lambda))^{q_j/(q_j-p_j)} {\,\mathrm d}\lambda\le 1,\qquad j=0,1.\]
Das erste abzuschätzende Doppelintegral erfüllt (wegen \((\sigma-\rho)^{p_0-1}\le\sigma^{p_0-1}\)) \[\begin{aligned} \int_0^\infty \lambda^{q-q_0-1} & \left( \int_\rho^\infty (\sigma-\rho)^{p_0-1} \mu_f(\sigma){\,\mathrm d}\sigma\right) \chi_0(\lambda){\,\mathrm d}\lambda\\ & \le \int_0^\infty \sigma^{p_0-1} \mu_f(\sigma) \int_0^{\kappa\sigma^{\delta}} \lambda^{q-q_0-1}\chi_0(\lambda) {\,\mathrm d}\lambda{\,\mathrm d}\sigma\\ &\le \int_0^\infty \sigma^{p_0-1} \mu_f(\sigma) \left( \int_0^{\kappa\sigma^{\delta}} \lambda^{q-q_0-1} {\,\mathrm d}\lambda \right)^{p_0/q_0}\\&\qquad\qquad\qquad \left( \int_0^{\kappa\sigma^{\delta}} \lambda^{q-q_0-1}(\chi_0(\lambda))^{q_0/(q_0-p_0)} {\,\mathrm d}\lambda \right)^{(q_0-p_0)/q_0} {\,\mathrm d}\sigma\\ & \le \kappa^{(q-q_0)p_0/q_0}(q-q_0)^{-p_0/q_0} \int_0^\infty\sigma^{p_0-1+\delta (q-q_0)p_0/q_0} \mu_f(\sigma){\,\mathrm d}\sigma \end{aligned}\] unter Ausnutzung der Hölderschen Ungleichung und von \(q>q_0\). Entsprechend gilt für das zweite \[\begin{aligned} \int_0^\infty \lambda^{q-q_1-1} & \left( \int_0^\rho \sigma^{p_1-1} \mu_f(\sigma){\,\mathrm d}\sigma\right) \chi_1(\lambda){\,\mathrm d}\lambda\\ & \le \int_0^\infty \sigma^{p_1-1} \mu_f(\sigma) \int_{\kappa\sigma^{\delta}}^\infty \lambda^{q-q_1-1}\chi_1(\lambda) {\,\mathrm d}\lambda{\,\mathrm d}\sigma\\ &\le \int_0^\infty \sigma^{p_1-1} \mu_f(\sigma) \left( \int_{\kappa\sigma^{\delta}}^\infty \lambda^{q-q_1-1} {\,\mathrm d}\lambda \right)^{p_1/q_1}\\&\qquad\qquad\qquad \left( \int_{\kappa\sigma^{\delta}}^\infty \lambda^{q-q_1-1}(\chi_1(\lambda))^{q_1/(q_1-p_1)} {\,\mathrm d}\lambda \right)^{(q_1-p_1)/q_1} {\,\mathrm d}\sigma\\ & \le \kappa^{(q-q_1)p_1/q_1}(q_1-q)^{-p_1/q_1} \int_0^\infty\sigma^{p_1-1+\delta (q-q_1)p_1/q_1} \mu_f(\sigma){\,\mathrm d}\sigma \end{aligned}\] Wählt man nun51 \[\delta = \frac{q_0(p-p_0)}{p_0(q-q_0)} = \frac{q_1(p_1-p)}{p_1(q_1-q)},\] so sind die Exponenten in beiden Integralen gerade \(p-1\) und wir haben \[\begin{aligned} \|h\|_q^q &\le q 2^q \bigg( M_0^{q_0} p_0^{q_0/p_0} (q-q_0)^{-1}\kappa^{q-q_0} \left( p^{-1} \|f\|_p^p % \int_0^\infty\sigma^{p-1} \mu_f(\sigma)\d\sigma \right)^{q_0/p_0}\\&\qquad\qquad + M_1^{q_1} p_1^{q_1/p_1} (q_1- q)^{-1} \kappa^{q-q_1} \left( p^{-1} \|f\|_p^p %\int_0^\infty\sigma^{p-1} \mu_f(\sigma)\d\sigma \right)^{q_1/p_1}\bigg)\end{aligned}\] gezeigt. Bleibt die Wahl von \(\kappa\). Diese erfolgt so, dass in beiden Summanden sowohl die Exponenten von \(M_j\) als auch von \(\|f\|_p^p\) gleich sind. Der Ansatz \[\kappa = M_0^\alpha M_1^\beta \|f\|_p^{p\gamma}\] führt damit auf \[\begin{aligned} q_0 + \alpha(q-q_0) &= \alpha (q-q_1) ,\\ \beta(q-q_0) & = q_1 + \beta(q-q_1),\\ \gamma (q-q_0) + q_0/p_0 &= \gamma (q-q_1)+q_1/p_1 \end{aligned}\] und damit auf \[\kappa = M_0^{q_0/(q_0-q_1)}M_1^{q_1/(q_1-q_0)} \|f\|_p^{p (q_1/p_1-q_0/p_0)/(q_1-q_0)}.\] Dies liefert wegen \[\begin{aligned} \frac{q_0(q_1-q)}{q(q_1-q_0)} =1-\theta,\qquad \frac{q_1(q-q_0)}{q(q_1-q_0)}=\theta,\\ \frac{(q_1/p_1-q_0/p_0)(q-q_0)}{q_1-q_0}+\frac{q_0}{p_0}= ... =\frac{q}{p}\end{aligned}\] die Behauptung \[\|h\|_q \le C M_0^{(1-\theta)} M_1^\theta \|f\|_p\] mit einer von \(p_j\), \(q_j\) und \(\theta\) abhängenden Konstanten \(C\).
Fall 2: \(p_0<p_1\) und \(q_0>q_1\). Hier wählt man \(\delta\) entsprechend negativ und beachtet, dass dann die Integrationsgrenzen \((0,\sigma^\delta)\) und \((\sigma^\delta,\infty)\) nach dem Vertauschen der Integrale ausgetauscht werden. Der Rest ist analog.
Fall 3: \(p_0=p_1\). Dies ist einfacher und verbleibt als Übung. Hier reicht \(\rho\) unabhängig von \(\lambda\).
Fall 4: \(q_0<q_1=\infty\) und \(p_0<p_1=\infty\). Hier wählt man \(\rho=\lambda/M_1\). Dann gilt \[\mathop{\mathrm{ess\,sup}}|h_{1,\rho}|\le M_1 \mathop{\mathrm{ess\,sup}}| f_{1,\rho}| \le \lambda\] und damit \[\mu_h(2\lambda) \le \mu_{h_{0,\rho}}(\lambda) \le M_0^{q_0}\lambda^{-q_0} \| f_{0,\rho}\|_{p_0}^{q_0}\] und es bleibt nur ein einziges Integral abzuschätzen. Dies verbleibt ebenso als Übung.
Fall 5: \(q_0<q_1=\infty\) und \(p_0<p_1<\infty\). Hier wählt man \(\rho\) ebenso, dass \(\mu_{h_{1,\rho}}(\lambda)=0\) gilt. Nach Voraussetzung ist \[\mathop{\mathrm{ess\,sup}}|h_{1,\rho}| \le M_1 \|f_{1,\rho}\|_{p_1} = M_1 \left( p_1\int_0^{\rho(\lambda)} \sigma^{p_1-1} \mu_f(\sigma){\,\mathrm d}\sigma\right)^{1/{p_1}}.\] Für \(\rho=(\lambda/\kappa)^{1/\delta}\) mit \(\delta=(p_1-p)/p_1\) und \(\kappa = c M_1 \|f\|_{p}^{p/p_1}\) ist dies kleiner als \(\lambda\) falls \[M_1^{p_1} p_1 \int_0^{\rho} \sigma^{p_1-1} \mu_f(\sigma){\,\mathrm d}\sigma \le \lambda^{p_1} = \kappa^{p_1} \rho^{p_1-p}\] und damit insbesondere falls \[M_1^{p_1} p_1 \rho^{p_1-p} \int_0^{\infty} \sigma^{p-1} \mu_f(\sigma){\,\mathrm d}\sigma \le c^{p_1} M_1^{p_1} \|f\|_p^p \rho^{p_1-p},\] also \(c^{p_1}\ge p_1/p\) gilt. Damit bleibt wiederum nur ein Integral abzuschätzen und die Behauptung folgt analog zum vorherigen Fall. ◻
Bemerkung: Die Normabschätzung für den interpolierten Operator ist hier schlechter als bei Riesz–Thorin, dafür sind die Voraussetzungen am Rand des Interpolationsintervalls auch viel schwächer. Weiterhin funktioniert die hier gezeigte Argumentation auch für reellwertige Funktionen, während die Räume für den Satz von Riesz und Thorin komplex sein müssen.
Eine erste Anwendung sind Maximalabschätzungen. Dazu definieren wir zu einer messbaren Funktion auf dem \({\mathbb R}^n\) die Hardy–Littlewood Maximalfunktion 52 \[\mathcal M f(x) = \sup_{r>0} \frac1{% \!\left\bracevert\!B_r\!\right\bracevert\!\!} \int_{x+B_r} |f(y)|{\,\mathrm d}y\] als Supremum über alle Mittelwerte über Kugeln um \(x\). Dann ist die Zuordnung \(f\mapsto \mathcal M f\) sublinear und es gilt \[\|\mathcal M f\|_\infty \le \|f\|_\infty.\] Tiefer ist nachfolgender Satz. Die zweite Aussage folgt direkt aus der ersten und dem Interpolationssatz von Marcinkiewicz.
Satz 4.6 ( Hardy–Littlewood ).
\(\mathcal M\) ist vom schwachen \((1,1)\)-Typ.
\(\mathcal M\) ist vom starken \((p,p)\)-Typ für alle \(1<p\le \infty\).
Beweisskizze. Es bleibt, die erste Aussage zu zeigen. Diese folgt aus dem Überdeckungssatz von Vitali. Sei \(E_\lambda = \{ x : \mathcal Mf(x) > \lambda\}\) und \(\tilde E_\lambda\subset E_\lambda\) kompakt. Nach Definition existiert also für \(x\in \tilde E_\lambda\) eine Kugel \(B\) um \(x\) mit \[% \!\left\bracevert\!B\!\right\bracevert\!\! < \frac1\lambda \int_B |f(y)|{\,\mathrm d}y.\] Da \(\tilde E_\lambda\) kompakt ist, finden wir somit eine endliche Familie solcher Kugeln die \(\tilde E_\lambda\) überdeckt. Aus dieser wählen wir mit dem Lemma von Vitali eine disjunkte Teilfamilie aus und erhalten für diese \[% \!\left\bracevert\!\tilde E_\lambda\!\right\bracevert\!\! \le 3^n \sum_{k=1}^m % \!\left\bracevert\!B^{(j)} \!\right\bracevert\!\! \le 3^n \frac1{\lambda} \int_{E_\lambda} |f(x)|{\,\mathrm d}x.\] Die zweite Ungleichung ergibt sich dabei direkt aus der Disjunktheit. Bildet man das Supremum über alle kompakten \(\tilde E_\lambda\subset E_\lambda\), so folgt \[% \!\left\bracevert\! E_\lambda\!\right\bracevert\!\! \le 3^n \frac1{\lambda} \int |f(x)|{\,\mathrm d}x.\] und damit die Behauptung. ◻
Lemma 4.2 ( Vitali’s Überdeckungslemma 53). Sei \(E\subset{\mathbb R}^n\) messbar und \(E\subset \bigcup_{j} B^{(j)}\) mit endlich vielen Bällen \(B^{(j)} = B_{r_j}(x_j)\). Dann existiert eine disjunkte Teilfamilie \(B_1,\ldots , B_m\) mit \(B_i\cap B_j=\varnothing\) für \(i\ne j\) und \[\sum_{k=1}^m % \!\left\bracevert\!B_k\!\right\bracevert\!\! \ge 3^{-n} % \!\left\bracevert\!E\!\right\bracevert\!\!.\]
Proof. Sei \(B_1\) ein Ball mit maximalem Radius. Sei weiter \(B_2\) ein Ball mit maximalem Radius aus der Menge der Bälle, die \(B_1\) nicht berühren, und entsprechend \(B_j\) maximal unter den Bällen, die \(B_1,\ldots , B_{j-1}\) nicht berühren. Dies wird fortgesetzt, bis sich kein solcher Ball mehr findet. Dann berühren die restlichen Bälle, welche die in der Menge enthalten sind. Weiter haben diese auch Radien die jeweils kleiner sind. Die Aussage folgt. Jeder Ball mit Radius kleiner \(r\), der \(B_r(x)\) berührt, liegt offenbar innerhalb \(B_{3r}(x)\) und die auf das dreifache vergrößerten Bälle \(B_j\) überdecken schon \(E\). ◻
Für den \(n\)-dimensionalen Poissonkern \(P_t(x)\) gilt die Abschätzung \[\sup_{t>0} |P_t * f| \le C \mathcal M f\] und die Poissonsche Maximalfunktion ist ebenso vom schwachen \((1,1)\)-Typ.
Weitere Anwendungen liefern die Riesz- und Hilberttransformationen. Diese sind ebenso vom schwachen \((1,1)\)-Typ. Zusammen mit ihren Symmetrieeigenschaften folgt \(\mathrm L^p\)-Beschränktheit auf allen \(1<p<\infty\). Statt dies direkt zu zeigen, kann man den nachfolgend wieder angegebenen Satz von Hörmander und Mikhlin anwenden.
Allgemeiner kann man den Multiplikatorensatz von Hörmander–Mikhlin mit dem Satz von Marcinkiewicz beweisen, dafür muss wiederum gezeigt werden, dass jeder so konstruierte Operator vom schwachen \((1,1)\)-Typ ist. Dies soll der Vollständigkeit halber hier noch angefügt werden.
Wir benötigen zuerst ein Lemma zum geeigneten Zerlegen von \(\mathrm L^1\)-Funktionen.
Lemma 4.3 ( Calderon–Zygmund-Zerlegung 54). Sei \(f\in\mathrm L^1({\mathbb R}^n)\) und \(\lambda>0\). Dann existieren Würfel \(Q_j\), \(j=1,2,\ldots\), mit disjunktem Inneren und Kanten parallel zu den Koordinatenachsen, so dass \[\begin{aligned} \label{eq:4:Qj1} \lambda < \frac1{% \!\left\bracevert\!Q_j\!\right\bracevert\!\!} \int_{Q_j} |f(x)| {\,\mathrm d}x \le 2^n \lambda,\notag\\\end{aligned}\] zusammen mit \[\begin{aligned} |f(x)|\le \lambda,\qquad x\not\in \bigcup_j Q_j\end{aligned}\] gilt.
Proof. Wir überdecken die Menge \(\{ |f(x)|>\lambda \}\) durch Würfel \(Q_j^{(0)}\) mit paarweise disjunktem Inneren und \[\int_{Q_j^{(0)}} |f(x)| {\,\mathrm d}x \le\lambda {% \!\left\bracevert\!Q_j^{(0)}\!\right\bracevert\!\!}.\] In einem nächsten Schritt teilt man die Würfel in \(2^n\) Teilwürfel halber Kantenlänge und nummeriert diese als \(Q_j^{(1)}\). Dann gilt entweder \[\begin{aligned} \int_{Q_j^{(1)}} |f(x)| {\,\mathrm d}x \le \lambda {% \!\left\bracevert\!Q_j^{(1)}\!\right\bracevert\!\!} \qquad\text{oder}\qquad \int_{Q_j^{(1)}} |f(x)| {\,\mathrm d}x > \lambda {% \!\left\bracevert\!Q_j^{(1)}\!\right\bracevert\!\!}. \end{aligned}\] Im ersten Fall teilt man die Würfel weiter, im zweiten erfüllt der Würfel schon [eq:4:Qj1] und wird zur Familie der \(Q_j\) hinzugenommen. Punkte, die am Ende nicht durch Würfel überdeckt sind gehören entweder nicht zur ersten Generation und erfüllen \(|f(x)|\le \lambda\) trivialerweise oder liegen in einer Familie von Würfeln \(Q_{j_k}^{(k)}\) mit \(% \!\left\bracevert\!Q_{j_k}^{(k)}\!\right\bracevert\!\!\to0\) und \[\int_{Q_{j_k}^{(k)}} |f(x)| {\,\mathrm d}x \le \lambda {% \!\left\bracevert\!Q_{j_k}^{(k)}\!\right\bracevert\!\!}\] für alle \(k\). Nach dem Lebesgueschen Differentiationssatz folgt daraus \(|f(x)|\le\lambda\) f.ü. auf dieser Menge und das Lemma ist gezeigt. ◻
Satz 4.7 ( Hörmander–Mikhlin ). Sei \(m(\xi)\) eine beschränkte und auf \({\mathbb R}^n\setminus\{0\}\) differenzierbare Funktion mit \[| \partial^\alpha m(\xi) | \le C_\alpha |\xi|^{-|\alpha|} ,\qquad 0\le |\alpha| \le \left\lfloor\frac n2\right\rfloor+1.\] Dann ist der durch \[T_m f (x) = \mathscr F^{-1}_{\xi\to x} [ m(\xi) \widehat f(\xi) ] = (2\pi)^{-n} \iint {\mathrm e}^{{\mathrm i}(x-y)\cdot \xi} m(\xi) f(y) {\,\mathrm d}y{\,\mathrm d}\xi,\qquad f\in\mathscr S({\mathbb R}^n)\] definierte Operator stetig fortsetzbar auf \(\mathrm L^p({\mathbb R}^n)\), \(1<p<\infty\).
Beweisskizze. Es gilt \(T_m : \mathrm L^2({\mathbb R}^n)\to\mathrm L^2({\mathbb R}^n)\) als direkte Konsequenz des Satzes von Plancherel. Weiterhin ist \(T_m^* = T_{\overline{m}}\) und damit implizert die Beschränktheit auf \(\mathrm L^p({\mathbb R}^n)\) die auf \(\mathrm L^{p'}({\mathbb R}^n)\). Damit ist der Satz bewiesen, wenn wir zeigen können, dass \(T_m\) vom schwachen \((1,1)\)-Typ ist.
Sei also \(f\in\mathrm L^1({\mathbb R}^n)\) und \(\lambda>0\). Sei weiter \(Q_j\) eine Familie von Würfeln mit den Eigenschaften aus dem vorherigen Lemma. Damit zerlegt man \(f\) in zwei Teile \[f_0 (x) = \begin{cases} f(x) - % \!\left\bracevert\!Q_j\!\right\bracevert\!\!^{-1} \int_{Q_j} f(x){\,\mathrm d}x,\qquad &x\in Q_j, j=1,2,\ldots\\ 0,\qquad &\text{sonst} \end{cases}\] sowie \(f_1(x)=f(x)-f_0(x)\). Nach Konstruktion gilt \(f_1\in\mathrm L^\infty({\mathbb R}^n)\). Wegen \[\mu_{T_m f} (2\lambda) \le \mu_{T_m f_0}(\lambda) + \mu_{T_m f_1}(\lambda) = \mu_0(\lambda)+\mu_1(\lambda)\] genügt es für beide Teile separat Abschätzungen für die Verteilungsfunktion zu beweisen. Für \(f_1\) kann man die \(\mathrm L^2\)-Beschränktheit von \(T_m\) nutzen, es gilt \[\begin{aligned} \lambda^2 \mu_1(\lambda) &\le \| T_m f_1\|_2^2 \le C \|f_1\|_2^2 \notag \\ &=C_0 \sum_j % \!\left\bracevert\!Q_j\!\right\bracevert\!\!^{-1}\bigg| \int_{Q_j} f(x){\,\mathrm d}x \bigg|^2 + \int_{{\mathbb R}^n\setminus \cup_j Q_j} |f(x)|^2{\,\mathrm d}x \notag \\ & \le C_0 \lambda \left( \sum_j \bigg|\int_{Q_j} f(x){\,\mathrm d}x\bigg| + \int_{{\mathbb R}^n\setminus \cup_j Q_j} |f(x)|{\,\mathrm d}x\right) \notag \\ &\le C_0 \lambda \|f\|_1\end{aligned}\] unter Ausnutzung der Eigenschaften der \(Q_j\). Für \(f_0\) nutzen wir eine weitere Zerlegung \[\mu_0(\lambda) \le % \!\left\bracevert\! \{ |T_m f_0(x) |\ge \lambda\} \cap \cup_j (2Q_j) \!\right\bracevert\!\! + % \!\left\bracevert\!\cup_j (2Q_j)\!\right\bracevert\!\!,\] wobei \(2Q_j\) der Würfel doppelter Kantenlänge mit gleichem Mittelpunkt \(a_k\) und gleicher Ausrichtung im Raum sei. Es gilt wiederum nach Konstruktion der \(Q_j\) \[% \!\left\bracevert\!\cup_j (2Q_j)\!\right\bracevert\!\! \le 2^n \sum_j % \!\left\bracevert\!Q_j\!\right\bracevert\!\! \le 2^n \lambda^{-1} \|f\|_1,\] Für den ersten Term benötigen wir die Voraussetzungen des Multiplikatorensatzes und behaupten, dass diese für den Faltungskern \(K = \mathscr F^{-1} m \in\mathscr S'({\mathbb R}^n)\) \[\int_{{\mathbb R}^n\setminus\cup_j 2Q_j} | K(x-y) - K(x-a_k)|{\,\mathrm d}x \le C,\qquad y\in Q_k\] mit einer von \(k\) unabhängigen Konstanten \(C\) gilt. Damit folgt (da \(f_0\) auf \(Q_k\) verschwindende Mittelwerte besitzt) \[\begin{aligned} \int_{{\mathbb R}^n\setminus\cup_j 2Q_j} | T_m f_0(x) |{\,\mathrm d}x &\le \sum_k \int_{Q_k} \left( \int_{{\mathbb R}^n\setminus\cup_j 2Q_j} | K(x-y) - K(x-a_k) | {\,\mathrm d}x \right) f_0(y) {\,\mathrm d}y\notag\\ & \le C \sum_k \int_{Q_k} |f_0(y)|{\,\mathrm d}y \le C \|f\|_1\end{aligned}\] und somit \(\mu_0(\lambda) \le (C+2^n) \lambda^{-1} \|f\|_1\).
Es bleibt die Aussage zum Faltungskern \(K\) zu zeigen. Sei dazu \(\varphi\in\mathrm C_0^\infty({\mathbb R}^n\setminus\{0\})\) nichtnegativ und mit Träger \(\mathop{\mathrm{supp}}\varphi = \{\xi : 2^{-1} \le |\xi|\le 2\}\) so gewählt, dass \[\sum_{k\in\mathbb Z} \varphi(2^k \xi) = 1,\qquad \xi\ne 0,\] gilt (eine dyadische Zerlegung der Eins). Sei weiter \(m_k(\xi) = m(\xi) \varphi(2^{-k})\) und \(K_k = \mathscr F^{-1} m_k \in \mathrm C^\infty({\mathbb R}^n)\cap\mathrm L^2({\mathbb R}^n)\). Dann genügt es zu zeigen, dass \[\int_{|x|\ge 2 \delta} |K_k(x-y) - K_k(x)|{\,\mathrm d}x \le C \min\{ \delta 2^k, (\delta 2^k)^{-1/2} \}\] für alle \(|y|\le\delta\) gilt, die gesuchte Aussage folgt dann nach Summation über \(k\) (was insbesondere auch beweist, dass \(K\) selbst lokal integrierbar ist für \(x\ne 0\)) und entsprechendes Verschieben.
Die Ungleichung von Cauchy-Schwarz zusammen mit dem Satz von Plancherel implizieren zum Einen für alle \(|y|\le\delta\) (mit Konstanten \(C\) die nur vom Multiplikator \(m\), aber nicht von \(k\) oder \(\delta\) abhängen) \[\begin{aligned} \int_{|x|\ge 2 \delta}& |K_k(x-y) - K_k(x)|{\,\mathrm d}x \le 2 \int_{|x|\ge \delta} |K_k(x)|{\,\mathrm d}x \\ &\le C \bigg( \int_{|x|\ge \delta} |2^k x|^{-2 L } {\,\mathrm d}x\bigg)^{1/2} \bigg( \int_{|x|\ge \delta} |2^k x|^{2 L } |K_k(x)|^2 {\,\mathrm d}x \bigg)^{1/2}\\ &\le C (\delta 2^k)^{n/2-L} 2^{-kn/2} \bigg( \int_{2^{k-1}<|\xi|<2^{k+1}} \sum_{|\alpha|=L} 2^{2k|\alpha|} |\mathrm D^\alpha m_k(\xi)|^2 {\,\mathrm d}\xi\bigg)^{1/2}\\ &\le C (\delta 2^k)^{n/2-L} \le C (\delta 2^k)^{-1/2} \end{aligned}\] mit \(L=\lfloor n/2\rfloor+1\). Andererseits gilt für alle \(|y|\le\delta\) \[\begin{aligned} \int_{|x|\ge 2 \delta}& |K_k(x-y) - K_k(x)|{\,\mathrm d}x \le \int_0^1 \int | y \cdot \nabla K_k(x-\tau y) |{\,\mathrm d}x{\,\mathrm d}\tau \\ &\le C \delta \sum_{j=1}^n \| \partial_j K_k \|_1 \\ &\le C \delta \sum_{j=1}^n \bigg( \int \langle 2^kx\rangle^{-2L} {\,\mathrm d}x \bigg)^{1/2} \bigg( \int \langle 2^kx\rangle^{2L} | \partial_j K_k(x)|^2{\,\mathrm d}x \bigg)^{1/2}\\ &\le C \delta \sum_{j=1}^n 2^{-kn/2} \bigg(\int_{2^{k-1}<|\xi|<2^{k+1}} \sum_{|\alpha|\le L} 2^{2k|\alpha|} |\mathrm D^\alpha \xi_j m_k(\xi)|^2 {\,\mathrm d}\xi\bigg)^{1/2}\\ &\le C \delta 2^k\end{aligned}\] und damit ist die gesuchte Aussage gezeigt. ◻
Die bisher behandelten Interpolationssätze waren konkret in dem Sinne, dass wir die dazwischenliegenden Räume kannten und nur die Operatornormen auf den dazwischenliegenden Räumen abgeschätzt haben. Abstrakte Interpolationsmethoden konstruieren die dazwischenliegenden Räume so, dass Abschätzungen für Operatoren gelten.
Es gibt im wesentlichen zwei verschiedene Zugänge. Dies ist zum Einen die komplexe Interpolation, welche auf den Beweisideen des Satzes von Riesz–Thorin beruht. Diese ist recht elegant, benötigt aber (schwach) holomorphe Funktionen mit Werten in Banachräumen. Andererseits gibt es die reellen Interpolationsmethoden. Diese nutzen Ideen aus dem Marcinkiewicz-Beweis. Wir werden beides kurz vorstellen.
Wir nutzen die Notation der Einleitung. Seien \(\mathbf A_0\) und \(\mathbf A_1\) Funktionenräume in \(\mathcal F\) mit gemeinsamem dichten Teilraum \(\mathcal S\). Ein solches Paar soll im folgenden Interpolationspaar heissen. Seien weiter \(\mathbf A_0\cap\mathbf A_1\) und \(\mathbf A_0+\mathbf A_1\) wie in der Einleitung definiert. Ein Raum zwischen \(\mathbf A_0\) und \(\mathbf A_1\) ist ein Funktionenraum \(\mathbf X\) mit \(\mathbf A_1\cap\mathbf A_2\subset \mathbf X \subset \mathbf A_1+\mathbf A_2\).
\[\xymatrix{ &&& {\mathcal F} \\ &&& {\mathbf A_0+\mathbf A_1} \ar[u] \\ {\mathbf A_0} \ar@/^/[uurrr] \ar[urrr] \ar@{..}[rr] && \mathbf X\ar[ur]\ar@{..}[rr] && \mathbf Y \ar[ul] \ar@{..}[rr] && {\mathbf A_1}\ar@/_/[uulll] \ar[ulll]\\ &&& {\mathbf A_0\cap\mathbf A_1}\ar[ul] \ar[ur] \ar[urrr]\ar[ulll] \\ &&& {\mathcal S} \ar[u] \ar@/^/[uulll] \ar@/_/[uurrr] }\]
Ein Raum zwischen \(\mathbf A_0\) und \(\mathbf A_1\) heißt Interpolationsraum bezüglich des Paares \((\mathbf A_0,\mathbf A_1)\), wenn jede lineare Abbildung \(T:\mathcal S\to\mathbf A_0\cap\mathbf A_1\subset \mathcal F\), welche stetige Fortsetzungen \(\mathbf A_0\to\mathbf A_0\) und \(\mathbf A_1\to\mathbf A_1\) besitzt, auch stetig \(\mathbf X\to\mathbf X\) fortgesetzt werden kann. Triviale Beispiele von Interpolationsräumen sind der Durchschnitt \(\mathbf A_0\cap\mathbf A_1\) und die Summe \(\mathbf A_0+\mathbf A_1\) eines Interpolationspaares. Man zeige dies!
Ein Interpolationsverfahren konstruiert (meist in Abhängigkeit von einem Parameter \(\theta\)) Interpolationsräume zwischen \(\mathbf A_0\) und \(\mathbf A_1\). Bezeichnet man diese mit \(\mathbf A_\theta\), so erhält man eine Raumskale. Verschiedene Interpolationsverfahren führen auf verschiedene Raumskalen.
Komplexe Interpolation nutzt holomorphe Funktionen mit Werten in Funktionenräumen. Sei dazu \(U\subset{\mathbb C}\) offen und \(\mathbf A\) ein komplexer Banachraum. Eine Funktion \(f : U \to \mathbf A\), die jeder Zahl \(z\in U\) ein Element \(f(z)\in\mathbf A\) zuordnet, heisst dann schwach holomorph , falls für alle \(\phi\in\mathbf A'\) die (nun \({\mathbb C}\)-wertige) Funktion \[z \mapsto \langle\phi, f(z)\rangle\] holomorph in \(U\) ist. Konvergiert eine Folge \(f_n\) solcher Funktionen lokal gleichmäßig schwach, d.h., gilt für jedes Kompaktum \(K\subset U\), jedes \(\phi\in\mathbf A'\) und eine stetige Funktion \(f:U\to\mathbf A\) \[\sup_{z\in K} \langle\phi,f_n(z)-f(z)\rangle \to 0,\qquad n\to\infty,\] so ist die entstehende Grenzfunktion wiederum (schwach) holomorph. Dies ergibt sich direkt als Konsequenz des Satzes von Morera angewandt auf die skalaren Funktionen und die gleichmäßige Konvergenz von \(\langle\phi, f_n(z)\rangle \to \langle \phi,f(z)\rangle\) auf jeder nullhomotopen Kurve in \(K\).
Sei im folgenden \(S=\{ z\in{\mathbb C}: 0<\Re z<1 \}\). Sei weiterhin \(\mathbf A_0\) und \(\mathbf A_1\) ein Interpolationspaar. Dann bezeichne \(F(\mathbf A_0,\mathbf A_1)\) die Menge aller stetigen und beschränkten Funktionen \(h : \overline S \to \mathbf A_0+\mathbf A_1\), welche auf \(S\) schwach holomorph sind und \(f(j+{\mathrm i}t) \in \mathbf A_j\), \(j=0,1\), stetig mit gleichmäßiger Normschranke erfüllen. Wir schreiben kurz \(F(\mathbf A)=F(\mathbf A,\mathbf A)\).
Lemma 4.4. Versehen mit der Norm \[\| f\|_F = \max \{ \sup_t % \left\|\left. f({\mathrm i}t) \,\right|\, \mathbf A_0 \right\| , \sup_t % \left\|\left. f(1+{\mathrm i}t) \,\right|\, \mathbf A_1 \right\| \}\] ist \(F(\mathbf A_0,\mathbf A_1)\) ein Banachraum.
Proof. Wir zeigen dies in zwei Schritten und betrachten zuerst \(f\in F(\mathbf A)\). Dann gilt für jedes \(\phi\in\mathbf A'\) mit Norm 1 \[| \langle\phi,f(z)\rangle| \le \|f\|_F\] als direkte Konsequenz des Drei-Linien-Satzes. Insbesondere folgt nach Supremumsbildung über alle solchen \(\phi\) \[% \left\|\left. f(z) \,\right|\, \mathbf A \right\| = % \left\|\left. f(z) \,\right|\, \mathbf A'' \right\| \le \|f\|_F.\] Nach Konstruktion ist die Einbettung \(F(\mathbf A_0,\mathbf A_1)\subset F(\mathbf A_0+\mathbf A_1)\) stetig. Sei nun \(f_n\) eine Cauchy-Folge in \(F(\mathbf A_0,\mathbf A_1)\). Dann ist wegen obiger Abschätzung \(f_n(z)\) gleichmäßig in \(z\) Cauchy-Folge in \(\mathbf A_0+\mathbf A_1\) und somit in diesem Raum konvergent gegen ein \(f(z)\). Als gleichmäßiger Grenzwert ist \(f(z)\) stetig in \(z\in\overline S\) und holomorph in \(S\). Weiter ist \(f(j+{\mathrm i}t)\) Cauchy in \(\mathbf A_j\), \(j=0,1\), und somit \[f({\mathrm i}t) \in\mathbf A_0,\qquad f(1+{\mathrm i}t)\in\mathbf A_1\] und das Lemma ist bewiesen. ◻
Der Raum \(F(\mathbf A_0,\mathbf A_1)\) enthält insbesondere alle konstanten Funktionen mit Werten in \(\mathbf A_0\cap\mathbf A_1\). Den Interpolationsraum \(\mathbf A_{[\theta]}\), \(\theta\in(0,1)\) definieren wir nun als \[\mathbf A_{[\theta]} = \{ f(\theta) : f\in F(\mathbf A_0,\mathbf A_1)\},\] versehen mit der Norm \[% \left\|\left. a \,\right|\, \mathbf A_{[\theta]} \right\| = \inf \{ \|f\|_F : f(\theta)=a\}.\] Der so erhaltene Raum ist vollständig (als Quotientenraum eines Banachraumes) und, wie nachfolgendes Lemma insbesondere zeigt, \(\mathbf A_0\cap\mathbf A_1\) ist dicht in ihm.
Lemma 4.5 ( Approximationssatz von Calderon ). Sei \(a\in\mathbf A_{[\theta]}\). Dann existiert für jedes \(\epsilon>0\) ein \(f\in F(\mathbf A_0,\mathbf A_1)\) mit \(f(\theta)=a\) der Form \[f(z) = \sum_{k} {\mathrm e}^{\delta_k z^2 +\lambda_k z} a_k,\qquad \delta_k>0,\quad \lambda_k\in{\mathbb R}, \quad a_k\in\mathbf A_0\cap\mathbf A_1\] mit \(\|f\|_F \le % \left\|\left. a \,\right|\, \mathbf A_{[\theta]} \right\| + \epsilon\).
Proof. Nach Definition von \(\mathbf A_{[\theta]}\) existiert ein \(f\in F(\mathbf A_0,\mathbf A_1)\) mit \(f(\theta)=a\) und \(\|f\|_F \le % \left\|\left. a \,\right|\, \mathbf A_{[\theta]} \right\| + \epsilon/4\). Betrachtet man nun zu \(\delta>0\) die analytischen Funktionen \(g^{(\delta)}(z)={\mathrm e}^{\delta (z-\theta)^2}f(z)\), so folgt \(g(\theta)=f(\theta)\) sowie \(g^{(\delta)}(z) \to f(z)\) lokal gleichmäßig für \(\delta\to0\). Ebenso gilt \(\|g^{(\delta)}\|_F\to \|f\|_F\). Damit finden wir also \(\delta\), so dass für das zugehörige \(g\) schon \(\|g\|_F \le % \left\|\left. a \,\right|\, \mathbf A_{[\theta]} \right\| + \epsilon/2\) gilt.
Zum Beweis des Lemmas nutzt man nun Fourierreihen. Dazu sei \(n\in\mathbb N\) und \[g_n(z) = \sum_{k\in\mathbb Z} g(z+2\pi{\mathrm i}kn)\] die Periodisierung von \(g\) mit Periode \(2\pi{\mathrm i}n\). Dann gilt \(g_n\in F(\mathbf A_0,\mathbf A_1)\), da die Reihe lokal gleichmäßig auf \(\overline S\) konvergiert. Betrachtet man nun \(n\to\infty\), so konvergiert \(g_n(z)\) lokal gleichmäßig gegen \(g(z)\). Damit existieren \(n\) und \(\eta>0\) so, dass \[\| {\mathrm e}^{\eta z^2} g_n(z) - g(z) \|_F \le \epsilon/4.\] Für jedes \(\phi\in(\mathbf A_0+\mathbf A_1)'\) kann man nun die Funktion \(z\mapsto \langle\phi,g_n(z)\rangle\) in eine Fourierreihe entwickeln. Es gilt auf \(S\) \[\begin{aligned} \langle\phi,g_n(x+{\mathrm i}y)\rangle = \sum_{k\in\mathbb Z} \langle\phi, a_{kn}(x) \rangle {\mathrm e}^{(x+{\mathrm i}y)k/n} \end{aligned}\] mit Koeffizienten \[\begin{aligned} \label{eq:4:akn=def} \langle\phi,a_{k,n}(x) \rangle&= \frac 1{2\pi n} \int_{-\pi n}^{\pi n} \langle \phi,g_n(x+{\mathrm i}y)\rangle {\mathrm e}^{-(x+{\mathrm i}y) k/n} {\,\mathrm d}y\\ &=\frac 1{2\pi n} \left\langle\phi, \int_{-\pi n}^{\pi n} g_n(x+{\mathrm i}y) {\mathrm e}^{-(x+{\mathrm i}y) k/n} {\,\mathrm d}y\right\rangle.\notag\end{aligned}\] Da das (jetzt im Innern von \(\langle\cdot,\cdot\rangle\) stehende) Integral aufgrund der Stetigkeit von \(g_n\) als Riemannintegral existiert, bestimmt es den Koeffizienten \[a_{k,n}(x) = \frac 1{2\pi n} \int_{-\pi n}^{\pi n} g_n(x+{\mathrm i}y) {\mathrm e}^{-(x+{\mathrm i}y) k/n} {\,\mathrm d}y\] in \(\mathbf A_0+\mathbf A_1\). Die Koeffizienten sind von \(x\) unabhängig. Ersetzt man in [eq:4:akn=def] auf der rechten Seite \(n\) durch \(mn\), so ändert sich das Integral nicht. Betrachtet man für zwei verschiedene \(x\) das zugehörige Rechteck (vervollständigt durch Strecken am oberen und unteren Ende) und wendet den Integralsatz von Cauchy an, so folgt mit \(m\to\infty\) die Unabhängigkeit von \(a_{k,n}(x)\) von \(x\). Da die Formel ebenso für \(x=0\) und \(x=1\) gilt, folgt darüberhinaus \(a_{k,n}\in\mathbf A_0\cap\mathbf A_1\).
Allerdings konvergiert die so konstruierte Fourierreihe nur schwach (punktweise für alle \(z\in \overline S\) schwach in \(\mathbf A_0+\mathbf A_1\)). Deswegen betrachtet man die Cesaro-Mittel 55 \[\begin{aligned} \sigma_m[g_n](z) &= \sum_{|k|\le m} (1-\frac{|k|}{m+1}) a_{k,n} {\mathrm e}^{kz/n} \notag\\ &= \frac1{m+1} \sum_{K=0}^{m} \sum_{k=-K}^K a_{k,n} {\mathrm e}^{kz/n} = \int C_{m,n}(y-\tilde y) g_n(x+{\mathrm i}\tilde y){\,\mathrm d}\tilde y,\end{aligned}\] darstellbar mit dem positiven Fejer-Kern 56 \(C_{m,n}(y)>0\). Diese konvergieren für \(x=j\in\{0,1\}\) gleichmäßig in \(\mathbf A_j\) gegen \(g_n(j+{\mathrm i}y)\), ebenso in \(\mathbf A_0+\mathbf A_1\) gegen \(g_n(z)\) für \(z\in S\). Wegen ersterem existiert aber ein \(m\), so dass \[\| {\mathrm e}^{\eta z^2} (\sigma_m[g_n](z) - g_n(z)) \|_F \le \epsilon/4.\] Damit ist das Lemma bewiesen, \({\mathrm e}^{\eta z^2} \sigma_m[g_n](z)\) ist von der gesuchten Form. ◻
Es gilt darüberhinaus, ganz analog zum Beweis des Satzes von Riesz–Thorin:
Satz 4.8 ( Komplexe Interpolationsmethode 57). Seien \(\mathbf A_j\), \(\mathbf B_j\), \(j=0,1\), Interpolationspaare und \(T_j : \mathbf A_j\to \mathbf B_j\), \(j=0,1\) Operatoren die auf der dichten Teilmenge \(\mathcal S\) übereinstimmen. Dann ist \(T_j|_\mathcal S\) stetig fortsetzbar zu einem eindeutig bestimmten Operator \[T_{[\theta]} : \mathbf A_{[\theta]} \to \mathbf B_{[\theta]}\] und dieser erfüllt die Normabschätzung \[\| T_{[\theta]} \| \le \|T_0\|^{1-\theta}\|T_1\|^\theta.\]
Proof. Sei \(\epsilon>0\) und \(a\in \mathbf A_{[\theta]}\) mit \(a=f(\theta)\) für ein \(f\in F(\mathbf A_0,\mathbf A_1)\) für welches \(\|f\|_F\le % \left\|\left. a \,\right|\, \mathbf A_{[\theta]} \right\| +\epsilon\) gilt und welches Werte in \(\mathbf A_0\cap\mathbf A_1\) annimmt. Dann ist \(g(z) = \|T_0\|^{z-1} \|T_1\|^{-z} Tf(z)\) analytisch in \(S\) und es gilt \(g\in F(\mathbf B_0,\mathbf B_1)\). Also folgt wegen \(\|g\|_F \le \|f\|_F\) \[% \left\|\left. Ta \,\right|\, \mathbf B_{[\theta]} \right\| \le \|T_0\|^{1-\theta}\|T_1\|^\theta \|g\|_F \le \|T_0\|^{1-\theta}\|T_1\|^\theta ( % \left\|\left. a \,\right|\, \mathbf A_{[\theta]} \right\| +\epsilon)\] für jedes \(\epsilon\) und damit die Behauptung. ◻
Zu zwei Funktionenräumen \(\mathbf A\) und \(\mathbf B\), die ein Interpolationspaar bilden, bezeichnet man den so konstruierten Interpolationsraum oft mit \((\mathbf A,\mathbf B)_{[\theta]}\). Der folgende Satz fasst wesentlich Eigenschaften von Interpolationsräumen zusammen. Gleichheit heisst dabei in der Regel Äquivalenz der Normen, nicht Gleichheit der Normen.
Satz 4.9 ( Komplexe Interpolationsmethode 58). Seien \(\mathbf A\) und \(\mathbf B\) ein Interpolationspaar. Dann gilt für \(\theta, \theta_j\in [0,1]\)
\((\mathbf A,\mathbf B)_{[0]}=\mathbf A\) und \((\mathbf A,\mathbf B)_{[1]}=\mathbf B\).
\((\mathbf A,\mathbf A)_{[\theta]}=\mathbf A\);
\((\mathbf A,\mathbf B)_{[\theta]} = (\mathbf B,\mathbf A)_{[1-\theta]}\);
\(\mathbf A\cap\mathbf B\) dicht in \((\mathbf A,\mathbf B)_{[\theta]}\);
\(\mathbf A\subset \mathbf B\) impliziert \((\mathbf A,\mathbf B)_{[\theta_0]}\subset (\mathbf A,\mathbf B)_{[\theta_1]}\) für \(\theta_0<\theta_1\);
\((\mathbf A,\mathbf B)_{[\theta]}' = (\mathbf A',\mathbf B')_{[\theta]}\) falls einer der Räume reflexiv ist;
( Reiterationssatz ) Sei \(\theta = (1-\eta) \theta_0+ \eta \theta_1\) für ein \(\eta\in(0,1)\). Dann gilt \[((\mathbf A,\mathbf B)_{[\theta_0]}, (\mathbf A,\mathbf B)_{[\theta_1]} )_{[\eta]} = (\mathbf A,\mathbf B)_{[\theta]}.\]
Das erste Beispiel ist der Interpolationssatz von Riesz–Thorin:
Satz 4.10 ( Riesz–Thorin 59). Sei \(1\le p_0<p_1< \infty\) und \(\theta\in(0,1)\). Dann gilt \[( \mathrm L^{p_0}(\Omega,{\,\mathrm d}\mu) ,\mathrm L^{p_1} (\Omega,{\,\mathrm d}\mu) )_{[\theta]} = \mathrm L^{p}(\Omega,{\,\mathrm d}\mu)\] mit \[\frac1p=\frac{1-\theta}{p_0}+\frac\theta{p_1}.\]
Als zweites Beispiel seien Sobolevräume genannt. Es gilt für die durch Besselpotentiale auf dem \({\mathbb R}^n\) definierten Räume
Satz 4.11 ( Komplexe Interpolation von Sobolevräumen ). Seien \(1<p_0,p_1<\infty\) und \(s_0, s_1\in{\mathbb R}\). Dann gilt (bis auf Äquivalenz von Normen) \[( \mathrm W^{s_0,p_0}({\mathbb R}^n) , \mathrm W^{s_1,p_1}({\mathbb R}^n) )_{[\theta]} =\mathrm W^{s,p}({\mathbb R}^n)\] mit \[\frac1p = \frac{1-\theta}{p_0}+\frac\theta{p_1},\qquad s= (1-\theta) s_0 + \theta s_1.\]
Ein Beweis dieser Aussage findet sich im Buch von Bergh und Löfström, .
Für ein \(f\in\mathbf A_0+\mathbf A_1\) sei für \(\lambda >0\) \[\kappa_f(\lambda) = K(\lambda; f, \mathbf A_0, \mathbf A_1) = \inf_{f=f_0+f_1} % \left\|\left. f_0 \,\right|\, \mathbf A_0 \right\| + \lambda % \left\|\left. f_1 \,\right|\, \mathbf A_1 \right\| .\] Für jedes \(\lambda\) ist dies eine Norm auf \(\mathbf A_0+\mathbf A_1\). Wir werden diese über \(\lambda\) wichten. Zu gegebenem \(1\le q\le \infty\) und \(\theta\in(0,1)\) sei dazu \[\label{eq:4:K-n-def} % \left\|\left. f \,\right|\, \mathbf A_{\theta,q} \right\| = \left( \int_0^\infty \lambda^{-q\theta} \kappa_f(\lambda)^q \frac{{\,\mathrm d}\lambda}{\lambda}\right)^{1/q}.\] Dann ist dies eine Normfunktion und definiert einen Funktionenraum \(\mathbf A_{\theta,q}\) zwischen \(\mathbf A_0\) und \(\mathbf A_1\). Der entstehende Raum ist sogar Interpolationsraum und es gilt darüberhinaus
Satz 4.12 ( Reelle Interpolationsmethode 60). Seien \(\mathbf A_j\), \(\mathbf B_j\), \(j=0,1\), Interpolationspaare und \(T_j : \mathbf A_j\to \mathbf B_j\), \(j=0,1\) Operatoren die auf der dichten Teilmenge \(\mathcal S\) übereinstimmen. Dann ist \(T_j|_\mathcal S\) stetig fortsetzbar zu einem eindeutig bestimmten Operator \[T_{\theta,q} : \mathbf A_{\theta,q} \to \mathbf B_{\theta,q}\] und dieser erfüllt die Normabschätzung \[\| T_{\theta,q} \| \le \|T_0\|^{1-\theta}\|T_1\|^\theta.\]
Speziell für \(\mathbf A_0=\mathrm L^1\) und \(\mathbf A_1=\mathrm L^\infty\) (genauer: \(\mathbf A_1\) der Abschluss von \(\mathrm L^1\cap\mathrm L^\infty\) in der Supremumsnorm) steht das \(K\)-Funktional im Zusammenhang mit der Verteilungsfunktion. Dann ist für gegebenes \(\lambda\) die optimale Zerlegung \(f=f_0+f_1\) durch \(f_1(x) = f(x)\) für \(|f(x)|\le \rho\) und \(f_1(x)=\rho \exp({\mathrm i}\arg f(x))\) mit einem noch zu bestimmendem Parameter \(\rho\) gegeben (man muss alle kleinen Funktionswerte in der \(\mathrm L^\infty\)-Norm messen, da sie von dieser gar nicht gesehen werden). Damit ist (für unbeschränktes \(f\)) \[\|f_0\|_1 + \lambda \|f_1\|_\infty = \int_\rho^\infty \mu_f(\sigma){\,\mathrm d}\sigma + \lambda\rho\] schwach differenzierbar in \(\rho\) und das gesuchte Infimum ist ein Minimum und wird bei \(\lambda = \mu_f(\rho)\) angenommen61. Sei \(f^*(\lambda)\) die Umkehrfunktion62 zu \(\mu_f(\sigma)\). Dann gilt \[\kappa_f(\lambda) = \int_{f^*(\lambda)}^\infty \mu_f(\sigma){\,\mathrm d}\sigma + \lambda f^*(\lambda) = \int_0^\lambda t {\,\mathrm d}f^*(t) +\lambda f^*(\lambda) = \int_0^\lambda f^*(t) {\,\mathrm d}t\] mit den Regeln des Riemann–Stieltjes-Integrals. Damit kann man die Interpolationsräume explizit bestimmen. Es gilt da \(f^*\) monoton fällt \[\begin{aligned} \int_0^\infty \lambda^{-q\theta-1} \kappa_f(\lambda)^q {{\,\mathrm d}\lambda} &= \int_0^\infty \lambda^{-q\theta-1} \bigg( \int_0^\lambda f^*(t) {\,\mathrm d}t\bigg)^q {{\,\mathrm d}\lambda}% \notag\\ \ge \int_0^\infty \lambda^{-q\theta-1} \big( \lambda f^*(\lambda) \big)^q {{\,\mathrm d}\lambda} \notag\\ &= \int_0^\infty \lambda^{q(1-\theta)-1} f^*(\lambda)^q {{\,\mathrm d}\lambda} \end{aligned}\] und umgekehrt mittels Hölder und Fubini für \(q(1-\theta)<1\) \[\begin{aligned} \int_0^\infty \lambda^{-q\theta-1} \kappa_f(\lambda)^q {{\,\mathrm d}\lambda} &= \int_0^\infty \lambda^{-q\theta-1} \bigg( \int_0^\lambda f^*(t) {\,\mathrm d}t\bigg)^q {{\,\mathrm d}\lambda} \notag\\ &\le \int_0^\infty \lambda^{-q\theta-1} \bigg(\int_0^\lambda{\,\mathrm d}t \bigg)^{q/q'} \bigg( \int_0^\lambda f^*(t)^q {\,\mathrm d}t\bigg) {{\,\mathrm d}\lambda} \notag\\ &= \int_0^\infty f^*(t)^q \int_t^\infty \lambda^{-q\theta +q -2} {\,\mathrm d}\lambda {\,\mathrm d}t\notag\\ & = (q(1-\theta)-1)^{-1} \int_0^\infty t^{q(1-\theta) -1 } f^*(t)^q {\,\mathrm d}t\end{aligned}\] unter Beachtung von \(q/q'=q-1\).
Beide Aussagen gemeinsam ergeben nun aber, dass der oben definierte Interpolationsraum gerade der Lorentz-Raum \(\mathrm L^{p,q}\) mit \(p=p_\theta=(1-\theta)^{-1}\) ist. Die Einschränkung \(q(1-\theta)<1\) im zweiten Teil kann durch ein komplizierteres Argument umgangen werden, das \(K\)-Funktional charakterisiert alle Lorentzräume. Speziell für \(q=p_\theta\) ergibt sich insbesondere der \(\mathrm L^p\).
Zu zwei Funktionenräumen \(\mathbf A\) und \(\mathbf B\), die ein Interpolationspaar bilden, bezeichnet man den so konstruierten Interpolationsraum oft mit \((\mathbf A,\mathbf B)_{\theta,q}\). Der folgende Satz fasst wesentlich Eigenschaften von Interpolationsräumen zusammen. Gleichheit heisst dabei in der Regel Äquivalenz der Normen, nicht Gleichheit der Normen.
Satz 4.13 ( Reelle Interpolationsmethode 63). Seien \(\mathbf A\) und \(\mathbf B\) ein Interpolationspaar und \(\theta, \theta_j\in(0,1)\), \(1\le q,r\le\infty\). Dann gilt
\((\mathbf A,\mathbf A)_{\theta,q}=\mathbf A\);
\((\mathbf A,\mathbf B)_{\theta,q} = (\mathbf B,\mathbf A)_{1-\theta,q}\);
\((\mathbf A,\mathbf B)_{\theta,q}\subset (\mathbf A,\mathbf B)_{\theta,r}\) für \(q\le r\);
\((\mathbf A,\mathbf B)_{\theta_0,\infty}\cap (\mathbf A,\mathbf B)_{\theta_1,\infty} \subset (\mathbf A,\mathbf B)_{\theta,q}\) für alle \(\theta_0< \theta <\theta_1\) und alle \(q\);
\(\mathbf A\subset \mathbf B\) impliziert \((\mathbf A,\mathbf B)_{\theta_0,q}\subset (\mathbf A,\mathbf B)_{\theta_1,q}\) für \(\theta_0<\theta_1\);
für \(q<\infty\) ist \(\mathbf A\cap\mathbf B\) dicht in \((\mathbf A,\mathbf B)_{\theta,q}\);
\((\mathbf A,\mathbf B)_{\theta,q}' = (\mathbf A',\mathbf B')_{\theta,q'}\) für \(1\le q<\infty\) und \(qq'=q+q'\).
( Reiterationssatz I) Sei \(\theta_0\ne\theta_1\) und \(\theta = (1-\eta) \theta_0+ \eta \theta_1\) für ein \(\eta\in(0,1)\). Dann gilt \[((\mathbf A,\mathbf B)_{\theta_0,q_0}, (\mathbf A,\mathbf B)_{\theta_1,q_1} )_{\eta,q} = (\mathbf A,\mathbf B)_{\theta,q}\] für alle \(q_0,q_1\).
( Reiterationssatz II) Weiter gilt für \(\theta\in(0,1)\) und \(1\le q_0,q_1\le\infty\) \[((\mathbf A,\mathbf B)_{\theta,q_0}, (\mathbf A,\mathbf B)_{\theta,q_1} )_{\eta,q} = (\mathbf A,\mathbf B)_{\theta,q}\] mit \[\frac1q = \frac{1-\eta}{q_0} + \frac\eta{q_1}.\]
Für \(\mathbf A\ne \mathbf B\) gilt \((\mathbf A,\mathbf B)_{\theta,1}\subset (\mathbf A,\mathbf B)_{[\theta]} \subset (\mathbf A,\mathbf B)_{\theta,\infty}\).
Beispiele findet man wieder unter den \(\mathrm L^p\)-Räumen. Im folgenden bezeichne \(\mathrm L^{p,q}(\Omega,{\,\mathrm d}\mu)\) den Lorentz-Raum , allerdings versehen mit der durch den Interpolationsprozess definierten Banachraumstruktur für \(1<p<\infty\) \[\mathrm L^{p,q}(\Omega,{\,\mathrm d}\mu) = ( \mathrm L^1(\Omega,{\,\mathrm d}\mu), \mathrm L^\infty(\Omega,{\,\mathrm d}\mu) )_{\theta,q},\qquad \theta = 1-\frac1q.\] Wiederum gilt \(\mathrm L^{p,p}(\Omega,{\,\mathrm d}\mu)=\mathrm L^p(\Omega,{\,\mathrm d}\mu)\). Obige Rechnung zusammen mit dem Reiterationssatz impliziert
Satz 4.14. Sei \(1\le p_0<p_1\le \infty\), \(\theta\in(0,1)\) und \(1\le q,q_0,q_1\le\infty\). Dann gilt \[( \mathrm L^{p_0,q_0}(\Omega,{\,\mathrm d}\mu) ,\mathrm L^{p_1,q_1} (\Omega,{\,\mathrm d}\mu) )_{\theta,q} = \mathrm L^{p,q}(\Omega,{\,\mathrm d}\mu)\] mit \[\frac1p=\frac{1-\theta}{p_0}+\frac\theta{p_1}.\]
Beim reellen Interpolieren der Sobolevräume ergeben sich in der Regel keine Sobolevräume. Ohne die entstehenden Besov-Räume hier definieren zu wollen, sei der Vollständigkeit halber folgender Satz angegeben. F"ur die durch Besselpotentiale definierten Sobolevräume gilt
Satz 4.15 ( Reelle Interpolation von Sobolevräumen ). Seien \(1<p_0,p_1<\infty\) und \(s_0, s_1\in{\mathbb R}\), \(s_0\ne s_1\). Dann gilt \[( \mathrm W^{s_0,p_0}({\mathbb R}^n) , \mathrm W^{s_1,p_1}({\mathbb R}^n) )_{\theta,q} =\mathrm B^{s}_{p,q}({\mathbb R}^n)\] mit \[\frac1p = \frac{1-\theta}{p_0}+\frac\theta{p_1},\qquad s= (1-\theta) s_0 + \theta s_1.\]
Für gleiche \(s\) und das richtige \(q\) (nämlich \(p\)) ergibt sich dagegen der dazwischenliegende Sobolevraum.
Satz 4.16 ( Reelle Interpolation von Sobolevräumen ). Seien \(1<p_0,p_1<\infty\) und \(s\in{\mathbb R}\). Dann gilt \[( \mathrm W^{s,p_0}({\mathbb R}^n) , \mathrm W^{s,p_1}({\mathbb R}^n) )_{\theta,p} =\mathrm W^{s,p}({\mathbb R}^n)\] mit \[\frac1p = \frac{1-\theta}{p_0}+\frac\theta{p_1}.\]
Beide Aussagen sind im Buch von Bergh und Löfström bewiesen, .
Die Interpolationseigenschaften der Sobolevräume kann man nun nutzen, um den letzten noch fehlenden scharfen Grenzfall des Sobolevschen Einbettungssatzes zu zeigen. Bisher wissen wir nur \(\mathrm W^{s,p}({\mathbb R}^n) \subset \mathrm L^{p^*,\infty}({\mathbb R}^n)\) mit \(p^*=\frac{np}{n-sp}\) für \(sp<n\). Interpoliert man das (für festes \(s\) und variierendes \(p\)) reell und wendet obiges Theorem an, so folgt daraus64 \[\mathrm W^{s,p} = (\mathrm W^{s,p_0},\mathrm W^{s,p_1})_{\theta,p} \subset (\mathrm L^{p_0^*,\infty},\mathrm L^{p_1^*,\infty})_{\theta,p} = \mathrm L^{p^*,p}\] für \[\frac1{p} = \frac{1-\theta}{p_0} + \frac{\theta}{p_1} ,\qquad \frac1{p^*} = \frac{1-\theta}{p_0^*} + \frac\theta{p_1^*} = \frac{1-\theta}{p_0} + \frac{\theta}{p_1} - \frac sn\] und somit \(\mathrm W^{s,p}\subset \mathrm L^{p^*,p}\cap \mathrm L^{p^*,\infty}\subset \mathrm L^{p^*}\), d.h.,
Satz 4.17 ( Sobolevscher Einbettungssatz ). Sei \(sp<n\) und \(p^*=\frac{np}{n-sp}\). Dann ist die Einbettung \(\mathrm W^{s,p}({\mathbb R}^n)\hookrightarrow \mathrm L^{p^*}({\mathbb R}^n)\) stetig.
99 Robert A. Adams und John J.F. Fournier.
Jöran Bergh und Jörgen Löfström. Springer-Verlag, 1976.
Manfred Dobrowolski. Springer-Verlag, 2006.
Vladimir Maz’ya.
William McLean. Cambridge University Press, 2000.
Walter Rudin. Oldenbourg, 2009.
Elias M. Stein. Princeton University Press, 1970.
Elias M. Stein und Guido Weiss. Princeton University Press, 1971.
Elias M. Stein. Princeton University Press, 1993.
Tatiana Suslina. Vorlesungsskript, Stuttgart 2004.
Hans Triebel. North-Holland, 1978.
Jens Wirth. Vorlesungsskript, Freiberg 2006.
Antoni Zygmund. Cambridge University Press, 1959.
nach Hermann Minkowski (1864–1909)↩︎
nach Otto Ludwig Hölder (1859–1937)↩︎
nach Marcel Riesz (1886–1969)↩︎
nach Godfrey Harold Hardy (1877–1947)↩︎
nach Stefan Bergman (1895–1977)↩︎
nach Laurent Schwartz (1915–2002)↩︎
nach Michel Plancherel (1885–1967)↩︎
nach Kurt Otto Friedrichs (1901–1982)↩︎
nach Sergej L’vovič Sobolev (1908–1989)↩︎
nach Norman George Meyers (1930–) und James B Serrin (1926–2012)↩︎
nach Lars Valter Hörmander (1931–2012) und Solomon Grigor’evich Mikhlin (1908–1990)↩︎
nach David Hilbert (1862–1943)↩︎
nach Friedrich Wilhelm Bessel (1784–1846)↩︎
nach Alberto Pedro Calderón (1920–1998)↩︎
nach William Henry Young (1863–1942)↩︎
nach George Lorentz (1910–2006)↩︎
Hier sind die Zylinder wichtig, da man Funktionen ein Stück schieben können muss!↩︎
nach Elias M. Stein (1931–)↩︎
nach Frigyes Riesz (1880–1956)↩︎
nach Jaak Peetre (1935–)↩︎
nach L N Slobodeckij↩︎
V.S. Rychkov, On restrictions and extensions of the Besov and Triebel–Lizorkin spaces with respect to Lipschitz domains, J. London Math. Soc. (2) 60 (1999) 237–257↩︎
nach Franz Rellich (1906–1955)↩︎
Zu jedem gegebenen monoton wachsenden \(h\) findet man ein langsamer wachsendes submultiplikatives \(h\); wächst \(h\in \mathrm C^2({\mathbb R}_+)\) langsam genug \(h(r) \le 1+r\) und ist z.B. monoton wachsend und konkav, so folgt \[\sup_{\xi,\eta} \frac{h(|\xi+\eta|)}{h(|\xi|)h(|\eta|)} \le \sup_{r,s} \frac{h(r+s)}{h(r)h(s)} \le \sup_{r, s} (\frac1{h(s)} + \frac{r}{h(r)}\frac{h'(s)}{h(s)}) < \infty\] und \(h\) ist damit submultiplikativ. Für \(h(\xi)=\langle\xi\rangle^s\), \(s>0\), entspricht Submultiplikativität gerade der Peetre-Ungleichung.↩︎
nach Maurice René Fréchet (1878–1973), Andrej Nikolaevič Kolmogorov (1903–1987) und Marcel Riesz↩︎
nach Franz Rellich und Vladimir Iosifovich Kondrashov (1909–1971)↩︎
nach Johann Peter Gustav Lejeune Dirichlet (1805–1859)↩︎
nach Kurt Otto Friedrichs↩︎
nach Karl Neumann (1832–1925)↩︎
nach Henri Poincaré (1854–1912)↩︎
nach Marc-Antoine Parseval des Chênes (1755–1863)↩︎
nach Godfrey Harold Hardy↩︎
nach Siméon Denis Poisson (1781–1840)↩︎
nach Johan Ludwig William Valdemar Jensen (1859–1925)↩︎
nach Rolf Herman Nevanlinna (1895–1980)↩︎
nach Wilhelm Johann Eugen Blaschke (1885–1962)↩︎
nach Marcel Riesz↩︎
nach Arne Carl-August Beurling (1905–1986)↩︎
Sie heißen reell, weil sie auf \({\mathbb R}\) definierte Funktionen enthalten. Die Funktionen in \(\widetilde{\mathcal H}^p\) sind natürlich komplexwertig.↩︎
Für duale \(p\) und \(p'\) ist die Beschränktheit äquivalent. Für \(f\in\mathrm L^p\) und \(g\in\mathrm L^{p'}\) impliziert \(|\langle f, Hg\rangle| = |\langle Hf,g\rangle|\le c \|f\|_p \|g\|_{p'}\) beide Normschranken.↩︎
Charles Louis Fefferman (1949–)↩︎
\(c_n\) ist sogewählt, dass \(\int P_t(x){\,\mathrm d}x=1\) gilt.↩︎
Das ist elementar nachzurechnen, für Details siehe Stein, Singular Integrals, Kap. VII.3. Gilt auf \({\mathbb R}^{n+1}_+\) für eine reellwertige Funktion \(u:{\mathbb R}^{n+1}_+\to{\mathbb R}\) \[\Delta u = v \ge 0\] zusammen mit \(\lim_{t\to0} u(x,t) = \lim_{(x,t)\to\infty} u(x,t) = 0\) (lokal gleichmäßig), so folgt \(u(x,t)\le0\) auf \({\mathbb R}^{n+1}_+\). Man zeige dies!↩︎
siehe Stein, Harmonic Analysis, Kap. I. Für \(h\in\mathrm L^q({\mathbb R}^n)\), \(1<q<\infty\) gilt \[\sup_{t>0} \left| \int_{{\mathbb R}^n} P_t(x-y) h(y) {\,\mathrm d}y \right| \le \sup_{t>0} \int_{{\mathbb R}^n} P_t(x-y) |h(y)| {\,\mathrm d}y = h^*(x) \in \mathrm L^q({\mathbb R}^n).\] Für \(q=1\) ist diese Aussage falsch und charakterisiert die Hardy-Funktionen \(\Re \widetilde{\mathcal H}^1({\mathbb R}^n)\).↩︎
Marcel Riesz und Olof Thorin (1912–2004)↩︎
nach Jacques Salomon Hadamard (1865–1963)↩︎
nach Felix Hausdorff (1868–1942) und William Henry Young↩︎
Elias M. Stein und Guido Weiss (1928–))↩︎
Wenn keine Zweifel am Maß bestehen, lassen wir das Maß \(\mu\) als zweites Argument weg.↩︎
nach Josef Marcinkiewicz (1910–1940)↩︎
Das ist eine Gleichung die \(p\) und \(q\) in Beziehung setzt! Schreibt man \(p\) auf eine und \(q\) auf die andere Seite, so ergibt sich daraus \[\frac{\frac{1}{p_0}-\frac1p}{\frac1p-\frac{1}{p_1}} =\frac{p-p_0}{p_0} \frac{p_1}{p_1-p} =\frac{q-q_0}{q_0} \frac{q_1}{q_1-q} = \frac{\frac1q-\frac1{q_0}}{\frac1{q_1}-\frac1q}\] und damit impliziert \(p=p_\theta\) schon \(q=q_\theta\).↩︎
nach Godfrey Harold Hardy und John Edensor Littlewood (1885–1977)↩︎
nach Giuseppe Vitali (1875–1932)↩︎
nach Alberto Calderon und Antoni Zygmund (1900–1992)↩︎
nach Ernesto Cesàro (1859–1906)↩︎
nach Lipót Féjer (1880–1959)↩︎
nach Alberto Calderon und Jacques Louis Lions (1928–2001)↩︎
nach Alberto Calderon und Jacques Louis Lions↩︎
Die Aussage gilt entsprechend für \(p_1=\infty\), aber dann ist der Schnitt der Räume nicht in beiden dicht und in unserem Sinne liegt somit kein Interpolationspaar vor.↩︎
nach Jacques Louis Lions und Jaak Peetre↩︎
Falls \(\mu_f(\rho)\) unstetig ist, wählt man das \(\rho\) mit \(\mu_f(\rho_+)\le \lambda\le \mu_f(\rho_-)\).↩︎
Genauer, \(f^*(\lambda) = \inf \{ \sigma : \mu_f(\sigma) \le \lambda\}\), so dass \(\int_0^\infty \mu_f(\sigma) {{\,\mathrm d}\sigma}= \int_0^\infty f^*(\lambda){\,\mathrm d}\lambda\).↩︎
nach Jacques Louis Lions und Jaak Peetre↩︎
Es bleibt zu zeigen, dass die Interpolation der Einbettungen wirklich die Einbettung liefert!↩︎