Extrema, und Extrema mit Nebenbedingungen.

Lokale Extrema.

Sei $ \mbox{$M\subseteq\mathbb{R}^n$}$ . Eine Funktion $ \mbox{$f:M\to\mathbb{R}$}$ besitzt ein lokales Minimum (bzw. lokales Maximum) an der Stelle $ \mbox{$x_0\in M$}$ , falls es ein $ \mbox{$\varepsilon>0$}$ gibt, so daß $ \mbox{$f(x_0)\leq f(x)$}$ (bzw. $ \mbox{$f(x_0)\geq f(x)$}$ ) für alle $ \mbox{$x\in B_\varepsilon(x_0)\cap M$}$ .

Die Funktion $ \mbox{$f$}$ hat an der Stelle $ \mbox{$x_0\in M$}$ ein lokales Extremum, wenn $ \mbox{$f$}$ an der Stelle $ \mbox{$x_0$}$ ein lokales Minimum oder lokales Maximum hat.

Notwendige Bedingung. Sei $ \mbox{$x_0$}$ ein innerer Punkt von $ \mbox{$M$}$ , und sei $ \mbox{$f$}$ partiell differenzierbar in $ \mbox{$x_0$}$ . Hat $ \mbox{$f$}$ an der Stelle $ \mbox{$x_0$}$ ein lokales Extremum, so ist $ \mbox{$\nabla f(x_0)=0$}$ .

Ein innerer Punkt $ \mbox{$x_0$}$ von $ \mbox{$M$}$ , für den $ \mbox{$\nabla f(x_0)=0$}$ gilt, heißt kritischer Punkt. Ein kritischer Punkt ist also ein Kandidat für eine lokale Extremstelle.

Hinreichende Bedingung. Sei $ \mbox{$x_0$}$ ein innerer Punkt von $ \mbox{$M$}$ , und sei $ \mbox{$f$}$ zweimal stetig differenzierbar in einer Umgebung von $ \mbox{$x_0$}$ . Ist $ \mbox{$\nabla f(x_0)=0$}$ und $ \mbox{$\text{H}_f(x_0)$}$ positiv definit (bzw. negativ definit), so besitzt $ \mbox{$f$}$ ein lokales Minimum (bzw. lokales Maximum) an der Stelle $ \mbox{$x_0$}$ .

Ist $ \mbox{$\nabla f(x_0)=0$}$ und $ \mbox{$\text{H}_f(x_0)$}$ indefinit, so nennt man $ \mbox{$x_0$}$ einen Sattelpunkt von $ \mbox{$f$}$ . Es gibt dann für alle $ \mbox{$\varepsilon>0$}$ Punkte $ \mbox{$x_1,\, x_2\,\in\, B_\varepsilon (x_0)$}$ mit $ \mbox{$f(x_1) < f(x_0) < f(x_2)$}$ .

Multiplikatorenregel von Lagrange.

Sei $ \mbox{$M\subseteq\mathbb{R}^n$}$ . Seien $ \mbox{$f:M\to\mathbb{R}$}$ und $ \mbox{$g: M \to \mathbb{R}^m$}$ . Sei $ \mbox{$V(g) := \{x\in M\; :\; g(x) = 0\}$}$ die Menge der Nullstellen von $ \mbox{$g$}$ auf $ \mbox{$M$}$ .

Wir sagen, $ \mbox{$f$}$ besitzt ein lokales Minimum (bzw. lokales Maximum, bzw. lokales Extremum) unter der Nebenbedingung $ \mbox{$g=0$}$ an der Stelle $ \mbox{$x_0\in M$}$ , falls $ \mbox{$x_0\in V(g)$}$ und falls $ \mbox{$f\vert _{V(g)}$}$ bei $ \mbox{$x_0$}$ ein lokales Minimum (bzw. lokales Maximum, bzw. lokales Extremum) besitzt.

Notwendige Bedingung. Sei $ \mbox{$M\subseteq\mathbb{R}^n$}$ offen, und seien $ \mbox{$f:M\to\mathbb{R}$}$ und $ \mbox{$g: M \to \mathbb{R}^m$}$ stetig differenzierbar. Hat $ \mbox{$f$}$ ein lokales Extremum an der Stelle $ \mbox{$x_0$}$ unter der Nebenbedingung $ \mbox{$g=0$}$ , und gilt $ \mbox{$\text{Rang } g'(x_0)=m$}$ , so gibt es ein $ \mbox{$\lambda \in \mathbb{R}^m$}$ mit $ \mbox{$f'(x_0) = \lambda^\text{t} g'(x_0)$}$ . Der Vektor $ \mbox{$\lambda$}$ heißt Lagrangescher Multiplikator.

Diese Bedingung leitet sich folgendermaßen her. Ein Vektor an $ \mbox{$x_0$}$ in $ \mbox{$\mathbb{R}^n$}$ steht tangential zu $ \mbox{$V(g)$}$ genau dann, wenn er im Kern von $ \mbox{$g'(x_0)$}$ liegt. Notwendige Bedingung für ein lokales Minimum ist, daß entlang dieser Tangentialrichtungen die Richtungsableitung von $ \mbox{$f$}$ verschwindet. Es sollte also ein Vektor im Kern von $ \mbox{$g'(x_0)$}$ auch im Kern von $ \mbox{$f'(x_0)$}$ liegen, d.h. der Kern der gestapelten Matrix $ \mbox{$\begin{pmatrix}g'(x_0) \\  f'(x_0)\end{pmatrix}$}$ sollte gleich dem Kern von $ \mbox{$g'(x_0)$}$ sein. Aus Ranggründen muß also $ \mbox{$f'(x_0)$}$ im Erzeugnis des Zeilenraumes von $ \mbox{$g'(x_0)$}$ liegen.

Setze $ \mbox{$F(x) := f(x) - \lambda g(x)$}$ für $ \mbox{$x\in M$}$ .

Ein Punkt $ \mbox{$x_0\in V(g)\,$}$ , der innerer Punkt von $ \mbox{$M$}$ ist, und für den $ \mbox{$F'(x_0) = 0$}$ und $ \mbox{$\text{Rang } g'(x_0)=m$}$ gilt, heißt regulärer kritischer Punkt. Ein regulärer kritischer Punkt ist also ein Kandidat für eine lokale Extremstelle unter der Nebenbedingung $ \mbox{$g=0$}$ , welcher (dank $ \mbox{$\text{Rang } g'(x_0)=m$}$ , i.e. dank Regularität) mit den Lagrangeschen Methoden behandelt werden kann.

Hinreichende Bedingung. Sei $ \mbox{$M\subseteq\mathbb{R}^n$}$ offen, und seien $ \mbox{$f:M\to\mathbb{R}$}$ und $ \mbox{$g: M \to \mathbb{R}^m$}$ zweimal stetig differenzierbar, sei $ \mbox{$g(x_0) = 0$}$ , und sei $ \mbox{$\text{Rang } g'(x_0)=m$}$ . Enthalte die Matrix $ \mbox{$\text{T}_g(x_0)\in\mathbb{R}^{n\ti(n-m)}$}$ in den Spalten ein Basis des Kerns von $ \mbox{$g'(x_0)$}$ , i.e. sei $ \mbox{$\text{Bild } \text{T}_g(x_0) = \text{Kern }g'(x_0)$}$ . Sei wieder $ \mbox{$F(x) := f(x) - \lambda g(x)$}$ , und zwar nun mit dem Lagrange-Multiplikator $ \mbox{$\lambda$}$ an der Stelle $ \mbox{$x_0$}$ , den man aus der notwendigen Bedingung erhält, i.e. für den $ \mbox{$f'(x_0) = \lambda^\text{t} g'(x_0)$}$ ist.

Ist nun die relative Hessematrix

$ \mbox{$\displaystyle
\text{H}_{f;g}(x_0) \; :=\; \text{T}_g(x_0)^\text{t}\, \text{H}_F(x_0) \text{T}_g(x_0) \;\in\; \mathbb{R}^{(n-m)\times (n-m)}
$}$
positiv definit (bzw. negativ definit, bzw. definit), so besitzt $ \mbox{$f$}$ ein lokales Minimum (bzw. lokales Maximum, bzw. lokales Extremum) unter der Nebenbedingung $ \mbox{$g=0$}$ an der Stelle $ \mbox{$x_0\in M$}$ .

Beachte, daß die relative Hessematrix $ \mbox{$\text{H}_{f;g}(x_0)$}$ nicht nur von $ \mbox{$g$}$ und $ \mbox{$x_0$}$ , sondern auch von der Wahl der Basis des Kerns von $ \mbox{$g'(x_0)$}$ abhängt.

Diese Bedingung leitet sich folgendermaßen her. Lokal bei $ \mbox{$x_0$}$ können wir $ \mbox{$V(g)$}$ wie folgt beschreiben. Sei $ \mbox{$T := \text{T}_g(x_0)$}$ eine Matrix, deren Spalten eine Basis des Kerns von $ \mbox{$g'(x_0)$}$ bilden. Sei $ \mbox{$N := \text{N}_g(x_0)$}$ so, daß $ \mbox{$g'(x_0) N = \text{E}_m$}$ .

Beachte, daß dann insbesondere $ \mbox{$f'(x_0) T = \lambda^\text{t} g'(x_0) T = 0$}$ und $ \mbox{$f'(x_0) N = \lambda^\text{t} g'(x_0) N = \lambda^\text{t}$}$ sind.

Wir fragen uns, wie $ \mbox{$z\in\mathbb{R}^m$}$ von $ \mbox{$y\in\mathbb{R}^{n-m}$}$ abhängt, so daß $ \mbox{$g(x_0 + T y + N z) = 0$}$ ist. Bis auf Glieder von Ordnung $ \mbox{$\ge 3$}$ schreibt sich diese Bedingung nach Taylor mit $ \mbox{$g(x) = \begin{pmatrix}g_1(x)\\  \vdots\\  g_m(x)\end{pmatrix}$}$ als

$ \mbox{$\displaystyle
g_i(x_0) + g_i'(x_0)(T y + N z) + \frac{1}{2}\, (y^\text...
...\text{t} N^\text{t}) \text{H}_{g_i}(x_0) (T y + N z) \; \stackrel{!}{=} \; 0
$}$
für alle $ \mbox{$1\le i\le m$}$ . Nun ist $ \mbox{$g(x_0) = 0$}$ . Ferner ist $ \mbox{$g'(x_0) T = 0$}$ . Desweiteren kann man $ \mbox{$y$}$ als klein von erster Ordnung, und $ \mbox{$z$}$ als klein von zweiter Ordnung ansehen. Bleibt
$ \mbox{$\displaystyle
z_i + \frac{1}{2}\, y^\text{t} T^\text{t} \text{H}_{g_i}(x_0) T y \; \stackrel{!}{=} \; 0
$}$
für alle $ \mbox{$1\le i\le m$}$ , also $ \mbox{$z_i = z_i(y) = - \frac{1}{2}\, y^\text{t} T^\text{t} \text{H}_{g_i}(x_0) T y$}$ .

Setzen wir nun $ \mbox{$x_0 + Ty + N z(y)$}$ in $ \mbox{$f$}$ ein! Wir müssen nach Einsetzen das Extremalverhalten bei $ \mbox{$y = 0$}$ untersuchen. Bis auf Glieder von Ordnung $ \mbox{$\ge 3$}$ erhalten wir dabei mit Taylor

$ \mbox{$\displaystyle
f(x_0) + f'(x_0)(Ty + N z(y)) + \frac{1}{2}\, (y^\text{t} T^\text{t} + z(y)^\text{t} N^\text{t}) \text{H}_f(x_0) (Ty + N z(y))\; .
$}$
Nun ist die Konstante $ \mbox{$f(x_0)$}$ für die Frage nach der Extremalität belanglos, es ist $ \mbox{$f'(x_0) Ty = 0$}$ , es ist $ \mbox{$f'(x_0) N = \lambda^\text{t}$}$ , und es ist $ \mbox{$y$}$ klein von erster, sowie dann $ \mbox{$z(y)$}$ klein von zweiter Ordnung. Bleibt

$ \mbox{$\displaystyle
\begin{array}{rcl}
\lambda^\text{t} z(y) + \frac{1}{2}\,...
...}\, y^\text{t} T^\text{t}\,\text{H}_F(x_0) T y \vspace*{3mm} \\
\end{array}$}$
zu betrachten, welches in $ \mbox{$y = 0$}$ genau dann ein lokales Maximum (resp. Minimum) hat, wenn $ \mbox{$T^\text{t} \text{H}_F(x_0) T$}$ negativ (resp. positiv) definit ist.

Praktische Anwendung der Multiplikatorenregel von Lagrange.

Setze $ \mbox{$F(x) = f(x) - \lambda^\text{t} g(x)$}$ , mit einem zunächst unbekannten Vektor $ \mbox{$\lambda \in \mathbb{R}^m$}$ . Um die regulären kritischen Punkte zu ermitteln, löse man

$ \mbox{$\displaystyle
\begin{array}{rcl}
F'(x) & = & 0 \\
g(x) & = & 0 \; .\\
\end{array}$}$
Das sind $ \mbox{$n + m$}$ Gleichungen ( $ \mbox{$n$}$ von $ \mbox{$F'$}$ , $ \mbox{$m$}$ von $ \mbox{$g$}$ ) für $ \mbox{$n + m$}$ Unbekannte ( $ \mbox{$n$}$ von $ \mbox{$x$}$ , $ \mbox{$m$}$ von $ \mbox{$\lambda$}$ ). Ist $ \mbox{$x_0\in\mathbb{R}^n$}$ zusammen mit einem gewissen $ \mbox{$\lambda \in \mathbb{R}^m$}$ Lösung des Systems, und gilt $ \mbox{$\text{Rang } g'(x_0)=m$}$ , so ist $ \mbox{$x_0$}$ ein regulärer kritischer Punkt.

Sei nun $ \mbox{$x_0$}$ ein regulärer kritischer Punkt. Wir wollen ihn auf Extremalität hin untersuchen. Bilde mit dem bei $ \mbox{$x_0$}$ erhaltenen Lagrangemultiplikator $ \mbox{$\lambda \in \mathbb{R}^m$}$ die Funktion $ \mbox{$F = f - \lambda g$}$ .

Berechne eine Basis des Kerns von $ \mbox{$g'(x_0)$}$ , und schreibe diese Basis als Spalten in die Matrix $ \mbox{$\text{T}_g(x_0)\in\mathbb{R}^{n\times (n-m)}$}$ . Untersuche die relative Hessematrix $ \mbox{$\text{H}_{f;g}(x_0) = \text{T}_g(x_0)^\text{t}\, \text{H}_F(x_0) \text{T}_g(x_0)$}$ auf Definitheit. Ist sie positiv definit (resp. negativ definit), so liegt in $ \mbox{$x_0$}$ ein lokales Minimum (resp. lokales Maximum) von $ \mbox{$f$}$ unter Nebenbedingung $ \mbox{$g=0$}$ vor.

Für verschiedene zu untersuchende reguläre kritische Punkte ist es günstig, sogleich für ein beliebiges konstantes $ \mbox{$\lambda \in \mathbb{R}^m$}$ und beliebiges $ \mbox{$x\in M$}$ die Hessematrix $ \mbox{$\text{H}_F(x)$}$ zu bilden, um dann bei Bedarf Werte einzusetzen.

Vergleiche Barner, Flohr, Analysis II, Kap. 14.7, Aufgabe 15; Jank, Jongen, Höhere Mathematik II für Maschinenbauer, Aachener Beitr. Math. 4, Satz 8.4.12; oder Maurin, K., Analysis. Part I., Th. VIII.4.5, wo dieses hinreichende Lagrangekriterium Wiktor Szczyrba zugeschrieben wird.