Hessematrix auf Unterraum

14/11/2010 - 12:07 von Bernd Funke | Report spam
Moin!

Entwickle ich eine Funktion von n reellen Variablen f(x_1,...,x_n) in eine
Taylor-Reihe, so liefert mir ihre Hesse-Matrix H (insbesondere deren
Eigenwerte) an Stellen, wo der Gradient G von f verschwindet, Informationen
über das Aussehen der Umgebung dieses kritischen Punktes. So weit, so gut.

Verschwindet an einer Stelle der Gradient G nicht, so kann ich dort den
Unterraum der zu ihm orthogonalen Vektoren betrachten und eine
Orthonormal-Basis y1,...,y_n-1 für ihn konstruieren und damit
g(y1,...,y_n-1)=f(x1(y1,...,y_n-1),...,x_n(y1,...,y_n-1)) definieren (die
x_i hàngen dabei von den y_i nur linear ab, klar). Bilde ich davon wieder
die Hesse-Matrix H' und deren Eigenwerte, so erhalte ich mit Letzteren
Informationen über das Aussehen der Umgebung von f "quer zum Gradienten",
die obendrein unabhàngig von der speziellen Wahl der Basis y_i sind.

Nun meine Frage: Gibt's einen bekannten, einfachen Weg, um von der
Hessematrix H und dem Gradienten G an die Eigenwerte der "reduzierten"
Hesse-Matrix H' zu kommen? Oder muss ich tatsàchlich eine konkrete Basis y_i
konstruieren? Gefunden habe ich bisher nur die "gerànderte Hesse-Matrix",
die liefert immerhin das Vorzeichen des Produktes der Eigenwerte von H',
aber das ist mir etwas zu wenig.

Wenn jemand was weiß... danke.

Tschö
Bernd
 

Lesen sie die antworten

#1 karl
14/11/2010 - 15:44 | Warnen spam
Am 14.11.2010 12:07, schrieb Bernd Funke:
Moin!

Entwickle ich eine Funktion von n reellen Variablen f(x_1,...,x_n) in eine
Taylor-Reihe, so liefert mir ihre Hesse-Matrix H (insbesondere deren
Eigenwerte) an Stellen, wo der Gradient G von f verschwindet, Informationen
über das Aussehen der Umgebung dieses kritischen Punktes. So weit, so gut.

Verschwindet an einer Stelle der Gradient G nicht, so kann ich dort den
Unterraum der zu ihm orthogonalen Vektoren betrachten und eine
Orthonormal-Basis y1,...,y_n-1 für ihn konstruieren und damit
g(y1,...,y_n-1)=f(x1(y1,...,y_n-1),...,x_n(y1,...,y_n-1)) definieren (die
x_i hàngen dabei von den y_i nur linear ab, klar). Bilde ich davon wieder
die Hesse-Matrix H' und deren Eigenwerte, so erhalte ich mit Letzteren
Informationen über das Aussehen der Umgebung von f "quer zum Gradienten",
die obendrein unabhàngig von der speziellen Wahl der Basis y_i sind.

Nun meine Frage: Gibt's einen bekannten, einfachen Weg, um von der
Hessematrix H und dem Gradienten G an die Eigenwerte der "reduzierten"
Hesse-Matrix H' zu kommen? Oder muss ich tatsàchlich eine konkrete Basis y_i
konstruieren? Gefunden habe ich bisher nur die "gerànderte Hesse-Matrix",
die liefert immerhin das Vorzeichen des Produktes der Eigenwerte von H',
aber das ist mir etwas zu wenig.

Wenn jemand was weiß... danke.

Tschö
Bernd




Nein, mußt Du nicht. Betrachte den Fall, daß der Gradient in Richtung der x_n-Achse ist und die anderen Achsen den
Tangentialraum aufspannen.
Sei P die Projektionsmatrix auf den von dem Gradienten aufgespannten Unterraum, d.h. P= n n^T, wobei n der normierte
Gradient ist.
Betrachte jetzt (I-P)^T H (I-P), das ist die Projektion der Hessematrix auf den Tangentialraum, addiere zu dieser Matrix
die Matrix P^TP, dann Du hast die Matrix
H^* = (I-P)^T H (I-P) + P^T P
Diese Matrix ist regulàr, wenn die Hessematrix H' auf dem Tangentialraum regulàr ist, und ihre Eigenwerte sind die von
H' plus einmal 1.
(Ich habe nicht immer die Symmetrien der Projektionsmatrizen ausgenützt, damit das Konzept klar wird)
Diese Darstellung ist rotationsinvariant, gilt also auch, wenn der Gradient in andere Richtungen zeigt.

Ciao
Karl

Ähnliche fragen