14. Orthogonale matrices#
In fysische toepassingen zijn orthogonale matrices een belangrijk type matrices. Deze stellen lineaire afbeeldingen voor die afstanden en inproducten tussen vectoren behouden, zoals rotaties en spiegelingen.
14.1. Orthogonale matrices en lineaire afbeeldingen#
Definitie 14.1 (Orthogonale matrix)
Een vierkante matrix \(A\) is orthogonaal als de kolommen van \(A\) een orthonormaal stel vectoren vormen. Equivalent: \(A\) is orthogonaal wanneer \(A\) voldoet aan
Opmerking 14.1
“Orthonormale matrix” zou een logischere naam zijn geweest, maar de term “orthogonale matrix” is ingeburgerd.
We merken op dat de gelijkheid \(A^\top A=I\) betekent dat \(A\) inverteerbaar is met inverse \(A^\top\). Aangezien de inverse van een matrix een tweezijdige inverse is, is dit equivalent met \(AA^\top=I\). We concluderen dat \(A\) orthogonaal is precies wanneer de rijen van \(A\) een orthonormaal stel vectoren vormen.
Voorbeeld 14.1
De matrix
is orthogonaal, met inverse
Het blijkt dat orthogonale matrices corresponderen met lineaire afbeeldingen die inproducten behouden.
Definitie 14.2
Een lineaire afbeelding \(f\colon\RR^n\to\RR^n\) heet orthogonaal als voor alle \(\vx,\vy\in\RR^n\) geldt
Stelling 14.1
Een lineaire afbeelding \(f\colon\RR^n\to\RR^n\) is orthogonaal precies wanneer de standaardmatrix \(A\) van \(f\) een orthogonale matrix is.
Bewijs. Stel dat \(f\) orthogonaal is. Dan geldt in het bijzonder
Dit betekent dat \((f(\ve_1),\ldots,f(\ve_n))\) een orthonormaal stel vectoren in \(\RR^n\) is (en zelfs een orthonormale basis van \(\RR^n\)). Anderzijds zijn \(f(\ve_1),\ldots,f(\ve_n)\) precies de kolommen van de standaardmatrix \(A\) van \(f\). De kolommen van \(A\) zijn dus orthonormaal, dus \(A\) is een orthogonale matrix.
Stel omgekeerd dat \(A\) een orthogonale matrix is. Voor alle \(\vx,\vy\in\RR^n\) berekenen we
waarbij we de eerder bewezen eigenschap \(A\vv\cdot\vw=\vv\cdot A^\top\vw\) gebruikt hebben. Dit laat zien dat \(f\) een orthogonale lineaire afbeelding is.
Eigenvectoren van symmetrische matrices
Definitie 14.3 (Symmetrische matrix)
Een matrix \(A\) heet symmetrisch wanneer de getransponeerde \(A^\top\) van \(A\) gelijk is aan \(A\).
Merk op dat een symmetrische matrix altijd vierkant is.
Stelling 14.2
Bekijk een symmetrische \(n\times n\)-matrix \(A\).
Als \(\vv\) en \(\vw\) eigenvectoren van \(A\) zijn bij verschillende eigenwaarden, dan geldt \(\vv\cdot\vw=0\).
Alle eigenwaarden van \(A\) zijn reëel.
Er zijn een orthogonale \(n\times n\)-matrix \(C\) en een diagonale \(n\times n\)-matrix \(D\) die voldoen aan
\[ A=CDC^{-1}\quad(=CDC^\top). \]
Bewijs. 1. Bekijk eigenvectoren \(\vv\) en \(\vw\) bij eigenwaarden \(\lambda\) en \(\mu\), dus
met \(\lambda\ne\mu\). Omdat \(A\) symmetrisch is, geldt
De linkerkant is gelijk aan \(\lambda\vv\cdot\vw=\lambda(\vv\cdot\vw)\), de rechterkant aan \(\vv\cdot\mu\vw=\mu(\vv\cdot\vw)\). Dit geeft
Aangezien \(\lambda-\mu\ne0\), volgt \(\vv\cdot\vw=0\).
Gegeven een eigenwaarde \(\lambda\in\CC\) van \(A\) en een bijbehorende eigenvector \(\vv\in\CC^n\) moeten we bewijzen dat \(\lambda\) reëel is. Voor twee vectoren \(\vx,\vy\in\CC^n\) schrijven we
We bekijken het complexe getal
Door te gebruiken dat \(\bar A_{j,k}=A_{j,k}=A_{k,j}\), zien we dat de complex geconjugeerde van \(\langle A\vv,\vv\rangle\) gelijk is aan
dus \(\langle A\vv,\vv\rangle\) is reëel. Anderzijds geldt
We merken op dat \(\langle \vv,\vv\rangle=\sum_{j=1}^n|v_j|^2\) reëel en strikt positief is, omdat \(\vv\ne\mathbf{0}\). Hieruit volgt dat
een reëel getal is.
Het bewijs van (3) geven we hier niet.
Een nuttige interpretatie van deel (3) van de stelling is: gegeven een symmetrische \(n\times n\)-matrix \(A\) bestaat er een orthonormale basis van \(\RR^n\) bestaande uit eigenvectoren van \(A\). We zeggen ook wel dat \(A\) orthogonaal diagonaliseerbaar is. Omgekeerd geldt ook: als \(A=CDC^{-1}\) met \(C\) orthogonaal en \(D\) diagonaal, dan geldt
dus \(A\) is symmetrisch.
Voorbeeld 14.2
Bekijk de symmetrische matrix
Een berekening geeft het karakteristiek polynoom
De eigenwaarden van \(A\) zijn dus \(\lambda_1=0\) (met algebraïsche multipliciteit 1) en \(\lambda_2=6\) (met algebraïsche multipliciteit 2). We bepalen de eigenruimten
door matrixvegen. We vegen eerst \(A-0I\):
Deze matrix staat in rijtrapvorm en op de gebruikelijke manier vinden we
We vegen nu \(A-6I\):
Deze matrix staat in rijtrapvorm en op de gebruikelijke manier vinden we
Merk op dat de eigenvector \(\vv_1=\begin{pmatrix}1\\ -1\\ 2\end{pmatrix}\) bij de eigenwaarde \(\lambda_1=0\) inderdaad loodrecht staat op de eigenvectoren \(\vv_2=\begin{pmatrix}1\\ 1\\ 0\end{pmatrix}\) en \(\vv_3=\begin{pmatrix}2\\ 0\\ 1\end{pmatrix}\) bij de eigenwaarde \(\lambda_2=6\). De vectoren \(\vv_2\) en \(\vv_3\) staan echter nog niet loodrecht op elkaar. We berekenen een orthogonale basis door Gram–Schmidt-orthogonalisatie toe te passen op het paar vectoren \((\vv_2,\vv_3)\). Dit geeft de volgende orthogonale basis van eigenvectoren:
Tot slot vinden we een orthonormale basis door te normaliseren:
We concluderen dat \(A=CDC^{-1}\) met
en