Bu Derste Ne Var?
- Dört eşdeğer test: λ > 0, alt-det > 0, pivot > 0, \(\mathbf{x}^T A \mathbf{x} > 0\).
- Kuadratik form — çanak vs eyer.
- Kareye tamamlama = eliminasyon.
- Hessian PD → minimum; ellipsoid = ana eksen teoremi.
“Positive for a number translates into positive definite for a matrix.” — Strang, 26:29
flowchart LR
PD["Pozitif Tanım"] --> T1["λ > 0"]
PD --> T2["pivot > 0"]
PD --> T3["alt-det > 0"]
PD --> T4["⭐ xᵀAx > 0"]
T4 --> QF["Kuadratik form<br/>çanak vs eyer"]
QF --> CS["Kareye tamamlama<br/>= eliminasyon"]
QF --> HESS["Hessian PD<br/>= yerel min"]
HESS --> CONV["Konveks optimizasyon"]
QF --> ELL["Ellipsoid<br/>(eksen = q, uzunluk ∝ 1/√λ)"]
ELL --> PCA["PCA / Mahalanobis"]
style T4 fill:#fff3e0,stroke:#e67e22,stroke-width:3px
style CONV fill:#fce4ec,stroke:#c2185b,stroke-width:2px
style PCA fill:#fce4ec,stroke:#c2185b,stroke-width:2px
- \(\mathbf{x}^T A \mathbf{x}\) = enerji = loss. Min ⟺ Hessian PD.
- Eyer noktaları (negatif λ) = derin öğrenmenin gerçek düşmanı (gradyan = 0 ama min değil).
- Kareye tamamlama = Cholesky (\(A = LL^T\)).
- Ellipsoid = Mahalanobis konturu = PCA yönleri.
Dört Eşdeğer Test
| Özdeğerler |
hepsi > 0 |
| Sol-üst alt-det |
hepsi > 0 |
| Pivotlar |
hepsi > 0 |
| Enerji ⭐ |
\(\mathbf{x}^T A \mathbf{x} > 0 \forall \mathbf{x} \neq \mathbf{0}\) |
Kuadratik Form
\(A = \begin{pmatrix} a & b \\ b & c \end{pmatrix}\):
\[
\mathbf{x}^T A \mathbf{x} = a x^2 + 2 b xy + c y^2
\]
Sınıflar:
- \(\det > 0\), \(a > 0\) → çanak (minimum) → PD.
- \(\det = 0\) → yarı-tanım (λ = 0 var).
- \(\det < 0\) → eyer (negatif λ).
Üç Örnek
Örnek 1 — \(A = \begin{pmatrix} 2 & 6 \\ 6 & 18 \end{pmatrix}\) (yarı-tanım): det = 0; λ = 0, 20.
Örnek 2 — \(\begin{pmatrix} 2 & 6 \\ 6 & 7 \end{pmatrix}\) (eyer): det = \(-22 < 0\). \(\mathbf{x} = (1, -1)\) → \(2 - 12 + 7 = -3 < 0\).
Örnek 3 — \(\begin{pmatrix} 2 & 6 \\ 6 & 20 \end{pmatrix}\) (PD): det = 4 > 0; λ ikisi pozitif; pivot 2, 2.
Kareye Tamamlama = Eliminasyon ⭐
\[
2x^2 + 12xy + 20y^2 = 2(x + 3y)^2 + 2y^2
\]
Pivotlar (2, 2) karelerin dışında; multiplier (3) içeride.
“Completing the square is elimination. The pivots outside, the multiplier inside.” — Strang, 33:05
Pozitif pivot → karelerin pozitif toplamı → her yerde pozitif.
Hessian ve Minimum
Çok değişkende minimum:
- Gradyan = 0 (kritik nokta).
- Hessian PD (eğrilik her yönde yukarı).
\[
H = \begin{pmatrix} f_{xx} & f_{xy} \\ f_{xy} & f_{yy} \end{pmatrix}
\]
Calculus testi \(f_{xx} f_{yy} - f_{xy}^2 > 0\) = 2×2 det.
Builder Notu: Deep learning’de Hessian çoğunlukla PD değil (eyer her yerde). SGD gürültüsü + momentum + Adam eyerden kaçar.
Strang’in 3×3 Favori
\[
A = \begin{pmatrix} 2 & -1 & 0 \\ -1 & 2 & -1 \\ 0 & -1 & 2 \end{pmatrix}
\]
Alt-det: 2, 3, 4. Pivot: \(2, 3/2, 4/3\). λ: \(2-\sqrt 2, 2, 2+\sqrt 2\). PD.
import numpy as np
A = np.array([[2, -1, 0], [-1, 2, -1], [0, -1, 2]], dtype=float)
# Eigenvalues
print("özdeğerler:", np.linalg.eigvalsh(A))
# Sol-üst alt-determinantlar
for k in range(1, 4):
print(f"alt-det {k}×{k}:", np.linalg.det(A[:k, :k]))
# Cholesky (sadece PD'de çalışır)
L = np.linalg.cholesky(A)
print("Cholesky L:\n", L)
Geometri — Ellipsoid
\(\mathbf{x}^T A \mathbf{x} = 1\) → 2×2 elips, 3×3 ellipsoid.
Ana eksen teoremi (\(A = Q\Lambda Q^T\)):
- Yönler: özvektörler (\(Q\)).
- Uzunluklar: \(\propto 1/\sqrt{\lambda_i}\).
Büyük λ → kısa eksen.
Builder Notu: Mahalanobis uzaklığı \(\mathbf{x}^T \Sigma^{-1} \mathbf{x}\) — sabit kontur = ellipsoid; eksenler kovaryansın özvektörleri = PCA yönleri.
Bu Dersin Özeti
- 4 eşdeğer test (yeni: enerji \(\mathbf{x}^T A \mathbf{x}\)).
- Kuadratik form: çanak/eyer.
- Yarı-tanım (det = 0), indefinite (det < 0).
- Kareye tamamlama = eliminasyon.
- Minimum: gradyan = 0 + Hessian PD.
- Geometri: ellipsoid + ana eksen.
PD = tüm özdeğer/pivot/alt-det > 0 = \(\mathbf{x}^T A \mathbf{x} > 0\). Minimum testi: gradyan = 0 + Hessian PD. Geometri: \(\mathbf{x}^T A \mathbf{x} = 1\) ellipsoidi, eksenler = q, uzunluk \(\propto 1/\sqrt\lambda\). Konveks optimizasyon, Mahalanobis, PCA temeli.
Kontrol Soruları
λ > 0, alt-det > 0, pivot > 0, \(\mathbf{x}^T A \mathbf{x} > 0\). Biri sağlanırsa hepsi.
det = 0 → λ = 0, 20. \(\mathbf{x}^T A \mathbf{x} \geq 0\) (sıfır olabilir).
Kareler ≥ 0. Pivot katsayıları > 0 ise toplam > 0 (orijin hariç).
Gradyan = 0 + Hessian PD (1D’deki \(f'' > 0\) genellemesi).
Yön = özvektör, uzunluk \(\propto 1/\sqrt\lambda\) (ana eksen teoremi \(A = Q\Lambda Q^T\)).
Egzersizler
Egzersiz 1. \(A = \text{diag}(3, 5)\) PD mi? \(\mathbf{x}^T A \mathbf{x}\).
Egzersiz 2. \(((1, 2), (2, 1))\) PD mi? (det + enerji)
Egzersiz 3. Hangi \(c\) için \(((1, 2), (2, c))\) PD?
Egzersiz 4. (Python) eigvalsh + Cholesky + alt-det.
Egzersiz 5. İspatla: \(A\) PD → \(A^{-1}\) PD. (İpucu: özdeğer \(1/\lambda\).)
Sonraki Ders İçin Hazırlık
Ders 28: Benzer Matrisler ve Jordan Formu
- Benzer: \(B = M^{-1} A M\) (aynı özdeğer).
- Jordan formu — diagonalize edilemeyen matrisler.
- Egzersiz 5 (\(A^{-1}\) PD).
cholesky ile dene.
Anahtar Kavramlar (Cheat Sheet)
| PD (4 test) |
λ > 0 ⟺ alt-det > 0 ⟺ pivot > 0 ⟺ \(\mathbf{x}^T A \mathbf{x} > 0\) |
| Kuadratik form |
\(ax^2 + 2bxy + cy^2\) |
| Yarı-tanım |
\(\mathbf{x}^T A \mathbf{x} \geq 0\) |
| İndefinite |
det < 0, eyer |
| Kareye tamamlama |
= eliminasyon |
| Min testi |
gradyan = 0 + Hessian PD |
| Hessian simetrik |
\(f_{xy} = f_{yx}\) |
| 2D Calculus |
\(f_{xx} f_{yy} - f_{xy}^2 > 0\) |
| Geometri |
Ellipsoid; eksen = q, uzunluk \(\propto 1/\sqrt\lambda\) |
ML Bağlantıları Özeti
- Konveks optim = Hessian PD → Lineer/lojistik reg, SVM garantili min.
- Eyer noktaları → DL’in gerçek düşmanı.
- Mahalanobis → Gaussian şekli, PCA yönleri.
- Cholesky → Gaussian örnekleme, GP regresyon.
- Newton, K-FAC → İkinci-mertebe optim (PD olmazsa damping).
PD = \(\mathbf{x}^T A \mathbf{x} > 0\) + 3 eşdeğer test. Min = gradyan + Hessian PD. Ellipsoid eksenleri = özvektör (PCA). Konveks optim, Cholesky, Mahalanobis ortak temeli.