6  Transpoz, Permütasyon, Vektör Uzayları Rⁿ

Vektörlerden uzaylara — ve kolon uzayının doğuşu

NotBölüm bilgisi

6.1 Bu Derste Ne Var?

Ders 4’te \(A = LU\) ve permütasyon matrislerine ilk bakışı gördük. Ders 5 iki yarıdan oluşuyor:

  1. Bölüm 2.7’nin tamamlanması: Genel \(PA = LU\) + transpoz kuralları + simetrik matrisler.
  2. Asıl olay — vektör uzayları: Strang’in deyişiyle “gerçek lineer cebirin başlangıcı”. Artık tek tek vektörlerle değil, vektör uzayları ve alt-uzayları ile düşünüyoruz.

“We’re coming to the beginning of real linear algebra, which is seeing a bigger picture with vector spaces — not just vectors, but spaces of vectors and sub-spaces of those spaces.” — Strang, 0:57

flowchart LR
    P["PA = LU<br/>(satır takasıyla)"] --> Pprops["P⁻¹ = Pᵀ<br/>n! permütasyon"]
    T["Transpoz Aᵀ"] --> S["Simetrik: A = Aᵀ"]
    T --> RTR["⭐ RᵀR her zaman simetrik"]
    S --> NORMAL["Normal denklemler<br/>(AᵀA)⁻¹Aᵀb"]

    VS["Vektör uzayı<br/>(kapalı + 0 içerir)"] --> RN["R², R³, Rⁿ"]
    VS --> SUB["Alt-uzay<br/>(orijinden geçer)"]
    SUB --> CA["⭐ C(A) — kolon uzayı<br/>kolonların tüm komb."]
    CA --> ML["Ax = b çözülebilir<br/>⇔ b ∈ C(A)"]

    style RTR fill:#fff3e0,stroke:#e67e22,stroke-width:2px
    style CA fill:#fff3e0,stroke:#e67e22,stroke-width:3px
    style ML fill:#fce4ec,stroke:#c2185b,stroke-width:3px
flowchart LR
    P["PA = LU<br/>(satır takasıyla)"] --> Pprops["P⁻¹ = Pᵀ<br/>n! permütasyon"]
    T["Transpoz Aᵀ"] --> S["Simetrik: A = Aᵀ"]
    T --> RTR["⭐ RᵀR her zaman simetrik"]
    S --> NORMAL["Normal denklemler<br/>(AᵀA)⁻¹Aᵀb"]

    VS["Vektör uzayı<br/>(kapalı + 0 içerir)"] --> RN["R², R³, Rⁿ"]
    VS --> SUB["Alt-uzay<br/>(orijinden geçer)"]
    SUB --> CA["⭐ C(A) — kolon uzayı<br/>kolonların tüm komb."]
    CA --> ML["Ax = b çözülebilir<br/>⇔ b ∈ C(A)"]

    style RTR fill:#fff3e0,stroke:#e67e22,stroke-width:2px
    style CA fill:#fff3e0,stroke:#e67e22,stroke-width:3px
    style ML fill:#fce4ec,stroke:#c2185b,stroke-width:3px
Şekil 6.1: Transpoz/permütasyon kapanışı → vektör uzayı tanımı → alt-uzay → C(A).
İpucuBuilder Notu — Vektör Uzayı Neden ML’in Tam Merkezinde
  • Embedding uzayları birer vektör uzayıdır. Kelime/görüntü/kullanıcı \(\mathbb{R}^n\)’de bir nokta; “anlam” = geometri.
  • Alt-uzay = düşük boyutlu yapı. Yüksek boyutlu veri çoğunlukla daha düşük boyutlu bir alt-uzaya yakın oturur — PCA, SVD, LoRA hep bunu sömürür.
  • Kapalılık = lineer kombinasyon uzaydan çıkmaz. Bir lineer katmanın bias’sız kısmı çıktıyı tam C(W)’ye taşır.
  • Bias = afin = orijinden kayma. PCA’da merkezleme tam da “alt-uzaylar orijinden geçer” kuralına uydurmak için.
  • Aᵀ ve simetri backprop Jacobian transpozlarının ve kovaryans matrislerinin iskeleti.

6.2 Genel PA = LU

Eliminasyon sırasında pivotta sıfır gelirse → satır takası → \(P\) matrisi. Faktorizasyon:

\[ PA = LU \]

Pratikte neredeyse her matris için \(P = I\), ama gerektiğinde takas önceden yapılıp \(L, U\) tıpkı Ders 4’teki gibi temiz çıkar.

“It checks: is that pivot big enough? Pivots close to zero are numerically bad.” — Strang, 4:02

Numerik sağlamlık: LAPACK her zaman partial pivoting yapar — sıfır olmasa bile küçük pivotlardan kaçınır. Cebir “takas gereksiz” dese de doğruluk “gerekli” der.

6.3 Permütasyon Matrislerinin Özellikleri

\(P\) = identity’nin satırları yeniden sıralanmış hâli. \(n!\) tane \(n \times n\) permütasyon vardır:

\(n\) \(n!\)
3 6
4 24
5 120
10 ~3.6M

Hızlı büyür — “her permütasyonu dene” TSP’de neden işlemez bunu söylüyor.

Sihirli özellik: \(P^{-1} = P^T\) (ortogonal). \(P\) bir takas; geri almak yine bir takas — ve bu transpoz.

“P transpose P is the identity. That tells me this is the inverse of that.” — Strang, 8:39

Grup yapısı: \(n!\) permütasyon bir matematiksel grup oluşturur (kapalı, terslere sahip, identity). ML’de gruplar = equivariant networks (transformer permütasyon-equivariance, GNN, group convolutions).

6.4 Transpoz

Tanım: \((A^T)_{ij} = A_{ji}\). Satır ve kolon numaraları yer değiştirir.

\[ A = \begin{pmatrix} 1 & 2 & 4 \\ 3 & 3 & 1 \end{pmatrix} \;\longrightarrow\; A^T = \begin{pmatrix} 1 & 3 \\ 2 & 3 \\ 4 & 1 \end{pmatrix} \]

\(A\) (\(2 \times 3\)) → \(A^T\) (\(3 \times 2\)). Boyutlar yer değiştirir.

6.5 Simetrik Matrisler

\[ A^T = A \quad \text{(yalnız kare matrisler için mümkün)} \]

Örnek:

\[ S = \begin{pmatrix} 2 & 1 & 7 \\ 1 & 3 & 9 \\ 7 & 9 & 5 \end{pmatrix}, \quad S^T = S \]

Köşegen üstü/altı ayna gibi yansır. Gözle anında tanınır.

İpucuBuilder Notu — Simetri Her Yerde
  • Kovaryans \(\Sigma\): \(\text{cov}(x, y) = \text{cov}(y, x)\) → simetrik. PCA bu simetriye dayanır.
  • Gram matrisi \(G = X^T X\) ve kernel matrisi \(K_{ij} = \langle x_i, x_j \rangle\) simetrik.
  • Simetrik matrislerin özdeğerleri gerçel, özvektörleri ortogonal (Ders 25). Spektral yöntemlerin temeli.
  • Simetrik pozitif tanımlı için \(A = LU \to A = LL^T\)Cholesky (Ders 28).

6.6 RᵀR Her Zaman Simetrik ⭐

Herhangi bir dikdörtgen \(R\) için \(R^T R\) her zaman simetriktir. İki satırlık ispat:

\[ (R^T R)^T = R^T (R^T)^T = R^T R \checkmark \]

(Çarpımın transpozunda sıra ters döner; \((R^T)^T = R\).)

import numpy as np

R = np.array([[1, 2, 4], [3, 3, 1]], dtype=float)
M = R.T @ R
print("R^T R =\n", M)
print("Simetrik mi?", np.allclose(M, M.T))
İpucuBuilder Notu — Normal Denklemler
  • Least squares çözümü \(\hat{\mathbf{x}} = (A^T A)^{-1} A^T \mathbf{b}\)\(A^T A\) simetrik, \((A^T A)^{-1}\) de simetrik kalır.
  • Lineer regression, ridge, kernel methods (Ders 15–17) — hepsi bu pattern.
  • \(A^T A\) ayrıca pozitif yarı-tanımlı — SVD ve PCA’nın matematiği tam buradan.

6.7 Vektör Uzayları — R², R³, Rⁿ

Vektör uzayı: Vektörlerin iki temel işlemi (toplama + skalerle çarpma) altında kapalı olan vektör kümesi.

İkisi birleşince: lineer kombinasyon \(c\mathbf{v} + d\mathbf{w}\) her zaman uzayda olmalı. Bu “içeride kalma” özelliği = kapalılık (closure).

En tanıdık örnek: \(\mathbb{R}^2\) = sıradan xy-düzlemi:

\[ \mathbb{R}^2 = \left\{ \begin{pmatrix} x \\ y \end{pmatrix} : x, y \in \mathbb{R} \right\} \]

Genel: \(\mathbb{R}^n\) = \(n\) bileşenli tüm reel kolon vektörleri. Bu kursta vektörler kolon ve bileşenler reel.

import matplotlib.pyplot as plt
import numpy as np

fig, axes = plt.subplots(1, 2, figsize=(11, 5))

# Sol: R^2 - tum duzlem
ax = axes[0]
for v in [(2, 1), (-1, 1.5), (1.5, -1)]:
    ax.annotate('', xy=v, xytext=(0,0),
                arrowprops=dict(arrowstyle='->', color='#8a1538', lw=2))
ax.text(2.2, 1, r'$\mathbf{v}_1$', fontsize=13, color='#8a1538')
ax.text(-1.2, 1.6, r'$\mathbf{v}_2$', fontsize=13, color='#8a1538')
# Topla
s = np.array([2,1]) + np.array([-1,1.5])
ax.annotate('', xy=s, xytext=(0,0),
            arrowprops=dict(arrowstyle='->', color='#e67e22', lw=2.5, linestyle='--'))
ax.text(s[0]+0.1, s[1]+0.1, r'$\mathbf{v}_1+\mathbf{v}_2$', fontsize=13, color='#e67e22')
ax.axhline(0, color='#cbd5e0', lw=0.5); ax.axvline(0, color='#cbd5e0', lw=0.5)
ax.set_xlim(-3, 3); ax.set_ylim(-2, 3); ax.set_aspect('equal'); ax.grid(alpha=0.3)
ax.set_title(r'$\mathbb{R}^2$ — tüm düzlem (vektör uzayı)', fontsize=11)

# Sag: y = 2x dogrusu - alt-uzay
ax = axes[1]
xs = np.linspace(-2, 2, 100)
ax.plot(xs, 2*xs, color='#1f4e79', lw=2.5, label=r'$y = 2x$ (alt-uzay)')
for c in [0.5, 1.2, -0.8]:
    v = c * np.array([1, 2])
    ax.plot(*v, 'o', color='#8a1538', markersize=10, zorder=5)
ax.plot(0, 0, 'o', color='#e67e22', markersize=14, zorder=6,
        markeredgecolor='#8a1538', markeredgewidth=2)
ax.annotate('orijin\nzorunlu', xy=(0,0), xytext=(0.5, -1.5),
            fontsize=11, color='#e67e22', fontweight='bold',
            arrowprops=dict(arrowstyle='->', color='#e67e22'))
ax.axhline(0, color='#cbd5e0', lw=0.5); ax.axvline(0, color='#cbd5e0', lw=0.5)
ax.set_xlim(-2.5, 2.5); ax.set_ylim(-4, 4); ax.set_aspect('equal'); ax.grid(alpha=0.3)
ax.set_title(r'Orijinden geçen doğru — $\mathbb{R}^2$\'nin alt-uzayı', fontsize=11)
ax.legend(fontsize=10)

plt.tight_layout()
plt.show()
Şekil 6.2

6.8 Sıfır Vektör Zorunlu

Her vektör uzayı sıfır vektörünü içermek zorunda. Sebep: kapalılıktan gelir. Uzaydaki herhangi \(\mathbf{v}\)’yi 0 ile çarpınca \(\mathbf{0}\) çıkar, ve uzayda kalmalı.

“No way I can do without the origin. Every vector space has got that zero vector in it.” — Strang, 26:29

Karşı-örnek — Pozitif çeyrek (x ≥ 0, y ≥ 0): Toplama altında kapalı (her ikisi de pozitif). Ama \((3, 2) \times (-5) = (-15, -10)\) çeyrekten çıkar → kapalı değil → vektör uzayı değil.

6.9 Alt-Uzaylar (Subspace)

Uzay içinde uzay. İki kapalılık kuralı yeterli (ve dolayısıyla \(\mathbf{0}\) içerir).

\(\mathbb{R}^2\)’deki orijinden geçen doğru bir alt-uzaydır. İçindeki bir vektörü çarpınca/toplayınca üstte kalırsın.

Kritik şart — orijinden geçmeli. Orijinden geçmeyen doğru alt-uzay değildir: bir noktayı 0 ile çarpınca \(\mathbf{0}\) çıkar, doğruda değildir → kapalılık ihlali.

\[ \mathbf{v} \in S \implies c\mathbf{v} \in S \quad \forall c \in \mathbb{R} \]

İpucuBuilder Notu — Lineer vs Afin
  • \(\mathbf{y} = W\mathbf{x}\) (bias yok) → çıktı tam bir alt-uzayda (orijinden geçer).
  • \(\mathbf{y} = W\mathbf{x} + \mathbf{b}\) (bias var) → afin (orijinden kaymış); teknik olarak alt-uzay değil.
  • Bias modele “orijinden kayma” özgürlüğü verir.
  • PCA’da merkezleme (veri ortalamasını çıkarma) tam da bu kayma’yı sıfırlamak için zorunlu.

6.10 R²’nin ve R³’ün Tüm Alt-Uzayları

\(\mathbb{R}^2\)’nin alt-uzayları (tam üç tür):

  1. Tüm \(\mathbb{R}^2\)
  2. Orijinden geçen herhangi doğru
  3. Yalnız \(\{\mathbf{0}\}\) — en küçük

\(\mathbb{R}^3\)’ün alt-uzayları (dört tür):

  • Tüm \(\mathbb{R}^3\)
  • Orijinden geçen düzlemler
  • Orijinden geçen doğrular
  • \(\{\mathbf{0}\}\)

Bu hiyerarşi, boyut kavramının habercisi (Ders 9).

Dikkat: Orijinden geçen doğru \(\mathbb{R}^1\) gibi görünür, ama \(\mathbb{R}^1\) değildir — vektörlerinin iki bileşeni var, \(\mathbb{R}^1\)’inkilerin bir.

6.11 Kolon Uzayı C(A) — Matristen Doğan Alt-Uzay

Dersin doruk noktası. Bir matrisin kolon uzayı = kolonlarının tüm lineer kombinasyonları.

\[ A = \begin{pmatrix} 1 & 3 \\ 2 & 3 \\ 4 & 1 \end{pmatrix} \]

İki kolon \(\mathbb{R}^3\)’te. Tüm kombinasyonları:

\[ C(A) = \{c_1 (1, 2, 4)^T + c_2 (3, 3, 1)^T : c_1, c_2 \in \mathbb{R}\} \]

Geometrik olarak: iki bağımsız vektörün kombinasyonları \(\mathbb{R}^3\)’te orijinden geçen bir düzlem doldurur. Bir doğrudan fazlası, tüm \(\mathbb{R}^3\) değil.

“When I take all their combinations, I fill out a whole plane, and it’s through the origin.” — Strang, 45:05

ÖnemliC(A)’nın Anlamı

\(A\mathbf{x} = \mathbf{b}\) çözülebilir \(\iff\) \(\mathbf{b} \in C(A)\).

Çünkü \(A\mathbf{x}\) tam olarak \(A\)’nın kolonlarının \(\mathbf{x}\) ağırlıklarıyla kombinasyonudur (Ders 1!). ML’de \(C(W)\) bir lineer katmanın “erişebileceği çıktılar” kümesi — modelin temsil sınırı.

6.12 Bu Dersin Özeti

  1. \(PA = LU\) — satır takasıyla genel form.
  2. Permütasyon: \(n!\) tane, \(P^{-1} = P^T\), grup yapısı.
  3. Transpoz: \((A^T)_{ij} = A_{ji}\).
  4. Simetrik: \(A^T = A\), sadece kare matrislerde.
  5. \(R^T R\) simetrik — iki satırlık ispat; normal denklemlerin temeli.
  6. Vektör uzayı — kapalılık + \(\mathbf{0}\).
  7. Alt-uzay — uzay içinde uzay, orijinden geçer.
  8. \(C(A)\) — kolonların tüm kombinasyonları; matristen doğan ilk büyük alt-uzay.
ÖnemliTek bir cümle

Vektör uzayı, lineer kombinasyon altında kapalı ve \(\mathbf{0}\)’ı içerendir. Bir matrisin kolonlarının tüm kombinasyonları kolon uzayı \(C(A)\)’yı doldurur; \(A\mathbf{x} = \mathbf{b}\) ancak \(\mathbf{b} \in C(A)\) olduğunda çözülebilir.

6.13 Kontrol Soruları

\[ B^T = \begin{pmatrix} 1 & 2 & 3 \\ 4 & 5 & 6 \end{pmatrix} \]

Simetrik değil. \(B\) 3×2, \(B^T\) 2×3 — boyutlar aynı bile değil. Simetri yalnız kare matrislerde mümkün.

\[ R^T R = \begin{pmatrix} 1 & 0 & 3 \\ 2 & 1 & 0 \end{pmatrix} \begin{pmatrix} 1 & 2 \\ 0 & 1 \\ 3 & 0 \end{pmatrix} = \begin{pmatrix} 10 & 2 \\ 2 & 5 \end{pmatrix} \]

\((1,2) = (2,1) = 2\) → simetrik ✓. Niye her zaman: \((R^T R)^T = R^T (R^T)^T = R^T R\).

  • (a) y = 2x → EVET. Orijinden geçen doğru.
  • (b) y = 2x + 1 → HAYIR. \((0,0)\) doğruda değil → orijinden geçmiyor.
  • (c) {0} → EVET. \(0 + 0 = 0\), \(c \cdot 0 = 0\).
  • (d) Birinci çeyrek → HAYIR. \((3, 2) \cdot (-1) = (-3, -2)\) çeyrekten çıkar.

Test: “Orijini içeriyor mu?”

\(\mathbf{x} = \mathbf{0}\)\(\mathbf{y} = \mathbf{b}\). \(\mathbf{b} \neq \mathbf{0}\) ise çıktı orijinden geçmez → afin, alt-uzay değil.

\(\mathbf{b} = \mathbf{0}\) olursa: \(\mathbf{y} = W\mathbf{x}\), \(\mathbf{x} = \mathbf{0} \to \mathbf{y} = \mathbf{0}\), görüntü tam olarak \(C(W)\) = gerçek alt-uzay.

PCA’da merkezleme veri ortalamasını çıkararak afin’i lineer’e dönüştürür.

6.14 Egzersizler

Egzersiz 1. \(P = \begin{pmatrix} 0 & 0 & 1 \\ 1 & 0 & 0 \\ 0 & 1 & 0 \end{pmatrix}\) için \(P^{-1}\)’i transpozla bul, \(P^T P = I\) doğrula.

Egzersiz 2. \(A = \begin{pmatrix} 1 & 2 \\ 2 & 4 \\ 3 & 6 \end{pmatrix}\). \(C(A)\) doğru mu düzlem mi? (İpucu: kolonlar bağımsız mı?)

Egzersiz 3. Hangileri \(\mathbb{R}^3\) alt-uzayı?

  1. \(x + y + z = 0\) olan tüm \((x, y, z)\)
  2. \(x + y + z = 1\)
  3. \((x, y, 0)\) tipi vektörler
  4. \(z \geq 0\) olan vektörler

Egzersiz 4. (Python)

import numpy as np

R = np.array([[1, 2], [0, 1], [3, 0]], dtype=float)
print("R^T =\n", R.T)
M = R.T @ R
print("R^T R =\n", M)
print("Simetrik mi?", np.allclose(M, M.T))

P = np.array([[0, 0, 1], [1, 0, 0], [0, 1, 0]], dtype=float)
print("P^-1 == P^T?", np.allclose(np.linalg.inv(P), P.T))

Egzersiz 5. İspatla: Her kare \(A\) için \(A + A^T\) simetriktir. (İpucu: \((A + A^T)^T\).) Bu, her matrisin simetrik + antisimetrik parçaya ayrılabilmesinin (Ders 25 habercisi) ilk adımı.

6.15 Sonraki Ders İçin Hazırlık

Ders 6: Kolon Uzayı ve Sıfır Uzayı

  • Alt-uzayların kesişimi/birleşimi.
  • \(C(A)\) ve \(A\mathbf{x} = \mathbf{b}\) çözülebilirliği.
  • Sıfır uzayı \(N(A)\): \(A\mathbf{x} = \mathbf{0}\)’ı çözen tüm \(\mathbf{x}\)’ler.
UyarıDers 6 öncesi
  • Egzersizleri çöz, özellikle 3 (alt-uzay testi).
  • np.linalg.matrix_rank ile birkaç matrisin kolon bağımsızlığını yokla.
  • Ana cümleyi tekrar oku.

6.16 Anahtar Kavramlar (Cheat Sheet)

Kavram Tanım Strang’da
\(PA = LU\) Satır takasıyla genel form 5m00
Partial pivoting Numerik stabilite için en büyüğü seç 4m02
\(n!\) permütasyon \(n \times n\) için tam sayı 7m46
\(P^{-1} = P^T\) Permütasyonların ortogonalliği 8m39
Transpoz \((A^T)_{ij} = A_{ji}\) 12m39
Simetrik \(A^T = A\), kare matriste 13m16
\(R^T R\) simetrik Her \(R\) için; normal denklemler 15m44
Vektör uzayı Kapalı küme 21m50
Kapalılık Lineer kombinasyon uzayda kalır 31m14
\(\mathbf{0}\) zorunlu Her alt-uzay orijini içerir 26m29
Alt-uzay Uzay içinde uzay 35m05
\(\mathbb{R}^2\) alt-uzayları Tüm \(\mathbb{R}^2\), doğrular, \(\{\mathbf{0}\}\) 38m01
\(C(A)\) Kolonların tüm kombinasyonları 42m46

6.17 ML Bağlantıları Özeti

İpucu7 köprü
  1. \(\mathbb{R}^n\) = embedding uzayı → Boyut = temsil kapasitesi.
  2. Alt-uzay = düşük boyutlu yapı → PCA, SVD, LoRA.
  3. Simetrik matrisler → Covariance, Gram, kernel — spektral yöntemlerin temeli.
  4. \(R^T R\) / normal denklemler → Least squares, ridge, kernel methods.
  5. Permütasyon grubu → equivariance → Transformer, GNN, group conv.
  6. \(C(W)\) → Lineer katmanın temsil sınırı; \(A\mathbf{x} = \mathbf{b}\) çözülebilirliği.
  7. Alt-uzay ↔︎ afin → Bias kayma; PCA merkezleme tam bu kuralı düzeltir.
ÖnemliTek bir şey alıp gideceksen

Lineer cebir artık “tek tek vektörlerden” çıkıp vektör uzaylarına geçti. Kapalı + \(\mathbf{0}\) içeren her küme uzay; alt-uzay orijinden geçer. Bir matrisin kolonlarının tüm kombinasyonları \(C(A)\)’yı doldurur — \(A\mathbf{x} = \mathbf{b}\) ancak \(\mathbf{b} \in C(A)\) ise çözülebilir.