28  Bir RD Verildiğinde Koşullu Beklenti

Projeksiyon, Adam + Eve yasaları

NotBölüm bilgisi

28.1 Bu Derste Ne Var?

  1. 4 özellik: bileneni dışarı, bağımsızlık, Adam, artık diklik.
  2. Projeksiyon yorumu: \(E(Y|X)\) = en küçük kareler.
  3. Koşullu varyans Var\((Y|X)\) — bir RV.
  4. Eve yasası: Var\((Y)\) = \(E\)(Var\((Y|X)\)) + Var\((E(Y|X))\)within + between.
İpucuBuilder Notu — ML Köprüleri
  • E(Y|X) = izdüşümen küçük kareler; artık ⊥ özellikler (normal denklemler).
  • Adam yasası → Bellman, nested MC, EM/VI.
  • Var(Y|X) = heteroskedastik + aleatoric belirsizlik.
  • Eve yasası = law of total variance = ANOVA; ML’de aleatoric + epistemic ayrışımı.
  • Beta-Binom hiyerarşikrandom effects, overdispersion.

28.2 4 Özellik

  1. Bileneni dışarı al: \(E(h(X)Y | X) = h(X) E(Y | X)\).
  2. Bağımsızlık: \(X \perp Y \Rightarrow E(Y | X) = E(Y)\).
  3. Adam yasası: \(E(E(Y | X)) = E(Y)\).
  4. Artık diklik: \(E((Y - E(Y|X)) h(X)) = 0\) tüm \(h\) için.

28.3 Projeksiyon Yorumu

RV’leri vektör gibi düşün; iç çarpım \(\langle X, Y \rangle = E(XY)\). “X’in tüm fonksiyonları” = bir düzlem.

\[ E(Y | X) = Y \text{'nin bu düzleme ortogonal izdüşümü} \]

Artık \(Y - E(Y | X)\) düzleme dik — Özellik 4.

“E(Y|X) is defined to be the point in this plane that’s closest to Y.” — Blitzstein, 18:05

ÖnemliBuilder Notu — En Küçük Kareler

OLS regresyonun geometrisi: \(\hat{y}\) = \(y\)’nin sütun uzayına ortogonal izdüşümü; artık \(\perp\) özellikler = normal denklemler, Gauss-Markov. Sinir ağları doğrusal-olmayan E(Y|X)’i yaklaşık öğrenir.

28.4 Adam Yasası İspatı

Kesikli: \(g(X) = E(Y|X)\) → LOTUS → koşullu tanım → toplam sırası değiş → marjinal:

\[ E(g(X)) = \sum_x \sum_y y \underbrace{P(Y=y | X=x) P(X=x)}_{P(X,Y)} = \sum_y y P(Y=y) = E(Y) \quad \blacksquare \]

28.5 Koşullu Varyans

\[ \text{Var}(Y | X) = E(Y^2 | X) - (E(Y | X))^2 \]

Bir RV! (X’in fonksiyonu.) Son “\(| X\)”’i unutma.

İpucuBuilder Notu — Aleatoric Belirsizlik

Var\((Y|X)\) = girdiye bağlı belirsizlik = heteroskedastik gürültü = aleatoric belirsizlik (verinin doğasından, indirilemez). Modelin \(\sigma^2(x)\) çıktısı bunu öğrenir.

28.6 Eve Yasası

\[ \boxed{\text{Var}(Y) = E(\text{Var}(Y | X)) + \text{Var}(E(Y | X))} \]

Within (grup-içi) + between (gruplar-arası) varyans.

“Eve’s Law because it’s EVVE” — Blitzstein, 34:25

import numpy as np
import matplotlib.pyplot as plt

rng = np.random.default_rng(0)
N = 1_000_000

D = rng.integers(1, 7, N)   # 1..6
X = rng.binomial(D, 0.5)

var_total = X.var()
within = (D / 4).mean()       # E(Var(X|D)) = E(D/4)
between = (D / 2).var()       # Var(E(X|D)) = Var(D/2)

fig, ax = plt.subplots(figsize=(10, 4.5))
ax.bar(['Var(Y)\ntoplam', 'E(Var(Y|D))\nwithin\n(aleatoric)', 'Var(E(Y|D))\nbetween\n(model/epistemic)'],
       [var_total, within, between],
       color=['#A51C30', '#DD6B20', '#2C5282'], edgecolor='#1f2937')
for i, v in enumerate([var_total, within, between]):
    plt.text(i, v + 0.02, f'{v:.3f}', ha='center', fontsize=12, weight='bold')

ax.set_title(f'Eve: {var_total:.3f} = {within:.3f} + {between:.3f}  (within + between)',
             fontsize=12)
ax.set_ylabel('varyans', fontsize=12)
ax.grid(True, axis='y', alpha=0.3)
plt.tight_layout()
plt.show()
Şekil 28.1
ÖnemliBuilder Notu — Aleatoric + Epistemic

Eve = law of total variance = ANOVA. ML’de belirsizlik ayrışımı: E(Var(Y|X)) ≈ aleatoric (indirilemez veri gürültüsü), Var(E(Y|X)) ≈ between/epistemic (model değişimi). Bayesçi derin öğrenmede toplam tahmin belirsizliği aynı şekilde ayrışır.

28.7 Beta-Binom Hiyerarşik Örnek

\(Q \sim\) Beta(\(a, b\)) (şehir oranı), \(X | Q \sim\) Bin(\(n, Q\)).

Adam: \(E(X) = E(nQ) = na/(a+b)\).

Eve:

\[ \text{Var}(X) = E(nQ(1-Q)) + \text{Var}(nQ) = n \cdot \frac{ab}{(a+b)(a+b+1)} + n^2 \cdot \text{Var}(Q) \]

İki belirsizlik: şehir-içi binom + şehirler-arası Q.

ÖnemliBuilder Notu — Random Effects ve Overdispersion

Bayesçi hiyerarşik / random effects modellerin ders kitabı örneği: between-city varyansı binom’un veremeyeceği overdispersion’ı açıklar. Epidemiyoloji, A/B testi grup heterojenliği, çok-merkezli çalışmalarda standart.

28.8 Bu Dersin Özeti

  1. 4 özellik.
  2. Projeksiyon: \(E(Y|X)\) = OLS geometrisi.
  3. Adam ispatı: sırayı değiştir + marjinal.
  4. Var(Y|X) RV.
  5. Eve: within + between.
ÖnemliTek bir cümle

\(E(Y|X)\) = Y’nin “X’in fonksiyonları” uzayına ortogonal izdüşümü = regresyon. Adam beklentiyi, Eve varyansı parçalar (within + between) — ANOVA ve ML’de aleatoric + epistemic belirsizlik ayrışımının temeli.

28.9 Kontrol Soruları

Cevap: Adam: \(E(S) = E(N\mu) = \lambda \mu\).

Cevap: Eve: \(\lambda \sigma^2 + \mu^2 \lambda = \lambda(\sigma^2 + \mu^2) = \lambda E(X^2)\).

Cevap: (a) \(\sin X\). (b) \(5X\).

Cevap: E(Var(Y|X)) = aleatoric (indirilemez gürültü). Var(E(Y|X)) = between/model (epistemic). Bayesçi DL’de aynı.

28.10 Egzersizler

Egzersiz 1. Zar D + D para, X tura. (a) \(E(X|D) = D/2\). (b) Adam → \(E(X) = 1{,}75\).

Egzersiz 2. (a) Var(\(X|D\)) = \(D/4\). (b) Eve → Var(\(X\))?

Egzersiz 3. Artık özellikleri: \(E(\text{artık}) = 0\), \(\text{Cov}(\text{izdüşüm, artık}) = 0\).

Egzersiz 4. (Python — Adam + Eve)

import numpy as np
rng = np.random.default_rng(0)
N = 1_000_000

D = rng.integers(1, 7, N)
X = rng.binomial(D, 0.5)

# Adam
print(f"E(X) sim = {X.mean():.4f}  teorik 3.5/2 = 1.75")

# Eve
within = (D/4).mean()
between = (D/2).var()
print(f"Var(X) sim = {X.var():.4f}  = within({within:.4f}) + between({between:.4f}) = {within+between:.4f}")

Egzersiz 5. (Sonraki ders) Jensen: dışbükey g → \(E(g(X)) \ge g(E(X))\). Markov: \(X \ge 0\)\(P(X \ge a) \le E(X)/a\).

28.11 Sonraki Ders İçin Hazırlık

Ders 28: Eşitsizlikler — Jensen, Markov, Chebyshev, Cauchy-Schwarz.

UyarıDers 28 öncesi yapılacak
  • Egzersiz 5 (Jensen + Markov sezgisi) çöz.
  • Jensen + Cauchy-Schwarz hatırla.

28.12 Anahtar Kavramlar (Cheat Sheet)

Kavram Tanım Blitzstein’de
Bileneni dışarı \(E(h(X)Y\|X) = h(X)E(Y\|X)\) 8m37
Bağımsızlık \(X \perp Y \Rightarrow E(Y\|X) = E(Y)\) 9m55
Adam \(E(E(Y\|X)) = E(Y)\) 10m44
Artık diklik \(E((Y-E(Y\|X))h(X)) = 0\) 12m46
Projeksiyon \(E(Y\|X)\) = OLS izdüşümü 17m42
Var(Y|X) \(E(Y^2\|X) - (E(Y\|X))^2\), RV 30m17
Eve \(E(\text{Var}) + \text{Var}(E)\) 33m28

28.13 ML Bağlantıları Özeti

İpucu7 köprü
  1. E(Y|X) = izdüşümOLS, normal denklemler.
  2. E(Y|X) = regresyon → MSE.
  3. Adam → Bellman, EM/VI.
  4. Var(Y|X)heteroskedastik, aleatoric.
  5. Evelaw of total variance, ANOVA.
  6. Beta-Binom hiyerarşik → overdispersion, random effects.
  7. Compound Poisson → toplam ödül/hasar (sigorta, RL).
ÖnemliTek bir şey alıp gideceksen

\(E(Y|X)\) = ortogonal izdüşüm = regresyon. Adam beklentiyi, Eve varyansı parçalar (within + between) → ANOVA + aleatoric/epistemic ayrışımı.