24  Beta Dağılımı

Conjugate prior + Thompson sampling

NotBölüm bilgisi

24.1 Bu Derste Ne Var?

  1. Beta(\(a, b\)): \(f(x) \propto x^{a-1}(1-x)^{b-1}\), \([0,1]\).
  2. Conjugate prior: Beta + Bin → Beta posterior.
  3. Pseudocount: \(a=\) prior başarı, \(b=\) prior başarısızlık.
  4. Bayes bilardosu: \(\int_0^1 \binom{n}{k} x^k(1-x)^{n-k} dx = 1/(n+1)\).
  5. Finans LOTUS: türev fiyatı = \(E(g(S))\).
İpucuBuilder Notu — ML Köprüleri
  • Beta-Binom conjugacyThompson sampling, Beta-Bernoulli bandit, Bayesçi A/B.
  • Pseudocount = Laplace smoothing (add-α) Bayesçi yüzü; düzenlileştirme.
  • Posterior ortalaması \((a+X)/(a+b+n)\) = shrinkage; küçük-örneklem CTR.
  • Dirichlet = Beta’nın çok-boyutlusu, Multinomial’in eşleniği → LDA topic model.

24.2 Beta Dağılımı

\[ f(x) = c\, x^{a-1}(1-x)^{b-1}, \quad 0 < x < 1, \; a, b > 0 \]

Şekiller:

  • \(a = b = 1\)Uniform.
  • \(a = b = 1/2\)U-şekli.
  • \(a = b = 2\)çan.
  • \(a > b\) → sağa kayar.
import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import beta as beta_dist

x = np.linspace(0.001, 0.999, 300)
params = [(1, 1, '#1f2937', 'Beta(1,1) = Uniform'),
          (2, 2, '#15803d', 'Beta(2,2) çan'),
          (0.5, 0.5, '#6B46C1', 'Beta(0.5,0.5) U'),
          (5, 2, '#A51C30', 'Beta(5,2) sağ ağırlık'),
          (2, 5, '#2C5282', 'Beta(2,5) sol ağırlık')]

fig, ax = plt.subplots(figsize=(10, 5))
for a, b, c, et in params:
    ax.plot(x, beta_dist.pdf(x, a, b), color=c, linewidth=2.2, label=et)
ax.set_xlabel('x', fontsize=12)
ax.set_ylabel('f(x)', fontsize=12)
ax.set_title('Beta(a,b) — esnek [0,1] dağılımı', fontsize=12)
ax.legend(fontsize=11)
ax.grid(True, alpha=0.3)
ax.set_ylim(0, 3.5)
plt.tight_layout()
plt.show()
Şekil 24.1

24.3 Beta-Binom Eşleniği

\(X \mid p \sim\) Bin(\(n, p\)), \(p \sim\) Beta(\(a, b\)). Bayes (orantı):

\[ f(p \mid X = k) \propto p^k(1-p)^{n-k} \cdot p^{a-1}(1-p)^{b-1} = p^{a+k-1}(1-p)^{b+n-k-1} \]

\[ \boxed{p \mid X \sim \text{Beta}(a + X,\, b + n - X)} \]

ÖnemliBuilder Notu — Thompson Sampling

Bayesçi online öğrenmenin motoru: her başarı \(a \mathrel{+}= 1\), her başarısızlık \(b \mathrel{+}= 1\) — kapalı form. Thompson sampling: posterior’dan örnekle, arg max seç. Beta-Bernoulli bandit + Bayesçi A/B test’in çekirdeği. Keşif-sömürü dengesi otomatik.

24.4 Pseudocount Yorumu

  • \(a\) = prior başarı sayısı (hayalî).
  • \(b\) = prior başarısızlık sayısı.
  • Veri \(X\) başarı, \(n - X\) başarısızlık ekler.

Ders 17 Laplace ardışıklık prior’ı Beta(1,1) = Uniform: \((n+1)/(n+2)\) = Beta(1,1) ile aynı yöntem.

İpucuBuilder Notu — Laplace Smoothing

Add-α smoothing = Beta(α, α) prior. \(a + b\) = “etkin örnek sayısı” = ne kadar veri ön bilgiye eşdeğer. Düzenlileştirmenin olasılıksal yüzü.

24.5 Bayes Bilardosu

\(\int_0^1 \binom{n}{k} x^k(1-x)^{n-k} dx = ?\)kalkülüssüz:

\(n+1\) top, birini pembe boya. [0,1]’e bağımsız uniform at. Pembenin solundaki beyaz sayısı \(X\).

  • Hikâye 1: Pembe konumuna koşulla → \(X \sim\) Bin(\(n, p\)) → \(P(X=k) = \int \binom{n}{k} p^k(1-p)^{n-k} dp\).
  • Hikâye 2: Topları at, sonra rastgele birini pembe boya → \(X\) üzerinde uniform → \(P(X=k) = 1/(n+1)\).

İkisi aynı:

\[ \int_0^1 \binom{n}{k} x^k(1-x)^{n-k} dx = \frac{1}{n+1} \]

24.6 Momentler ve Shrinkage

\[ E(X) = \frac{a}{a+b} \]

Posterior ortalaması:

\[ E(p \mid X) = \frac{a + X}{a + b + n} \]

Prior + veri harmanı (shrinkage) — az veride prior’a, çok veride veriye yakın.

24.7 Finans LOTUS (Konuk)

Türev fiyatı = \(E(g(S))\) — LOTUS! Alım opsiyonu: \(g(s) = \max(s - K, 0)\). Log-normal \(S\) altında integral = Black-Scholes.

“you can get a Nobel Prize in economics just for knowing LOTUS.” — Steven (konuk), 49:35

İpucuBuilder Notu — Monte Carlo Pricing

Türev fiyatı = E(g(S)) = Monte Carlo fiyatlama: \(S\)’yi örnekle, \(g(S)\)’yi ortala. RL’deki \(E[\text{ödül}]\) ile aynı mekanizma.

24.8 Bu Dersin Özeti

  1. Beta(\(a,b\)): esnek \([0,1]\).
  2. Conjugate: Beta + Bin → Beta(\(a+X, b+n-X\)).
  3. Pseudocount yorumu.
  4. Bayes bilardosu: \(1/(n+1)\).
  5. Momentler: \(E = a/(a+b)\), posterior shrinkage.
  6. Finans: fiyat = \(E(g(S))\) (LOTUS).
ÖnemliTek bir cümle

Beta(\(a,b\)) \([0,1]\) üzerinde esnek + binom’un eşleniği: posterior \(=\) Beta(\(a+X, b+n-X\)). \(a, b\) = pseudocountLaplace smoothing, Thompson sampling, Bayesçi A/B’nin temeli.

24.9 Kontrol Soruları

Cevap: Uniform, U-şekli, sağa ağırlık (E=5/7), sola ağırlık (E=2/7).

Cevap: Beta(11, 5), \(E = 11/16 = \mathbf{0{,}6875}\) (prior 0.5 + veri 0.8 harmanı).

Cevap: Beta(\(1+k, 1+n-k\)); \(E = (k+1)/(n+2)\) = Laplace ardışıklık.

Cevap: A ~ Beta(6, 46), B ~ Beta(9, 43). Posterior’lardan örnekle → max’ı seç. B “muhtemelen daha iyi” ama belirsizlik nedeniyle A bazen seçilir — keşif-sömürü dengesi otomatik.

24.10 Egzersizler

Egzersiz 1. Beta(2, 8) prior. (a) E? (b) 20/12 → posterior + E. (c) Yorumla.

Egzersiz 2. \(\int_0^1 x^3(1-x)^2 dx\) Bayes bilardosu ile = \(1/60\).

Egzersiz 3. Dönüşüm prior’ı: \(E = 0{,}3\). \(a + b\) büyütmek belirsizliği nasıl etkiler?

Egzersiz 4. (Python — Conjugacy + Thompson)

import numpy as np
rng = np.random.default_rng(0)

# Posterior ortalaması
# Beta(3,3) + 8 başarı, 2 başarısızlık → Beta(11, 5)
print(f"Posterior E = {11/16:.4f}  (teori 11/16)")

# Thompson: A ~ Beta(6,46), B ~ Beta(9,43)
sA = rng.beta(6, 46, 100_000)
sB = rng.beta(9, 43, 100_000)
print(f"P(B > A) = {(sB > sA).mean():.4f}  (B daha iyi görünüyor ama belirsiz)")

Egzersiz 5. (Sonraki ders) Gamma fonksiyonu: \(\Gamma(a) = \int_0^\infty x^{a-1} e^{-x} dx\), \(\Gamma(n) = (n-1)!\). Gamma(\(n, \lambda\)) = \(n\) bağımsız Exp(\(\lambda\)) toplamı.

24.11 Sonraki Ders İçin Hazırlık

Ders 24: Gamma Dağılımı + Poisson Süreci — Exp’in genellemesi, çağrı merkezi.

UyarıDers 24 öncesi yapılacak
  • Egzersiz 5 (\(\Gamma\) fonksiyonu) çöz.
  • Exp + konvolüsyon hatırla.

24.12 Anahtar Kavramlar (Cheat Sheet)

Kavram Tanım Blitzstein’de
Beta(a,b) \(x^{a-1}(1-x)^{b-1}\) 3m31
Esneklik Uniform/U/çan/çarpık 4m47
Conjugacy Beta + Bin → Beta(\(a+X, b+n-X\)) 7m30
Pseudocount \(a, b\) = prior başarı/başarısızlık 15m48
Bayes bilardosu \(\int = 1/(n+1)\) 19m17
E(Beta) \(a/(a+b)\) 16m50
Finans LOTUS Türev = \(E(g(S))\) 34m15

24.13 ML Bağlantıları Özeti

İpucu7 köprü
  1. ConjugacyThompson sampling, Bayesçi A/B.
  2. PseudocountLaplace smoothing.
  3. Posterior shrinkage → küçük-örneklem CTR.
  4. Esnek \([0,1]\) → kalibrasyon, belirsizlik.
  5. Bayes bilardosu → exchangeability, de Finetti.
  6. Finans LOTUS → Monte Carlo pricing.
  7. DirichletLDA, kategorik prior.
ÖnemliTek bir şey alıp gideceksen

Beta binomun eşleniği — posterior kapalı form. Pseudocount = Laplace smoothing. Thompson sampling keşif-sömürü dengesini otomatik sağlar.