import numpy as np
rng = np.random.default_rng(0)
# Posterior ortalaması
# Beta(3,3) + 8 başarı, 2 başarısızlık → Beta(11, 5)
print(f"Posterior E = {11/16:.4f} (teori 11/16)")
# Thompson: A ~ Beta(6,46), B ~ Beta(9,43)
sA = rng.beta(6, 46, 100_000)
sB = rng.beta(9, 43, 100_000)
print(f"P(B > A) = {(sB > sA).mean():.4f} (B daha iyi görünüyor ama belirsiz)")24 Beta Dağılımı
Conjugate prior + Thompson sampling
- Blitzstein’in videosu: YouTube — Lecture 23: Beta Distribution (≈50 dk)
- Okuma süresi: ≈33 dk
24.1 Bu Derste Ne Var?
- Beta(\(a, b\)): \(f(x) \propto x^{a-1}(1-x)^{b-1}\), \([0,1]\).
- Conjugate prior: Beta + Bin → Beta posterior.
- Pseudocount: \(a=\) prior başarı, \(b=\) prior başarısızlık.
- Bayes bilardosu: \(\int_0^1 \binom{n}{k} x^k(1-x)^{n-k} dx = 1/(n+1)\).
- Finans LOTUS: türev fiyatı = \(E(g(S))\).
- Beta-Binom conjugacy → Thompson sampling, Beta-Bernoulli bandit, Bayesçi A/B.
- Pseudocount = Laplace smoothing (add-α) Bayesçi yüzü; düzenlileştirme.
- Posterior ortalaması \((a+X)/(a+b+n)\) = shrinkage; küçük-örneklem CTR.
- Dirichlet = Beta’nın çok-boyutlusu, Multinomial’in eşleniği → LDA topic model.
24.2 Beta Dağılımı
\[ f(x) = c\, x^{a-1}(1-x)^{b-1}, \quad 0 < x < 1, \; a, b > 0 \]
Şekiller:
- \(a = b = 1\) → Uniform.
- \(a = b = 1/2\) → U-şekli.
- \(a = b = 2\) → çan.
- \(a > b\) → sağa kayar.
import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import beta as beta_dist
x = np.linspace(0.001, 0.999, 300)
params = [(1, 1, '#1f2937', 'Beta(1,1) = Uniform'),
(2, 2, '#15803d', 'Beta(2,2) çan'),
(0.5, 0.5, '#6B46C1', 'Beta(0.5,0.5) U'),
(5, 2, '#A51C30', 'Beta(5,2) sağ ağırlık'),
(2, 5, '#2C5282', 'Beta(2,5) sol ağırlık')]
fig, ax = plt.subplots(figsize=(10, 5))
for a, b, c, et in params:
ax.plot(x, beta_dist.pdf(x, a, b), color=c, linewidth=2.2, label=et)
ax.set_xlabel('x', fontsize=12)
ax.set_ylabel('f(x)', fontsize=12)
ax.set_title('Beta(a,b) — esnek [0,1] dağılımı', fontsize=12)
ax.legend(fontsize=11)
ax.grid(True, alpha=0.3)
ax.set_ylim(0, 3.5)
plt.tight_layout()
plt.show()24.3 Beta-Binom Eşleniği
\(X \mid p \sim\) Bin(\(n, p\)), \(p \sim\) Beta(\(a, b\)). Bayes (orantı):
\[ f(p \mid X = k) \propto p^k(1-p)^{n-k} \cdot p^{a-1}(1-p)^{b-1} = p^{a+k-1}(1-p)^{b+n-k-1} \]
\[ \boxed{p \mid X \sim \text{Beta}(a + X,\, b + n - X)} \]
Bayesçi online öğrenmenin motoru: her başarı \(a \mathrel{+}= 1\), her başarısızlık \(b \mathrel{+}= 1\) — kapalı form. Thompson sampling: posterior’dan örnekle, arg max seç. Beta-Bernoulli bandit + Bayesçi A/B test’in çekirdeği. Keşif-sömürü dengesi otomatik.
24.4 Pseudocount Yorumu
- \(a\) = prior başarı sayısı (hayalî).
- \(b\) = prior başarısızlık sayısı.
- Veri \(X\) başarı, \(n - X\) başarısızlık ekler.
Ders 17 Laplace ardışıklık prior’ı Beta(1,1) = Uniform: \((n+1)/(n+2)\) = Beta(1,1) ile aynı yöntem.
Add-α smoothing = Beta(α, α) prior. \(a + b\) = “etkin örnek sayısı” = ne kadar veri ön bilgiye eşdeğer. Düzenlileştirmenin olasılıksal yüzü.
24.5 Bayes Bilardosu
\(\int_0^1 \binom{n}{k} x^k(1-x)^{n-k} dx = ?\) — kalkülüssüz:
\(n+1\) top, birini pembe boya. [0,1]’e bağımsız uniform at. Pembenin solundaki beyaz sayısı \(X\).
- Hikâye 1: Pembe konumuna koşulla → \(X \sim\) Bin(\(n, p\)) → \(P(X=k) = \int \binom{n}{k} p^k(1-p)^{n-k} dp\).
- Hikâye 2: Topları at, sonra rastgele birini pembe boya → \(X\) üzerinde uniform → \(P(X=k) = 1/(n+1)\).
İkisi aynı:
\[ \int_0^1 \binom{n}{k} x^k(1-x)^{n-k} dx = \frac{1}{n+1} \]
24.6 Momentler ve Shrinkage
\[ E(X) = \frac{a}{a+b} \]
Posterior ortalaması:
\[ E(p \mid X) = \frac{a + X}{a + b + n} \]
Prior + veri harmanı (shrinkage) — az veride prior’a, çok veride veriye yakın.
24.7 Finans LOTUS (Konuk)
Türev fiyatı = \(E(g(S))\) — LOTUS! Alım opsiyonu: \(g(s) = \max(s - K, 0)\). Log-normal \(S\) altında integral = Black-Scholes.
“you can get a Nobel Prize in economics just for knowing LOTUS.” — Steven (konuk), 49:35
Türev fiyatı = E(g(S)) = Monte Carlo fiyatlama: \(S\)’yi örnekle, \(g(S)\)’yi ortala. RL’deki \(E[\text{ödül}]\) ile aynı mekanizma.
24.8 Bu Dersin Özeti
- Beta(\(a,b\)): esnek \([0,1]\).
- Conjugate: Beta + Bin → Beta(\(a+X, b+n-X\)).
- Pseudocount yorumu.
- Bayes bilardosu: \(1/(n+1)\).
- Momentler: \(E = a/(a+b)\), posterior shrinkage.
- Finans: fiyat = \(E(g(S))\) (LOTUS).
Beta(\(a,b\)) \([0,1]\) üzerinde esnek + binom’un eşleniği: posterior \(=\) Beta(\(a+X, b+n-X\)). \(a, b\) = pseudocount — Laplace smoothing, Thompson sampling, Bayesçi A/B’nin temeli.
24.9 Kontrol Soruları
Cevap: Uniform, U-şekli, sağa ağırlık (E=5/7), sola ağırlık (E=2/7).
Cevap: Beta(11, 5), \(E = 11/16 = \mathbf{0{,}6875}\) (prior 0.5 + veri 0.8 harmanı).
Cevap: Beta(\(1+k, 1+n-k\)); \(E = (k+1)/(n+2)\) = Laplace ardışıklık.
Cevap: A ~ Beta(6, 46), B ~ Beta(9, 43). Posterior’lardan örnekle → max’ı seç. B “muhtemelen daha iyi” ama belirsizlik nedeniyle A bazen seçilir — keşif-sömürü dengesi otomatik.
24.10 Egzersizler
Egzersiz 1. Beta(2, 8) prior. (a) E? (b) 20/12 → posterior + E. (c) Yorumla.
Egzersiz 2. \(\int_0^1 x^3(1-x)^2 dx\) Bayes bilardosu ile = \(1/60\).
Egzersiz 3. Dönüşüm prior’ı: \(E = 0{,}3\). \(a + b\) büyütmek belirsizliği nasıl etkiler?
Egzersiz 4. (Python — Conjugacy + Thompson)
Egzersiz 5. (Sonraki ders) Gamma fonksiyonu: \(\Gamma(a) = \int_0^\infty x^{a-1} e^{-x} dx\), \(\Gamma(n) = (n-1)!\). Gamma(\(n, \lambda\)) = \(n\) bağımsız Exp(\(\lambda\)) toplamı.
24.11 Sonraki Ders İçin Hazırlık
Ders 24: Gamma Dağılımı + Poisson Süreci — Exp’in genellemesi, çağrı merkezi.
- Egzersiz 5 (\(\Gamma\) fonksiyonu) çöz.
- Exp + konvolüsyon hatırla.
24.12 Anahtar Kavramlar (Cheat Sheet)
| Kavram | Tanım | Blitzstein’de |
|---|---|---|
| Beta(a,b) | \(x^{a-1}(1-x)^{b-1}\) | 3m31 |
| Esneklik | Uniform/U/çan/çarpık | 4m47 |
| Conjugacy | Beta + Bin → Beta(\(a+X, b+n-X\)) | 7m30 |
| Pseudocount | \(a, b\) = prior başarı/başarısızlık | 15m48 |
| Bayes bilardosu | \(\int = 1/(n+1)\) | 19m17 |
| E(Beta) | \(a/(a+b)\) | 16m50 |
| Finans LOTUS | Türev = \(E(g(S))\) | 34m15 |
24.13 ML Bağlantıları Özeti
- Conjugacy → Thompson sampling, Bayesçi A/B.
- Pseudocount → Laplace smoothing.
- Posterior shrinkage → küçük-örneklem CTR.
- Esnek \([0,1]\) → kalibrasyon, belirsizlik.
- Bayes bilardosu → exchangeability, de Finetti.
- Finans LOTUS → Monte Carlo pricing.
- Dirichlet → LDA, kategorik prior.
Beta binomun eşleniği — posterior kapalı form. Pseudocount = Laplace smoothing. Thompson sampling keşif-sömürü dengesini otomatik sağlar.