24 Beta Dağılımı

Conjugate prior + Thompson sampling

Bölüm bilgisi

Blitzstein’in videosu: YouTube — Lecture 23: Beta Distribution (≈50 dk)
Okuma süresi: ≈33 dk

24.1 Bu Derste Ne Var?

Beta($a, b$): $f(x) \propto x^{a-1}(1-x)^{b-1}$, $[0,1]$.
Conjugate prior: Beta + Bin → Beta posterior.
Pseudocount: $a=$ prior başarı, $b=$ prior başarısızlık.
Bayes bilardosu: $\int_0^1 \binom{n}{k} x^k(1-x)^{n-k} dx = 1/(n+1)$.
Finans LOTUS: türev fiyatı = $E(g(S))$.

Builder Notu — ML Köprüleri

Beta-Binom conjugacy → Thompson sampling, Beta-Bernoulli bandit, Bayesçi A/B.
Pseudocount = Laplace smoothing (add-α) Bayesçi yüzü; düzenlileştirme.
Posterior ortalaması $(a+X)/(a+b+n)$ = shrinkage; küçük-örneklem CTR.
Dirichlet = Beta’nın çok-boyutlusu, Multinomial’in eşleniği → LDA topic model.

24.2 Beta Dağılımı

\[ f(x) = c\, x^{a-1}(1-x)^{b-1}, \quad 0 < x < 1, \; a, b > 0 \]

Şekiller:

$a = b = 1$ → Uniform.
$a = b = 1/2$ → U-şekli.
$a = b = 2$ → çan.
$a > b$ → sağa kayar.

import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import beta as beta_dist

x = np.linspace(0.001, 0.999, 300)
params = [(1, 1, '#1f2937', 'Beta(1,1) = Uniform'),
          (2, 2, '#15803d', 'Beta(2,2) çan'),
          (0.5, 0.5, '#6B46C1', 'Beta(0.5,0.5) U'),
          (5, 2, '#A51C30', 'Beta(5,2) sağ ağırlık'),
          (2, 5, '#2C5282', 'Beta(2,5) sol ağırlık')]

fig, ax = plt.subplots(figsize=(10, 5))
for a, b, c, et in params:
    ax.plot(x, beta_dist.pdf(x, a, b), color=c, linewidth=2.2, label=et)
ax.set_xlabel('x', fontsize=12)
ax.set_ylabel('f(x)', fontsize=12)
ax.set_title('Beta(a,b) — esnek [0,1] dağılımı', fontsize=12)
ax.legend(fontsize=11)
ax.grid(True, alpha=0.3)
ax.set_ylim(0, 3.5)
plt.tight_layout()
plt.show()

Şekil 24.1

24.3 Beta-Binom Eşleniği

$X \mid p \sim$ Bin($n, p$), $p \sim$ Beta($a, b$). Bayes (orantı):

\[ f(p \mid X = k) \propto p^k(1-p)^{n-k} \cdot p^{a-1}(1-p)^{b-1} = p^{a+k-1}(1-p)^{b+n-k-1} \]

\[ \boxed{p \mid X \sim \text{Beta}(a + X,\, b + n - X)} \]

Builder Notu — Thompson Sampling

Bayesçi online öğrenmenin motoru: her başarı $a \mathrel{+}= 1$, her başarısızlık $b \mathrel{+}= 1$ — kapalı form. Thompson sampling: posterior’dan örnekle, arg max seç. Beta-Bernoulli bandit + Bayesçi A/B test’in çekirdeği. Keşif-sömürü dengesi otomatik.

24.4 Pseudocount Yorumu

$a$ = prior başarı sayısı (hayalî).
$b$ = prior başarısızlık sayısı.
Veri $X$ başarı, $n - X$ başarısızlık ekler.

Ders 17 Laplace ardışıklık prior’ı Beta(1,1) = Uniform: $(n+1)/(n+2)$ = Beta(1,1) ile aynı yöntem.

Builder Notu — Laplace Smoothing

Add-α smoothing = Beta(α, α) prior. $a + b$ = “etkin örnek sayısı” = ne kadar veri ön bilgiye eşdeğer. Düzenlileştirmenin olasılıksal yüzü.

24.5 Bayes Bilardosu

$\int_0^1 \binom{n}{k} x^k(1-x)^{n-k} dx = ?$ — kalkülüssüz:

$n+1$ top, birini pembe boya. [0,1]’e bağımsız uniform at. Pembenin solundaki beyaz sayısı $X$.

Hikâye 1: Pembe konumuna koşulla → $X \sim$ Bin($n, p$) → $P(X=k) = \int \binom{n}{k} p^k(1-p)^{n-k} dp$.
Hikâye 2: Topları at, sonra rastgele birini pembe boya → $X$ üzerinde uniform → $P(X=k) = 1/(n+1)$.

İkisi aynı:

\[ \int_0^1 \binom{n}{k} x^k(1-x)^{n-k} dx = \frac{1}{n+1} \]

24.6 Momentler ve Shrinkage

\[ E(X) = \frac{a}{a+b} \]

Posterior ortalaması:

\[ E(p \mid X) = \frac{a + X}{a + b + n} \]

Prior + veri harmanı (shrinkage) — az veride prior’a, çok veride veriye yakın.

24.7 Finans LOTUS (Konuk)

Türev fiyatı = $E(g(S))$ — LOTUS! Alım opsiyonu: $g(s) = \max(s - K, 0)$. Log-normal $S$ altında integral = Black-Scholes.

“you can get a Nobel Prize in economics just for knowing LOTUS.” — Steven (konuk), 49:35

Builder Notu — Monte Carlo Pricing

Türev fiyatı = E(g(S)) = Monte Carlo fiyatlama: $S$’yi örnekle, $g(S)$’yi ortala. RL’deki $E[\text{ödül}]$ ile aynı mekanizma.

24.8 Bu Dersin Özeti

Beta($a,b$): esnek $[0,1]$.
Conjugate: Beta + Bin → Beta($a+X, b+n-X$).
Pseudocount yorumu.
Bayes bilardosu: $1/(n+1)$.
Momentler: $E = a/(a+b)$, posterior shrinkage.
Finans: fiyat = $E(g(S))$ (LOTUS).

Tek bir cümle

Beta($a,b$) $[0,1]$ üzerinde esnek + binom’un eşleniği: posterior $=$ Beta($a+X, b+n-X$). $a, b$ = pseudocount — Laplace smoothing, Thompson sampling, Bayesçi A/B’nin temeli.

24.9 Kontrol Soruları

Soru 1: Beta(1,1), Beta(0.5, 0.5), Beta(5,2), Beta(2,5) şekilleri?

Cevap: Uniform, U-şekli, sağa ağırlık (E=5/7), sola ağırlık (E=2/7).

Soru 2: Beta(3,3) prior + 8/2 → posterior? Ortalama?

Cevap: Beta(11, 5), $E = 11/16 = \mathbf{0{,}6875}$ (prior 0.5 + veri 0.8 harmanı).

Soru 3: Uniform prior + k/n → posterior + sonraki başarı?

Cevap: Beta($1+k, 1+n-k$); $E = (k+1)/(n+2)$ = Laplace ardışıklık.

Soru 4: (Builder) A=5/50, B=8/50 → Thompson?

Cevap: A ~ Beta(6, 46), B ~ Beta(9, 43). Posterior’lardan örnekle → max’ı seç. B “muhtemelen daha iyi” ama belirsizlik nedeniyle A bazen seçilir — keşif-sömürü dengesi otomatik.

24.10 Egzersizler

Egzersiz 1. Beta(2, 8) prior. (a) E? (b) 20/12 → posterior + E. (c) Yorumla.

Egzersiz 2. $\int_0^1 x^3(1-x)^2 dx$ Bayes bilardosu ile = $1/60$.

Egzersiz 3. Dönüşüm prior’ı: $E = 0{,}3$. $a + b$ büyütmek belirsizliği nasıl etkiler?

Egzersiz 4. (Python — Conjugacy + Thompson)

import numpy as np
rng = np.random.default_rng(0)

# Posterior ortalaması
# Beta(3,3) + 8 başarı, 2 başarısızlık → Beta(11, 5)
print(f"Posterior E = {11/16:.4f}  (teori 11/16)")

# Thompson: A ~ Beta(6,46), B ~ Beta(9,43)
sA = rng.beta(6, 46, 100_000)
sB = rng.beta(9, 43, 100_000)
print(f"P(B > A) = {(sB > sA).mean():.4f}  (B daha iyi görünüyor ama belirsiz)")

Egzersiz 5. (Sonraki ders) Gamma fonksiyonu: $\Gamma(a) = \int_0^\infty x^{a-1} e^{-x} dx$, $\Gamma(n) = (n-1)!$. Gamma($n, \lambda$) = $n$ bağımsız Exp($\lambda$) toplamı.

24.11 Sonraki Ders İçin Hazırlık

Ders 24: Gamma Dağılımı + Poisson Süreci — Exp’in genellemesi, çağrı merkezi.

Ders 24 öncesi yapılacak

Egzersiz 5 ($\Gamma$ fonksiyonu) çöz.
Exp + konvolüsyon hatırla.

24.12 Anahtar Kavramlar (Cheat Sheet)

Kavram	Tanım	Blitzstein’de
Beta(a,b)	$x^{a-1}(1-x)^{b-1}$	3m31
Esneklik	Uniform/U/çan/çarpık	4m47
Conjugacy	Beta + Bin → Beta($a+X, b+n-X$)	7m30
Pseudocount	$a, b$ = prior başarı/başarısızlık	15m48
Bayes bilardosu	$\int = 1/(n+1)$	19m17
E(Beta)	$a/(a+b)$	16m50
Finans LOTUS	Türev = $E(g(S))$	34m15

24.13 ML Bağlantıları Özeti

7 köprü

Conjugacy → Thompson sampling, Bayesçi A/B.
Pseudocount → Laplace smoothing.
Posterior shrinkage → küçük-örneklem CTR.
Esnek $[0,1]$ → kalibrasyon, belirsizlik.
Bayes bilardosu → exchangeability, de Finetti.
Finans LOTUS → Monte Carlo pricing.
Dirichlet → LDA, kategorik prior.

Tek bir şey alıp gideceksen

Beta binomun eşleniği — posterior kapalı form. Pseudocount = Laplace smoothing. Thompson sampling keşif-sömürü dengesini otomatik sağlar.

--- title: "Beta Dağılımı" subtitle: "Conjugate prior + Thompson sampling" --- ::: {.callout-note title="Bölüm bilgisi"} - **Blitzstein'in videosu:** [YouTube — Lecture 23: Beta Distribution](https://www.youtube.com/watch?v=UZjlBQbV1KU) (≈50 dk) - **Okuma süresi:** ≈33 dk ::: ## Bu Derste Ne Var? {#sec-bu-derste} 1. **Beta($a, b$):** $f(x) \propto x^{a-1}(1-x)^{b-1}$, $[0,1]$. 2. **Conjugate prior:** Beta + Bin → Beta posterior. 3. **Pseudocount:** $a=$ prior başarı, $b=$ prior başarısızlık. 4. **Bayes bilardosu:** $\int_0^1 \binom{n}{k} x^k(1-x)^{n-k} dx = 1/(n+1)$. 5. **Finans LOTUS:** türev fiyatı = $E(g(S))$. ::: {.callout-tip title="Builder Notu — ML Köprüleri"} - **Beta-Binom conjugacy** → **Thompson sampling**, **Beta-Bernoulli bandit**, **Bayesçi A/B**. - **Pseudocount** = **Laplace smoothing** (add-α) Bayesçi yüzü; düzenlileştirme. - **Posterior ortalaması** $(a+X)/(a+b+n)$ = **shrinkage**; küçük-örneklem CTR. - **Dirichlet** = Beta'nın çok-boyutlusu, **Multinomial**'in eşleniği → **LDA topic model**. ::: ## Beta Dağılımı {#sec-beta-tanim} $$ f(x) = c\, x^{a-1}(1-x)^{b-1}, \quad 0 < x < 1, \; a, b > 0 $$ **Şekiller:** - $a = b = 1$ → **Uniform**. - $a = b = 1/2$ → **U-şekli**. - $a = b = 2$ → **çan**. - $a > b$ → sağa kayar. ```{python} #| label: fig-beta-sekiller #| fig-cap: "Beta(a,b) esnek aile: a=b=1 uniform, a=b=2 çan, a=b=0.5 U, a=5/b=2 sağa, a=2/b=5 sola. Bayesçi prior'da \"ne kadar eminim\" + \"hangi yönde\" — pseudocount yorumu." #| fig-width: 10 #| fig-height: 5 import numpy as np import matplotlib.pyplot as plt from scipy.stats import beta as beta_dist x = np.linspace(0.001, 0.999, 300) params = [(1, 1, '#1f2937', 'Beta(1,1) = Uniform'), (2, 2, '#15803d', 'Beta(2,2) çan'), (0.5, 0.5, '#6B46C1', 'Beta(0.5,0.5) U'), (5, 2, '#A51C30', 'Beta(5,2) sağ ağırlık'), (2, 5, '#2C5282', 'Beta(2,5) sol ağırlık')] fig, ax = plt.subplots(figsize=(10, 5)) for a, b, c, et in params: ax.plot(x, beta_dist.pdf(x, a, b), color=c, linewidth=2.2, label=et) ax.set_xlabel('x', fontsize=12) ax.set_ylabel('f(x)', fontsize=12) ax.set_title('Beta(a,b) — esnek [0,1] dağılımı', fontsize=12) ax.legend(fontsize=11) ax.grid(True, alpha=0.3) ax.set_ylim(0, 3.5) plt.tight_layout() plt.show() ``` ## Beta-Binom Eşleniği {#sec-conjugacy} $X \mid p \sim$ Bin($n, p$), $p \sim$ Beta($a, b$). Bayes (orantı): $$ f(p \mid X = k) \propto p^k(1-p)^{n-k} \cdot p^{a-1}(1-p)^{b-1} = p^{a+k-1}(1-p)^{b+n-k-1} $$ $$ \boxed{p \mid X \sim \text{Beta}(a + X,\, b + n - X)} $$ ::: {.callout-important title="Builder Notu — Thompson Sampling"} **Bayesçi online öğrenmenin motoru:** her başarı $a \mathrel{+}= 1$, her başarısızlık $b \mathrel{+}= 1$ — kapalı form. **Thompson sampling**: posterior'dan örnekle, **arg max** seç. **Beta-Bernoulli bandit** + **Bayesçi A/B test**'in çekirdeği. Keşif-sömürü dengesi otomatik. ::: ## Pseudocount Yorumu {#sec-pseudocount} - $a$ = prior başarı sayısı (hayalî). - $b$ = prior başarısızlık sayısı. - Veri $X$ başarı, $n - X$ başarısızlık ekler. [Ders 17 Laplace ardışıklık](17-mgf.qmd#sec-laplace) prior'ı Beta(1,1) = Uniform: $(n+1)/(n+2)$ = Beta(1,1) ile aynı yöntem. ::: {.callout-tip title="Builder Notu — Laplace Smoothing"} **Add-α smoothing** = Beta(α, α) prior. $a + b$ = "etkin örnek sayısı" = ne kadar veri ön bilgiye eşdeğer. **Düzenlileştirmenin olasılıksal yüzü**. ::: ## Bayes Bilardosu {#sec-bayes-bilardosu} $\int_0^1 \binom{n}{k} x^k(1-x)^{n-k} dx = ?$ — **kalkülüssüz**: $n+1$ top, birini pembe boya. \[0,1\]'e bağımsız uniform at. Pembenin solundaki beyaz sayısı $X$. - **Hikâye 1:** Pembe konumuna koşulla → $X \sim$ Bin($n, p$) → $P(X=k) = \int \binom{n}{k} p^k(1-p)^{n-k} dp$. - **Hikâye 2:** Topları at, sonra rastgele birini pembe boya → $X$ üzerinde uniform → $P(X=k) = 1/(n+1)$. İkisi aynı: $$ \int_0^1 \binom{n}{k} x^k(1-x)^{n-k} dx = \frac{1}{n+1} $$ ## Momentler ve Shrinkage {#sec-momentler-shrinkage} $$ E(X) = \frac{a}{a+b} $$ **Posterior ortalaması:** $$ E(p \mid X) = \frac{a + X}{a + b + n} $$ Prior + veri harmanı (**shrinkage**) — az veride prior'a, çok veride veriye yakın. ## Finans LOTUS (Konuk) {#sec-finans-lotus} Türev fiyatı = $E(g(S))$ — LOTUS! **Alım opsiyonu:** $g(s) = \max(s - K, 0)$. Log-normal $S$ altında integral = **Black-Scholes**. > *"you can get a Nobel Prize in economics just for knowing LOTUS."* — Steven (konuk), 49:35 ::: {.callout-tip title="Builder Notu — Monte Carlo Pricing"} **Türev fiyatı = E(g(S))** = **Monte Carlo fiyatlama**: $S$'yi örnekle, $g(S)$'yi ortala. RL'deki $E[\text{ödül}]$ ile aynı mekanizma. ::: ## Bu Dersin Özeti {#sec-ozet} 1. **Beta($a,b$):** esnek $[0,1]$. 2. **Conjugate:** Beta + Bin → Beta($a+X, b+n-X$). 3. **Pseudocount** yorumu. 4. **Bayes bilardosu:** $1/(n+1)$. 5. **Momentler:** $E = a/(a+b)$, posterior shrinkage. 6. **Finans:** fiyat = $E(g(S))$ (LOTUS). ::: {.callout-important title="Tek bir cümle"} **Beta($a,b$)** $[0,1]$ üzerinde esnek + **binom'un eşleniği**: posterior $=$ Beta($a+X, b+n-X$). $a, b$ = **pseudocount** — **Laplace smoothing**, **Thompson sampling**, **Bayesçi A/B**'nin temeli. ::: ## Kontrol Soruları {#sec-sorular} ::: {.callout-note collapse="true" title="Soru 1: Beta(1,1), Beta(0.5, 0.5), Beta(5,2), Beta(2,5) şekilleri?"} **Cevap:** Uniform, U-şekli, sağa ağırlık (E=5/7), sola ağırlık (E=2/7). ::: ::: {.callout-note collapse="true" title="Soru 2: Beta(3,3) prior + 8/2 → posterior? Ortalama?"} **Cevap:** Beta(11, 5), $E = 11/16 = \mathbf{0{,}6875}$ (prior 0.5 + veri 0.8 harmanı). ::: ::: {.callout-note collapse="true" title="Soru 3: Uniform prior + k/n → posterior + sonraki başarı?"} **Cevap:** Beta($1+k, 1+n-k$); $E = (k+1)/(n+2)$ = **Laplace ardışıklık**. ::: ::: {.callout-note collapse="true" title="Soru 4: (Builder) A=5/50, B=8/50 → Thompson?"} **Cevap:** A ~ Beta(6, 46), B ~ Beta(9, 43). Posterior'lardan örnekle → max'ı seç. B "muhtemelen daha iyi" ama belirsizlik nedeniyle A bazen seçilir — **keşif-sömürü dengesi otomatik**. ::: ## Egzersizler {#sec-egzersizler} **Egzersiz 1.** Beta(2, 8) prior. (a) E? (b) 20/12 → posterior + E. (c) Yorumla. **Egzersiz 2.** $\int_0^1 x^3(1-x)^2 dx$ Bayes bilardosu ile = $1/60$. **Egzersiz 3.** Dönüşüm prior'ı: $E = 0{,}3$. $a + b$ büyütmek belirsizliği nasıl etkiler? **Egzersiz 4.** *(Python — Conjugacy + Thompson)* ```{python} #| label: ex-beta #| code-fold: false import numpy as np rng = np.random.default_rng(0) # Posterior ortalaması # Beta(3,3) + 8 başarı, 2 başarısızlık → Beta(11, 5) print(f"Posterior E = {11/16:.4f} (teori 11/16)") # Thompson: A ~ Beta(6,46), B ~ Beta(9,43) sA = rng.beta(6, 46, 100_000) sB = rng.beta(9, 43, 100_000) print(f"P(B > A) = {(sB > sA).mean():.4f} (B daha iyi görünüyor ama belirsiz)") ``` **Egzersiz 5.** *(Sonraki ders)* **Gamma fonksiyonu:** $\Gamma(a) = \int_0^\infty x^{a-1} e^{-x} dx$, $\Gamma(n) = (n-1)!$. Gamma($n, \lambda$) = $n$ bağımsız Exp($\lambda$) toplamı. ## Sonraki Ders İçin Hazırlık {#sec-sonraki} **Ders 24: Gamma Dağılımı + Poisson Süreci** — Exp'in genellemesi, çağrı merkezi. ::: {.callout-warning title="Ders 24 öncesi yapılacak"} - Egzersiz 5 ($\Gamma$ fonksiyonu) çöz. - Exp + konvolüsyon hatırla. ::: ## Anahtar Kavramlar (Cheat Sheet) {#sec-cheat-sheet} | Kavram | Tanım | Blitzstein'de | |--------|-------|---------------| | **Beta(a,b)** | $x^{a-1}(1-x)^{b-1}$ | 3m31 | | **Esneklik** | Uniform/U/çan/çarpık | 4m47 | | **Conjugacy** | Beta + Bin → Beta($a+X, b+n-X$) | 7m30 | | **Pseudocount** | $a, b$ = prior başarı/başarısızlık | 15m48 | | **Bayes bilardosu** | $\int = 1/(n+1)$ | 19m17 | | **E(Beta)** | $a/(a+b)$ | 16m50 | | **Finans LOTUS** | Türev = $E(g(S))$ | 34m15 | ## ML Bağlantıları Özeti {#sec-ml-baglantilar} ::: {.callout-tip title="7 köprü"} 1. **Conjugacy** → **Thompson sampling**, Bayesçi A/B. 2. **Pseudocount** → **Laplace smoothing**. 3. **Posterior shrinkage** → küçük-örneklem CTR. 4. **Esnek $[0,1]$** → kalibrasyon, belirsizlik. 5. **Bayes bilardosu** → exchangeability, de Finetti. 6. **Finans LOTUS** → Monte Carlo pricing. 7. **Dirichlet** → **LDA**, kategorik prior. ::: ::: {.callout-important title="Tek bir şey alıp gideceksen"} **Beta** binomun eşleniği — posterior kapalı form. **Pseudocount** = Laplace smoothing. **Thompson sampling** keşif-sömürü dengesini otomatik sağlar. :::