from scipy.stats import binom, poisson
n, p = 1000, 0.002
lam = n * p
for k in range(6):
b = binom.pmf(k, n, p)
po = poisson.pmf(k, lam)
print(f"k={k}: binom={b:.5f} poisson={po:.5f} fark={abs(b-po):.6f}")12 Poisson Dağılımı
Nadir olaylar limiti; binomdan Poisson’a
- Blitzstein’in videosu: YouTube — Lecture 11: The Poisson distribution (≈43 dk)
- Okuma süresi: ≈25 dk
12.1 Bu Derste Ne Var?
Son temel kesikli dağılım — olasılıkla en çok kullanılan.
- Poisson(\(\lambda\)): PMF \(e^{-\lambda}\lambda^k/k!\), \(E = \lambda\). “Nadir olaylar”.
- Poisson paradigması: çok sayıda, küçük olasılıklı, (zayıf) bağımsız olay → sayıları \(\approx\) Poisson.
- Binom limiti: \(n \to \infty\), \(p \to 0\), \(np = \lambda\) → Binom \(\to\) Poisson.
- Poisson = sayım modellemenin temel taşı: bag-of-words / topic model, olay akışları, tıklama sayıları, Poisson regresyon.
- Var = ortalama = \(\lambda\) (equidispersion); ihlal edilirse → negatif binom (Ders 10).
- “\(P(\ge 1) \approx 1 - e^{-\lambda}\)” kalıbı = nadir olay olasılıklarını (hash collision, near-duplicate, nadir hata) hızlı kestirmenin yolu.
12.2 Poisson Dağılımı: PMF ve Beklenti
\(\lambda > 0\) tek parametreli (rate). Üst sınırı yok:
\[ P(X = k) = \frac{e^{-\lambda}\,\lambda^k}{k!}, \qquad k = 0, 1, 2, \ldots \]
Geçerli mi? Toplam = \(e^{-\lambda} \cdot \sum \lambda^k/k! = e^{-\lambda} \cdot e^\lambda = 1\) (Taylor serisi).
Beklenti:
\[ E(X) = \lambda \]
Poisson, sayım verisinin varsayılan ilk modeli ve Poisson regresyonun temeli. Kritik özellik: varyansı da \(\lambda\) (equidispersion). Gerçek veri çoğu zaman daha dağınıktır (varyans > ortalama); o zaman Poisson yetmez → negatif binom. “Ortalama = varyans mı?” = Poisson mu NB mi?
12.3 Poisson Paradigması ve Binom Limiti
Olaylar \(A_1, \ldots, A_n\), \(P(A_j) = p_j\). \(n\) büyük, \(p_j\) küçük, bağımsız ya da zayıf bağımlı → gerçekleşen sayı \(\approx \text{Poisson}(\lambda)\), \(\lambda = \sum_j p_j\) (doğrusallık).
Binom limiti (ispatla): \(X \sim \text{Bin}(n, p)\), \(np = \lambda\) sabit, \(n \to \infty\):
\[ \binom{n}{k}\left(\frac{\lambda}{n}\right)^k \left(1 - \frac{\lambda}{n}\right)^{n-k} \longrightarrow \frac{e^{-\lambda}\,\lambda^k}{k!} \]
Anahtar: \((1 + x/n)^n \to e^x\) (sürekli bileşik faiz).
import math
import numpy as np
import matplotlib.pyplot as plt
lam = 2.0
ks = np.arange(0, 10)
poisson_pmf = np.array([math.exp(-lam) * lam**k / math.factorial(k) for k in ks])
fig, ax = plt.subplots(figsize=(11, 4.5))
ns = [10, 50, 1000]
renkler = ['#fed7aa', '#fb923c', '#A51C30']
w = 0.18
for i, (n, c) in enumerate(zip(ns, renkler)):
p = lam / n
bin_pmf = np.array([math.comb(n, k) * p**k * (1-p)**(n-k) for k in ks])
ax.bar(ks + (i - 1) * w, bin_pmf, w, color=c, label=f'Bin(n={n}, p={p:.4f})', edgecolor='#9a3412')
ax.bar(ks + 2*w, poisson_pmf, w, color='#1f2937', label=f'Poisson(λ={lam})',
edgecolor='#000', hatch='///')
ax.set_xlabel('k', fontsize=12)
ax.set_ylabel('P(X = k)', fontsize=12)
ax.set_title(f'Binom → Poisson: n büyüdükçe (np = λ = {lam} sabit) yakınsama', fontsize=12)
ax.legend(loc='upper right', fontsize=10)
ax.set_xticks(ks)
ax.grid(True, axis='y', alpha=0.3)
plt.tight_layout()
plt.show()“Küçük sayılar yasası” (Poisson limit teoremi) pratik kazanç sağlar: \(n\) trilyon, \(p\) minik olsa binom katsayıları rahat hesaplanmaz — Poisson(\(\lambda\)) tek parametreyle anında verir.
12.4 Nadir Olay Olasılığı: \(P(\ge 1) \approx 1 - e^{-\lambda}\)
Beklenen sayıyı doğrusallıkla bul → \(P(\text{en az bir}) \approx 1 - e^{-\lambda}\). Bağımlılık olsa bile \(\lambda = \sum p_j\) formülü çalışır.
Örnek (üçlü doğum günü): \(\lambda = \binom{n}{3}/365^2\). 100 kişide \(\lambda \approx 1{,}214\) → \(P(\ge 1) \approx 1 - e^{-1{,}214} \approx 0{,}70\).
“Beklenen sayıyı doğrusallıkla bul, \(1 - e^{-\lambda}\)” = hash collision, near-duplicate, nadir hata olasılıklarını saniyede kestirmenin standart yolu. Zayıf bağımlılık altında bile çalışır.
12.5 Bu Dersin Özeti
- Poisson(\(\lambda\)): \(e^{-\lambda}\lambda^k/k!\); üst sınırsız.
- Beklenti = \(\lambda\), varyans da \(\lambda\) (equidispersion).
- Poisson paradigması: \(n\) büyük, \(p_j\) küçük, zayıf bağımlı → Poisson(\(\sum p_j\)).
- Binom limiti: \(n \to \infty\), \(np = \lambda\) → Poisson(\(\lambda\)).
- \(P(\ge 1) \approx 1 - e^{-\lambda}\).
Poisson(\(\lambda\)) “çok sayıda nadir, (zayıf) bağımsız olayın sayısı” dağılımıdır (binomun limit hâli); ortalama ve varyans \(\lambda\), \(P(\ge 1) \approx 1 - e^{-\lambda}\) ile nadir olay olasılıklarını saniyede kestirirsin.
12.6 Kontrol Soruları
Cevap: \(P(X = 0) = e^{-3} \approx \mathbf{0{,}0498}\).
Cevap: \(\lambda = \binom{100}{3}/365^2 \approx 1{,}214\). \(P(\ge 1) \approx 1 - e^{-1{,}214} \approx \mathbf{0{,}70}\).
Cevap: \(\lambda = 0{,}1\) → \(P(0) = e^{-0{,}1} \approx \mathbf{0{,}905}\).
Cevap: \(\lambda = 5\) → \(P(\ge 1) = 1 - e^{-5} \approx \mathbf{0{,}993}\).
12.7 Egzersizler
Egzersiz 1. Her 100 sayfada 2 hata. 50 sayfada hatasız olasılığı?
Egzersiz 2. 1000 kişi, belirli güne doğanların dağılımı + beklenti?
Egzersiz 3. 1000 oyun, \(p = 1/500\). Poisson yaklaşımıyla \(P(X = 0, 1, 2)\).
Egzersiz 4. (Python — Binom vs Poisson)
Egzersiz 5. (Sonraki ders) Sürekli RV: bir aralıktaki her reel sayıyı alabilen değişken. \(P(X = x)\) ne olur? Ders 12: PDF.
12.8 Sonraki Ders İçin Hazırlık
Ders 12: Kesikli vs Sürekli, Uniform — PDF, integral, ilk sürekli dağılım.
- Egzersizleri çöz — özellikle 4.
- “\(P(\ge 1) \approx 1 - e^{-\lambda}\)” refleksini pekiştir.
- Ana cümle: “Poisson, çok sayıda nadir olayın sayısıdır…”
12.9 Anahtar Kavramlar (Cheat Sheet)
| Kavram | Tanım | Blitzstein’de |
|---|---|---|
| Poisson PMF | \(e^{-\lambda}\lambda^k/k!\) | 7m08 |
| Poisson E | \(\lambda\) (varyans da) | 12m04 |
| Poisson kullanımı | Çok fırsat, nadir olay | 12m34 |
| Paradigma | \(\approx\) Poisson(\(\sum p_j\)), zayıf bağımlıda | 18m43 |
| Binom → Poisson | \(n \to \infty, np = \lambda\) | 22m59 |
| \((1+x/n)^n \to e^x\) | Limit anahtarı | 29m03 |
| \(P(\ge 1) \approx 1 - e^{-\lambda}\) | Nadir olay refleksi | 42m01 |
| Üçlü doğum günü | \(\lambda = \binom{n}{3}/365^2\) | 33m46 |
12.10 ML Bağlantıları Özeti
- Poisson → sayım modelleri, Poisson regresyon, topic model.
- Var = ortalama = \(\lambda\) → overdispersion testi; ihlal → NB.
- Paradigma → nadir olay sayımı, zayıf bağımlılık toleransı.
- Binom → Poisson → küçük sayılar yasası; büyük \(n\)’de hesaplanabilirlik.
- \(1 - e^{-\lambda}\) → hash collision, near-duplicate, nadir hata.
- Sympathetic magic → model/örnek ≠ dağılım.
Poisson(\(\lambda\)) “çok sayıda nadir olayın sayısı”dır. Beklenen sayıyı doğrusallıkla bul, \(P(\ge 1) \approx 1 - e^{-\lambda}\) ile nadir olay olasılıklarını saniyede kestir.