12  Poisson Dağılımı

Nadir olaylar limiti; binomdan Poisson’a

NotBölüm bilgisi

12.1 Bu Derste Ne Var?

Son temel kesikli dağılım — olasılıkla en çok kullanılan.

  1. Poisson(\(\lambda\)): PMF \(e^{-\lambda}\lambda^k/k!\), \(E = \lambda\). “Nadir olaylar”.
  2. Poisson paradigması: çok sayıda, küçük olasılıklı, (zayıf) bağımsız olay → sayıları \(\approx\) Poisson.
  3. Binom limiti: \(n \to \infty\), \(p \to 0\), \(np = \lambda\) → Binom \(\to\) Poisson.
İpucuBuilder Notu — ML Köprüleri
  • Poisson = sayım modellemenin temel taşı: bag-of-words / topic model, olay akışları, tıklama sayıları, Poisson regresyon.
  • Var = ortalama = \(\lambda\) (equidispersion); ihlal edilirse → negatif binom (Ders 10).
  • \(P(\ge 1) \approx 1 - e^{-\lambda}\) kalıbı = nadir olay olasılıklarını (hash collision, near-duplicate, nadir hata) hızlı kestirmenin yolu.

12.2 Poisson Dağılımı: PMF ve Beklenti

\(\lambda > 0\) tek parametreli (rate). Üst sınırı yok:

\[ P(X = k) = \frac{e^{-\lambda}\,\lambda^k}{k!}, \qquad k = 0, 1, 2, \ldots \]

Geçerli mi? Toplam = \(e^{-\lambda} \cdot \sum \lambda^k/k! = e^{-\lambda} \cdot e^\lambda = 1\) (Taylor serisi).

Beklenti:

\[ E(X) = \lambda \]

İpucuBuilder Notu — Poisson Regresyon

Poisson, sayım verisinin varsayılan ilk modeli ve Poisson regresyonun temeli. Kritik özellik: varyansı da \(\lambda\) (equidispersion). Gerçek veri çoğu zaman daha dağınıktır (varyans > ortalama); o zaman Poisson yetmez → negatif binom. “Ortalama = varyans mı?” = Poisson mu NB mi?

12.3 Poisson Paradigması ve Binom Limiti

Olaylar \(A_1, \ldots, A_n\), \(P(A_j) = p_j\). \(n\) büyük, \(p_j\) küçük, bağımsız ya da zayıf bağımlı → gerçekleşen sayı \(\approx \text{Poisson}(\lambda)\), \(\lambda = \sum_j p_j\) (doğrusallık).

Binom limiti (ispatla): \(X \sim \text{Bin}(n, p)\), \(np = \lambda\) sabit, \(n \to \infty\):

\[ \binom{n}{k}\left(\frac{\lambda}{n}\right)^k \left(1 - \frac{\lambda}{n}\right)^{n-k} \longrightarrow \frac{e^{-\lambda}\,\lambda^k}{k!} \]

Anahtar: \((1 + x/n)^n \to e^x\) (sürekli bileşik faiz).

import math
import numpy as np
import matplotlib.pyplot as plt

lam = 2.0
ks = np.arange(0, 10)
poisson_pmf = np.array([math.exp(-lam) * lam**k / math.factorial(k) for k in ks])

fig, ax = plt.subplots(figsize=(11, 4.5))
ns = [10, 50, 1000]
renkler = ['#fed7aa', '#fb923c', '#A51C30']
w = 0.18
for i, (n, c) in enumerate(zip(ns, renkler)):
    p = lam / n
    bin_pmf = np.array([math.comb(n, k) * p**k * (1-p)**(n-k) for k in ks])
    ax.bar(ks + (i - 1) * w, bin_pmf, w, color=c, label=f'Bin(n={n}, p={p:.4f})', edgecolor='#9a3412')

ax.bar(ks + 2*w, poisson_pmf, w, color='#1f2937', label=f'Poisson(λ={lam})',
       edgecolor='#000', hatch='///')
ax.set_xlabel('k', fontsize=12)
ax.set_ylabel('P(X = k)', fontsize=12)
ax.set_title(f'Binom → Poisson: n büyüdükçe (np = λ = {lam} sabit) yakınsama', fontsize=12)
ax.legend(loc='upper right', fontsize=10)
ax.set_xticks(ks)
ax.grid(True, axis='y', alpha=0.3)
plt.tight_layout()
plt.show()
Şekil 12.1
ÖnemliBuilder Notu — Hesaplanabilirlik Kazancı

“Küçük sayılar yasası” (Poisson limit teoremi) pratik kazanç sağlar: \(n\) trilyon, \(p\) minik olsa binom katsayıları rahat hesaplanmaz — Poisson(\(\lambda\)) tek parametreyle anında verir.

12.4 Nadir Olay Olasılığı: \(P(\ge 1) \approx 1 - e^{-\lambda}\)

Beklenen sayıyı doğrusallıkla bul → \(P(\text{en az bir}) \approx 1 - e^{-\lambda}\). Bağımlılık olsa bile \(\lambda = \sum p_j\) formülü çalışır.

Örnek (üçlü doğum günü): \(\lambda = \binom{n}{3}/365^2\). 100 kişide \(\lambda \approx 1{,}214\)\(P(\ge 1) \approx 1 - e^{-1{,}214} \approx 0{,}70\).

İpucuBuilder Notu — Nadir Olay Refleksi

“Beklenen sayıyı doğrusallıkla bul, \(1 - e^{-\lambda}\)” = hash collision, near-duplicate, nadir hata olasılıklarını saniyede kestirmenin standart yolu. Zayıf bağımlılık altında bile çalışır.

12.5 Bu Dersin Özeti

  1. Poisson(\(\lambda\)): \(e^{-\lambda}\lambda^k/k!\); üst sınırsız.
  2. Beklenti = \(\lambda\), varyans da \(\lambda\) (equidispersion).
  3. Poisson paradigması: \(n\) büyük, \(p_j\) küçük, zayıf bağımlı → Poisson(\(\sum p_j\)).
  4. Binom limiti: \(n \to \infty\), \(np = \lambda\) → Poisson(\(\lambda\)).
  5. \(P(\ge 1) \approx 1 - e^{-\lambda}\).
ÖnemliTek bir cümle

Poisson(\(\lambda\)) “çok sayıda nadir, (zayıf) bağımsız olayın sayısı” dağılımıdır (binomun limit hâli); ortalama ve varyans \(\lambda\), \(P(\ge 1) \approx 1 - e^{-\lambda}\) ile nadir olay olasılıklarını saniyede kestirirsin.

12.6 Kontrol Soruları

Cevap: \(P(X = 0) = e^{-3} \approx \mathbf{0{,}0498}\).

Cevap: \(\lambda = \binom{100}{3}/365^2 \approx 1{,}214\). \(P(\ge 1) \approx 1 - e^{-1{,}214} \approx \mathbf{0{,}70}\).

Cevap: \(\lambda = 0{,}1\)\(P(0) = e^{-0{,}1} \approx \mathbf{0{,}905}\).

Cevap: \(\lambda = 5\)\(P(\ge 1) = 1 - e^{-5} \approx \mathbf{0{,}993}\).

12.7 Egzersizler

Egzersiz 1. Her 100 sayfada 2 hata. 50 sayfada hatasız olasılığı?

Egzersiz 2. 1000 kişi, belirli güne doğanların dağılımı + beklenti?

Egzersiz 3. 1000 oyun, \(p = 1/500\). Poisson yaklaşımıyla \(P(X = 0, 1, 2)\).

Egzersiz 4. (Python — Binom vs Poisson)

from scipy.stats import binom, poisson

n, p = 1000, 0.002
lam = n * p
for k in range(6):
    b = binom.pmf(k, n, p)
    po = poisson.pmf(k, lam)
    print(f"k={k}: binom={b:.5f}  poisson={po:.5f}  fark={abs(b-po):.6f}")

Egzersiz 5. (Sonraki ders) Sürekli RV: bir aralıktaki her reel sayıyı alabilen değişken. \(P(X = x)\) ne olur? Ders 12: PDF.

12.8 Sonraki Ders İçin Hazırlık

Ders 12: Kesikli vs Sürekli, Uniform — PDF, integral, ilk sürekli dağılım.

UyarıDers 12 öncesi yapılacak
  • Egzersizleri çöz — özellikle 4.
  • \(P(\ge 1) \approx 1 - e^{-\lambda}\)” refleksini pekiştir.
  • Ana cümle: “Poisson, çok sayıda nadir olayın sayısıdır…”

12.9 Anahtar Kavramlar (Cheat Sheet)

Kavram Tanım Blitzstein’de
Poisson PMF \(e^{-\lambda}\lambda^k/k!\) 7m08
Poisson E \(\lambda\) (varyans da) 12m04
Poisson kullanımı Çok fırsat, nadir olay 12m34
Paradigma \(\approx\) Poisson(\(\sum p_j\)), zayıf bağımlıda 18m43
Binom → Poisson \(n \to \infty, np = \lambda\) 22m59
\((1+x/n)^n \to e^x\) Limit anahtarı 29m03
\(P(\ge 1) \approx 1 - e^{-\lambda}\) Nadir olay refleksi 42m01
Üçlü doğum günü \(\lambda = \binom{n}{3}/365^2\) 33m46

12.10 ML Bağlantıları Özeti

İpucu6 köprü
  1. Poisson → sayım modelleri, Poisson regresyon, topic model.
  2. Var = ortalama = \(\lambda\) → overdispersion testi; ihlal → NB.
  3. Paradigma → nadir olay sayımı, zayıf bağımlılık toleransı.
  4. Binom → Poisson → küçük sayılar yasası; büyük \(n\)’de hesaplanabilirlik.
  5. \(1 - e^{-\lambda}\) → hash collision, near-duplicate, nadir hata.
  6. Sympathetic magic → model/örnek ≠ dağılım.
ÖnemliTek bir şey alıp gideceksen

Poisson(\(\lambda\)) “çok sayıda nadir olayın sayısı”dır. Beklenen sayıyı doğrusallıkla bul, \(P(\ge 1) \approx 1 - e^{-\lambda}\) ile nadir olay olasılıklarını saniyede kestir.