flowchart LR
A["Sonlu örnek ortalaması<br/>(Σ f(xᵢ) / N)"] --> B["dx → 0: integral<br/>(1/(b-a)) ∫ₐᵇ f"]
B --> C["= (F(b) − F(a)) / (b − a)<br/>= antitürevin eğimi"]
C --> D["f = F' teğet eğimlerinin<br/>ortalaması = uç nokta eğimi"]
D --> E["🌉 Beklenen değer<br/>(Monte Carlo)"]
style C fill:#fff3e0,stroke:#f57c00,stroke-width:2px
style E fill:#fce4ec,stroke:#c2185b,stroke-width:2px
10 Alanın Eğimle İlişkisi Nedir?
Sürekli ortalama, integral/genişlik ve FTC’nin ikinci yüzü
- Grant’ın videosu: YouTube — Chapter 9: What does area have to do with slope? (≈12 dk)
- Kaynak: 3Blue1Brown — Essence of Calculus
- Okuma süresi: ≈20 dk
10.1 Bu Derste Ne Var?
İntegralin sıkça karşımıza çıktığı bir problem türü: sürekli bir değişkenin ortalaması. Hem kendi başına faydalı, hem de integral ile türevin neden birbirinin tersi olduğuna — alanın neden eğimle ilişkili olduğuna — yepyeni bir bakış verir. Örneğimiz: \(\sin(x)\)’in \([0, \pi]\) aralığındaki (yarım periyot) ortalama yüksekliği.
Üç ana fikir:
- Sürekli ortalama: sonsuz değeri toplayıp \(\infty\)’a bölemezsin; çözüm integraldir. Ortalama = alan / genişlik = \((1/(b-a))\int_a^b f\).
- Çözüm: \(\sin\)’in antitürevi \(-\cos\); \(\int_0^\pi \sin = 2\); ortalama = \(2/\pi \approx 0{,}64\).
- Yeni bakış: ortalama değer = antitürevin uç noktaları arasındaki eğim (rise/run); “ortalama eğim = toplam eğim”. FTC’ye ikinci bir perspektif.
“the average height of this graph is this area divided by its width.” — Grant, 5:14
- Sürekli ortalama = integral / genişlik → beklenen değer: bir aralıkta düzgün (uniform) dağılımda ortalama = \((1/(b-a))\int f\); genel dağılımda \(E[X] = \int x \cdot p(x)dx\).
- “Sonlu ortalamayı sonsuz continuum’a genelle = integral” sezgisi → olasılıkta beklenti, Monte Carlo; sürekli dağılımların tüm teorisi bu adımla kurulur.
- Ortalama eğim = uç nokta eğimi → ortalama değer teoremi; gradyanların bir yörünge boyunca ortalaması; telescoping.
- İşaretli alan / genişlik → bir sinyalin ortalaması (DC bileşeni), bir kaybın bir epoch boyunca ortalaması.
10.2 Sürekli Bir Değişkenin Ortalaması
\(\sin(x)\)’in 0 ile \(\pi\) arasındaki grafiğine bak (periyodunun yarısı). Bu aralıkta grafiğin ortalama yüksekliği nedir? Boş bir soru değil: dünyadaki bir sürü döngüsel olgu sinüs dalgalarıyla modellenir — örneğin güneşin gökte kaldığı saat sayısı, yılın gününe göre bir sinüs deseni izler.
Tuhaf bir soru: ortalama denince genelde sonlu sayıda değer düşünürüz — hepsini topla, adetlerine böl. Ama \([0, \pi]\) arasında \(\sin(x)\)’in sonsuz tane değeri var.
Bu “bir niceliğin ortalaması” sorusu, ML’de her yerdedir ama genelde beklenen değer adıyla. Bir kaybın veri dağılımı üzerindeki ortalaması \(E[L]\), bir politikanın ortalama ödülü, bir aktivasyonun beklenen değeri — hepsi “sonsuz/çok sayıda değeri ortalama” sorusudur.
10.3 Sonsuz Değeri Ortalamak: Önce Sonlu Örnek
Aralık boyunca eşit aralıklı sonlu sayıda nokta örnekle. Sonlu örnek olduğu için ortalamayı alışıldık yolla bulabilirsin: her noktadaki yükseklikleri toplayıp örnek sayısına böl.
“Önce sonlu örnekle yaklaştır, sonra örnek sayısını artır” — bu, Monte Carlo yönteminin tam tanımıdır. Bir beklentiyi hesaplayamadığında, dağılımdan \(N\) örnek al, ortalamalarını al; \(N \to \infty\) iken bu, gerçek beklentiye yaklaşır (Büyük Sayılar Yasası).
10.4 Ortalama = Alan / Genişlik
Ortalama ifadesini (yüksekliklerin toplamı bölü örnek sayısı) \(dx\) cinsinden yeniden yazalım. Örnekler arası boşluk \(dx\) ise ve aralık 0’dan \(\pi\)’ye uzanıyorsa, örnek sayısı \(\approx \pi/dx\):
\[ \text{ortalama} \approx \frac{\sum \sin(x)}{\pi / dx} = \frac{1}{\pi}\sum \sin(x)\,dx \;\to\; \frac{1}{\pi}\int_0^\pi \sin(x)\,dx \]
\(dx\)’i paya dağıtınca topladığın terimler \(\sin(x) \cdot dx\) oldu — yani pay tam bir integral ifadesidir. Daha çok nokta için bu ortalama, gerçek integralin aralık uzunluğuna (\(\pi\)) bölümüne yaklaşır. Başka deyişle: ortalama yükseklik = alan / genişlik.
Bu birebir beklenen değerin tanımıdır. Sonlu durumda \(E[X] = \sum (\text{değer} \times \text{olasılık})\); \([a,b]\)’de düzgün dağılımda her noktanın ağırlığı \(dx/(b-a)\)’dır, dolayısıyla \(E[X] = (1/(b-a))\int_a^b x\,dx\).
10.5 Çözüm: \(-\cos\) Antitürevi ve \(2/\pi\)
İntegrali hesaplamak için \(\sin(x)\)’in antitürevini bulmalıyız: türevi \(\sin\) olan fonksiyon. \(-\cos x\)’in türevi \(+\sin x\)’tir.
\[ \int_0^\pi \sin(x)\,dx = \left[-\cos x\right]_0^\pi = -\cos\pi + \cos 0 = 1 + 1 = 2 \]
\(\sin\) grafiğinin \([0, \pi]\) altındaki alan tam olarak 2 — şık bir sonuç. O hâlde ortalama yükseklik:
\[ \frac{1}{\pi}\int_0^\pi \sin(x)\,dx = \frac{2}{\pi} \approx 0{,}64 \]
Bu \(2/\pi \approx 0{,}64\) sonucu, sinyal işlemede yarım-dalga doğrultulmuş bir sinüsün ortalama değeri olarak karşına çıkar. ML’de bir aktivasyon veya kayıp sinyalinin bir aralıktaki ortalaması, tam bu “integral / genişlik” hesabıdır — örneğin bir epoch boyunca ortalama kayıp.
10.6 Yeni Bakış: Ortalama Eğim = Uç Noktalar Arası Eğim
Ortalama değer \(2/\pi\)’ye, antitürev (\(-\cos x\))’in girdi aralığındaki değişiminin, aralık uzunluğuna bölümüyle ulaştık:
\[ \frac{2}{\pi} = \frac{(-\cos\pi) - (-\cos 0)}{\pi - 0} \]
Bu kesri başka türlü oku: \(-\cos\) grafiğinin \(\pi\) üzerindeki noktası ile 0 üzerindeki noktası arasındaki rise/run eğimi. Peki bu eğim neden \(\sin(x)\)’in ortalama değerini temsil etsin? Çünkü tanım gereği \(\sin(x)\), \(-\cos\) grafiğinin türevidir — yani her noktadaki teğet eğimidir.
“the average slope of a graph over all of its points in a certain range should equal the total slope between the start and end points.” — Grant, 8:13
Genel olarak, \(f(x)\)’in \([a, b]\)’deki ortalama değeri:
\[ \frac{1}{b-a}\int_a^b f(x)\,dx = \frac{F(b) - F(a)}{b - a} \]
“\(f\)’nin ortalama değeri = \(F\)’nin uç noktaları arası eğimi” ifadesi, ortalama değer teoreminin integral hâlidir ve telescoping’in sürekli karşılığıdır. ML’de bir gradyanın bir yörünge boyunca ortalaması, yalnızca başlangıç ve bitiş parametrelerinin farkına bağlıdır (ara yol önemsiz) — tıpkı \(F(b) - F(a)\)’nın aradaki tüm noktaları görmezden gelmesi gibi.
10.7 İkinci Sezgi: Sonlu → Sonsuz Genelleme = İntegral
Ders 8’de integralleri akla getiren bir his tarif etmiştim: “problem küçük şeyleri toplayarak yaklaştırılabiliyorsa, integral düşün.” Burada ikinci bir his ekliyoruz: bir fikri sonlu bir bağlamda anlıyorsan ve o fikir birden çok değeri toplamayı içeriyorsa (bir sayı kümesinin ortalamasını almak gibi), ve bunu sonsuz, sürekli bir değer aralığına genellemek istiyorsan — onu bir integral cinsinden ifade etmeyi dene.
“if you want to generalize that idea to apply to an infinite continuous range of values, try seeing if you can phrase things in terms of an integral.” — Grant, 11:58
Bu “sonlu fikri sürekliye taşı = integral” sezgisi, olasılık teorisinin kurucu adımıdır. Kesikli bir dağılımın beklentisi \(\sum x \cdot p(x)\); sürekliye geçince \(\int x \cdot p(x)dx\) olur. Varyans, entropi, KL diverjansı — hepsi önce sonlu toplamla tanımlanır, sonra integralle sürekliye genellenir.
10.8 Bu Dersin Özeti
- Sürekli bir değişkenin ortalaması: sonsuz değer var, hepsini toplayıp \(\infty\)’a bölemezsin — çözüm bir integraldir.
- Önce sonlu örnekle yaklaş: yükseklikleri topla, örnek sayısına böl. Örnek sayısı \(\approx \pi/dx\).
- Yeniden yaz: ortalama \(\approx (\sum \sin(x) \cdot dx)/\pi \to (1/\pi)\int_0^\pi \sin(x)dx\) = alan / genişlik.
- Çözüm: \(\sin\)’in antitürevi \(-\cos\); \(\int_0^\pi \sin dx = 2\); ortalama = \(2/\pi \approx 0{,}64\).
- Yeni bakış: bu ortalama, antitürev \(-\cos\)’un uç noktaları arasındaki rise/run eğimidir.
- \(f = F'\) olduğundan, \(f\)’nin ortalama değeri = \(F\)’nin teğet eğimlerinin ortalaması = uç noktalar arası eğim.
- İkinci sezgi: sonlu bir “toplama/ortalama” fikrini sürekli, sonsuz bir aralığa genellemek istersen, onu bir integral cinsinden ifade et.
Sürekli bir fonksiyonun bir aralıktaki ortalaması, integralinin (işaretli alan) genişliğe bölümüdür — ve bu, antitürevin uç noktaları arasındaki eğime eşittir; yani “ortalama değer = ortalama eğim = uç noktalar arası eğim”, alanın eğimle ilişkisine ikinci bir kanıttır.
10.9 Kontrol Soruları
Cevap: Ortalama = \((1/(3-0))\int_0^3 x^2 dx\). Antitürev \(x^3/3\), dolayısıyla \(\int_0^3 x^2 dx = [x^3/3]_0^3 = 27/3 = 9\). Ortalama = \(9/3 = 3\). (Sezgi: \(x^2\) eğrisi 0’dan 9’a çıkar; ortalama 3, yani maksimumun üçte biri.)
Cevap: \(\int f\,dx\)’in birimi, (\(f\)’nin birimi) × (\(x\)’in birimi) = bir “alan” birimidir. Bunu genişliğe (\(x\)’in birimi) bölünce geriye yalnızca \(f\)’nin birimi kalır — yani bir yükseklik/değer birimi.
Cevap: Ortalama = \((1/(b-a))\int_a^b f\). FTC ile \(\int_a^b f = F(b) - F(a)\), dolayısıyla ortalama = \((F(b) - F(a))/(b-a)\) — bu zaten \(F\)’nin iki uç nokta arasındaki rise/run eğimi. \(f = F'\) olduğundan \(f\), \(F\)’nin her noktadaki teğet eğimidir; bu eğimlerin ortalaması da uç noktalar arası toplam eğime eşittir.
Cevap: Düzgün dağılımda her nokta eşit ağırlıklı, yani \(E[X] = x\)’in \([a,b]\)’deki ortalama değeri = \((1/(b-a))\int_a^b x\,dx\). \(\int_a^b x\,dx = (b^2 - a^2)/2\), dolayısıyla \(E[X] = (b^2 - a^2)/(2(b-a)) = (a+b)/2\) — aralığın orta noktası.
10.10 Egzersizler
Egzersiz 1. \(\cos(x)\)’in \([0, \pi/2]\) aralığındaki ortalama değerini bul.
Egzersiz 2. \(f(x) = x\)’in \([0, L]\) aralığındaki ortalama değerini integralle bul. Sonucun \(L/2\) olduğunu göster.
Egzersiz 3. \(\sin(x)\)’in \([0, 2\pi]\) aralığındaki ortalama değerini hesapla ve sonucun neden 0 olduğunu işaretli alanla açıkla.
Egzersiz 4. (Python — sayısal + sembolik) \(\sin\)’in \([0, \pi]\) ortalamasını sonlu örnekle yaklaştır.
Egzersiz 5. (Sonraki dersin habercisi) Bu seride hep birinci türevi (eğim, hız) kullandık. Türevin türevi — ikinci türev — ne anlatır? Ders 10, yüksek mertebeden türevleri ele alacak.
10.11 Anahtar Kavramlar (Cheat Sheet)
| Kavram | Tanım | Grant’ta |
|---|---|---|
| Sürekli ortalama | Sonsuz değer; toplayıp \(\infty\)’a bölemezsin → integral | 1m43 |
| Sonlu örnekle yaklaş | Yükseklikleri topla/say; örnek sayısı \(\approx\) aralık/\(dx\) | 2m17 |
| Ortalama = alan / genişlik | \((1/(b-a)) \int_a^b f\,dx\) | 5m14 |
| \(\int_0^\pi \sin\,dx = 2\) | \(\sin\)’in \([0,\pi]\) altındaki alan | 6m37 |
| Ortalama \(\sin = 2/\pi\) | \(\approx 0{,}64\); alan/genişlik | 6m50 |
| Ortalama değer = uç nokta eğimi | \((F(b) - F(a))/(b - a)\) | 7m19 |
| Ortalama eğim = toplam eğim | \(f = F'\) teğetlerinin ortalaması | 8m13 |
| Sonlu → sonsuz = integral | İkinci “integral düşün” sezgisi | 11m58 |
10.12 ML Bağlantıları Özeti
- Sürekli ortalama = integral / genişlik → beklenen değer \(E[X] = \int x \cdot p(x)dx\); bir aralıkta ortalama kayıp.
- Sonlu örnek → integral → Monte Carlo entegrasyon, Büyük Sayılar Yasası.
- Ortalama = uç nokta eğimi → ortalama değer teoremi, telescoping; bir yörüngede net ilerleme yalnızca uçlara bağlı.
- “Sonlu fikri sürekliye genelle = integral” → olasılık teorisi: beklenti, varyans, entropi, KL diverjansı.
- İşaretli alan ortalaması → net/DC bileşen; pozitif ve negatif katkıların dengesi.
- Uniform beklenti \((a+b)/2\) → düzgün dağılım, ağırlık başlatma aralıkları.
- Epoch ortalama kaybı → “integral / genişlik” hesabının doğrudan pratik karşılığı.
Sürekli bir şeyin ortalaması = integral (işaretli alan) bölü genişlik. Ve bu, antitürevin uç noktaları arasındaki eğime eşittir — alanın eğimle ilişkisinin ikinci kanıtı. Sonlu bir “ortalama/toplam” fikrini sonsuz bir continuum’a taşımak istediğinde refleksin “integral” olsun; bu, olasılık ve beklenti teorisinin kapısıdır.