10  Alanın Eğimle İlişkisi Nedir?

Sürekli ortalama, integral/genişlik ve FTC’nin ikinci yüzü

NotBölüm bilgisi

10.1 Bu Derste Ne Var?

İntegralin sıkça karşımıza çıktığı bir problem türü: sürekli bir değişkenin ortalaması. Hem kendi başına faydalı, hem de integral ile türevin neden birbirinin tersi olduğuna — alanın neden eğimle ilişkili olduğuna — yepyeni bir bakış verir. Örneğimiz: \(\sin(x)\)’in \([0, \pi]\) aralığındaki (yarım periyot) ortalama yüksekliği.

Üç ana fikir:

  1. Sürekli ortalama: sonsuz değeri toplayıp \(\infty\)’a bölemezsin; çözüm integraldir. Ortalama = alan / genişlik = \((1/(b-a))\int_a^b f\).
  2. Çözüm: \(\sin\)’in antitürevi \(-\cos\); \(\int_0^\pi \sin = 2\); ortalama = \(2/\pi \approx 0{,}64\).
  3. Yeni bakış: ortalama değer = antitürevin uç noktaları arasındaki eğim (rise/run); “ortalama eğim = toplam eğim”. FTC’ye ikinci bir perspektif.
flowchart LR
    A["Sonlu örnek ortalaması<br/>(Σ f(xᵢ) / N)"] --> B["dx → 0: integral<br/>(1/(b-a)) ∫ₐᵇ f"]
    B --> C["= (F(b) − F(a)) / (b − a)<br/>= antitürevin eğimi"]
    C --> D["f = F' teğet eğimlerinin<br/>ortalaması = uç nokta eğimi"]
    D --> E["🌉 Beklenen değer<br/>(Monte Carlo)"]
    style C fill:#fff3e0,stroke:#f57c00,stroke-width:2px
    style E fill:#fce4ec,stroke:#c2185b,stroke-width:2px
Şekil 10.1: FTC’nin ikinci yüzü: \(f\)’in ortalaması = antitürev \(F\)’in uç noktaları arası eğim.

“the average height of this graph is this area divided by its width.” — Grant, 5:14

İpucuBuilder Notu — ML Köprüleri
  • Sürekli ortalama = integral / genişlikbeklenen değer: bir aralıkta düzgün (uniform) dağılımda ortalama = \((1/(b-a))\int f\); genel dağılımda \(E[X] = \int x \cdot p(x)dx\).
  • “Sonlu ortalamayı sonsuz continuum’a genelle = integral” sezgisi → olasılıkta beklenti, Monte Carlo; sürekli dağılımların tüm teorisi bu adımla kurulur.
  • Ortalama eğim = uç nokta eğimi → ortalama değer teoremi; gradyanların bir yörünge boyunca ortalaması; telescoping.
  • İşaretli alan / genişlik → bir sinyalin ortalaması (DC bileşeni), bir kaybın bir epoch boyunca ortalaması.

10.2 Sürekli Bir Değişkenin Ortalaması

\(\sin(x)\)’in 0 ile \(\pi\) arasındaki grafiğine bak (periyodunun yarısı). Bu aralıkta grafiğin ortalama yüksekliği nedir? Boş bir soru değil: dünyadaki bir sürü döngüsel olgu sinüs dalgalarıyla modellenir — örneğin güneşin gökte kaldığı saat sayısı, yılın gününe göre bir sinüs deseni izler.

Tuhaf bir soru: ortalama denince genelde sonlu sayıda değer düşünürüz — hepsini topla, adetlerine böl. Ama \([0, \pi]\) arasında \(\sin(x)\)’in sonsuz tane değeri var.

İpucuBuilder Notu — Beklenen Değer

Bu “bir niceliğin ortalaması” sorusu, ML’de her yerdedir ama genelde beklenen değer adıyla. Bir kaybın veri dağılımı üzerindeki ortalaması \(E[L]\), bir politikanın ortalama ödülü, bir aktivasyonun beklenen değeri — hepsi “sonsuz/çok sayıda değeri ortalama” sorusudur.

10.3 Sonsuz Değeri Ortalamak: Önce Sonlu Örnek

Aralık boyunca eşit aralıklı sonlu sayıda nokta örnekle. Sonlu örnek olduğu için ortalamayı alışıldık yolla bulabilirsin: her noktadaki yükseklikleri toplayıp örnek sayısına böl.

İpucuBuilder Notu — Büyük Sayılar Yasası

“Önce sonlu örnekle yaklaştır, sonra örnek sayısını artır” — bu, Monte Carlo yönteminin tam tanımıdır. Bir beklentiyi hesaplayamadığında, dağılımdan \(N\) örnek al, ortalamalarını al; \(N \to \infty\) iken bu, gerçek beklentiye yaklaşır (Büyük Sayılar Yasası).

10.4 Ortalama = Alan / Genişlik

Ortalama ifadesini (yüksekliklerin toplamı bölü örnek sayısı) \(dx\) cinsinden yeniden yazalım. Örnekler arası boşluk \(dx\) ise ve aralık 0’dan \(\pi\)’ye uzanıyorsa, örnek sayısı \(\approx \pi/dx\):

\[ \text{ortalama} \approx \frac{\sum \sin(x)}{\pi / dx} = \frac{1}{\pi}\sum \sin(x)\,dx \;\to\; \frac{1}{\pi}\int_0^\pi \sin(x)\,dx \]

\(dx\)’i paya dağıtınca topladığın terimler \(\sin(x) \cdot dx\) oldu — yani pay tam bir integral ifadesidir. Daha çok nokta için bu ortalama, gerçek integralin aralık uzunluğuna (\(\pi\)) bölümüne yaklaşır. Başka deyişle: ortalama yükseklik = alan / genişlik.

İpucuBuilder Notu — Beklenti Tanımı

Bu birebir beklenen değerin tanımıdır. Sonlu durumda \(E[X] = \sum (\text{değer} \times \text{olasılık})\); \([a,b]\)’de düzgün dağılımda her noktanın ağırlığı \(dx/(b-a)\)’dır, dolayısıyla \(E[X] = (1/(b-a))\int_a^b x\,dx\).

10.5 Çözüm: \(-\cos\) Antitürevi ve \(2/\pi\)

İntegrali hesaplamak için \(\sin(x)\)’in antitürevini bulmalıyız: türevi \(\sin\) olan fonksiyon. \(-\cos x\)’in türevi \(+\sin x\)’tir.

\[ \int_0^\pi \sin(x)\,dx = \left[-\cos x\right]_0^\pi = -\cos\pi + \cos 0 = 1 + 1 = 2 \]

\(\sin\) grafiğinin \([0, \pi]\) altındaki alan tam olarak 2 — şık bir sonuç. O hâlde ortalama yükseklik:

\[ \frac{1}{\pi}\int_0^\pi \sin(x)\,dx = \frac{2}{\pi} \approx 0{,}64 \]

İpucuBuilder Notu — Epoch Ortalama Kaybı

Bu \(2/\pi \approx 0{,}64\) sonucu, sinyal işlemede yarım-dalga doğrultulmuş bir sinüsün ortalama değeri olarak karşına çıkar. ML’de bir aktivasyon veya kayıp sinyalinin bir aralıktaki ortalaması, tam bu “integral / genişlik” hesabıdır — örneğin bir epoch boyunca ortalama kayıp.

10.6 Yeni Bakış: Ortalama Eğim = Uç Noktalar Arası Eğim

Ortalama değer \(2/\pi\)’ye, antitürev (\(-\cos x\))’in girdi aralığındaki değişiminin, aralık uzunluğuna bölümüyle ulaştık:

\[ \frac{2}{\pi} = \frac{(-\cos\pi) - (-\cos 0)}{\pi - 0} \]

Bu kesri başka türlü oku: \(-\cos\) grafiğinin \(\pi\) üzerindeki noktası ile 0 üzerindeki noktası arasındaki rise/run eğimi. Peki bu eğim neden \(\sin(x)\)’in ortalama değerini temsil etsin? Çünkü tanım gereği \(\sin(x)\), \(-\cos\) grafiğinin türevidir — yani her noktadaki teğet eğimidir.

“the average slope of a graph over all of its points in a certain range should equal the total slope between the start and end points.” — Grant, 8:13

Genel olarak, \(f(x)\)’in \([a, b]\)’deki ortalama değeri:

\[ \frac{1}{b-a}\int_a^b f(x)\,dx = \frac{F(b) - F(a)}{b - a} \]

İpucuBuilder Notu — Telescoping

\(f\)’nin ortalama değeri = \(F\)’nin uç noktaları arası eğimi” ifadesi, ortalama değer teoreminin integral hâlidir ve telescoping’in sürekli karşılığıdır. ML’de bir gradyanın bir yörünge boyunca ortalaması, yalnızca başlangıç ve bitiş parametrelerinin farkına bağlıdır (ara yol önemsiz) — tıpkı \(F(b) - F(a)\)’nın aradaki tüm noktaları görmezden gelmesi gibi.

10.7 İkinci Sezgi: Sonlu → Sonsuz Genelleme = İntegral

Ders 8’de integralleri akla getiren bir his tarif etmiştim: “problem küçük şeyleri toplayarak yaklaştırılabiliyorsa, integral düşün.” Burada ikinci bir his ekliyoruz: bir fikri sonlu bir bağlamda anlıyorsan ve o fikir birden çok değeri toplamayı içeriyorsa (bir sayı kümesinin ortalamasını almak gibi), ve bunu sonsuz, sürekli bir değer aralığına genellemek istiyorsan — onu bir integral cinsinden ifade etmeyi dene.

“if you want to generalize that idea to apply to an infinite continuous range of values, try seeing if you can phrase things in terms of an integral.” — Grant, 11:58

İpucuBuilder Notu — Olasılık Teorisi

Bu “sonlu fikri sürekliye taşı = integral” sezgisi, olasılık teorisinin kurucu adımıdır. Kesikli bir dağılımın beklentisi \(\sum x \cdot p(x)\); sürekliye geçince \(\int x \cdot p(x)dx\) olur. Varyans, entropi, KL diverjansı — hepsi önce sonlu toplamla tanımlanır, sonra integralle sürekliye genellenir.

10.8 Bu Dersin Özeti

  1. Sürekli bir değişkenin ortalaması: sonsuz değer var, hepsini toplayıp \(\infty\)’a bölemezsin — çözüm bir integraldir.
  2. Önce sonlu örnekle yaklaş: yükseklikleri topla, örnek sayısına böl. Örnek sayısı \(\approx \pi/dx\).
  3. Yeniden yaz: ortalama \(\approx (\sum \sin(x) \cdot dx)/\pi \to (1/\pi)\int_0^\pi \sin(x)dx\) = alan / genişlik.
  4. Çözüm: \(\sin\)’in antitürevi \(-\cos\); \(\int_0^\pi \sin dx = 2\); ortalama = \(2/\pi \approx 0{,}64\).
  5. Yeni bakış: bu ortalama, antitürev \(-\cos\)’un uç noktaları arasındaki rise/run eğimidir.
  6. \(f = F'\) olduğundan, \(f\)’nin ortalama değeri = \(F\)’nin teğet eğimlerinin ortalaması = uç noktalar arası eğim.
  7. İkinci sezgi: sonlu bir “toplama/ortalama” fikrini sürekli, sonsuz bir aralığa genellemek istersen, onu bir integral cinsinden ifade et.
ÖnemliTek bir cümle

Sürekli bir fonksiyonun bir aralıktaki ortalaması, integralinin (işaretli alan) genişliğe bölümüdür — ve bu, antitürevin uç noktaları arasındaki eğime eşittir; yani “ortalama değer = ortalama eğim = uç noktalar arası eğim”, alanın eğimle ilişkisine ikinci bir kanıttır.

10.9 Kontrol Soruları

Cevap: Ortalama = \((1/(3-0))\int_0^3 x^2 dx\). Antitürev \(x^3/3\), dolayısıyla \(\int_0^3 x^2 dx = [x^3/3]_0^3 = 27/3 = 9\). Ortalama = \(9/3 = 3\). (Sezgi: \(x^2\) eğrisi 0’dan 9’a çıkar; ortalama 3, yani maksimumun üçte biri.)

Cevap: \(\int f\,dx\)’in birimi, (\(f\)’nin birimi) × (\(x\)’in birimi) = bir “alan” birimidir. Bunu genişliğe (\(x\)’in birimi) bölünce geriye yalnızca \(f\)’nin birimi kalır — yani bir yükseklik/değer birimi.

Cevap: Ortalama = \((1/(b-a))\int_a^b f\). FTC ile \(\int_a^b f = F(b) - F(a)\), dolayısıyla ortalama = \((F(b) - F(a))/(b-a)\) — bu zaten \(F\)’nin iki uç nokta arasındaki rise/run eğimi. \(f = F'\) olduğundan \(f\), \(F\)’nin her noktadaki teğet eğimidir; bu eğimlerin ortalaması da uç noktalar arası toplam eğime eşittir.

Cevap: Düzgün dağılımda her nokta eşit ağırlıklı, yani \(E[X] = x\)’in \([a,b]\)’deki ortalama değeri = \((1/(b-a))\int_a^b x\,dx\). \(\int_a^b x\,dx = (b^2 - a^2)/2\), dolayısıyla \(E[X] = (b^2 - a^2)/(2(b-a)) = (a+b)/2\) — aralığın orta noktası.

10.10 Egzersizler

Egzersiz 1. \(\cos(x)\)’in \([0, \pi/2]\) aralığındaki ortalama değerini bul.

Egzersiz 2. \(f(x) = x\)’in \([0, L]\) aralığındaki ortalama değerini integralle bul. Sonucun \(L/2\) olduğunu göster.

Egzersiz 3. \(\sin(x)\)’in \([0, 2\pi]\) aralığındaki ortalama değerini hesapla ve sonucun neden 0 olduğunu işaretli alanla açıkla.

Egzersiz 4. (Python — sayısal + sembolik) \(\sin\)’in \([0, \pi]\) ortalamasını sonlu örnekle yaklaştır.

Egzersiz 5. (Sonraki dersin habercisi) Bu seride hep birinci türevi (eğim, hız) kullandık. Türevin türevi — ikinci türev — ne anlatır? Ders 10, yüksek mertebeden türevleri ele alacak.

10.11 Anahtar Kavramlar (Cheat Sheet)

Kavram Tanım Grant’ta
Sürekli ortalama Sonsuz değer; toplayıp \(\infty\)’a bölemezsin → integral 1m43
Sonlu örnekle yaklaş Yükseklikleri topla/say; örnek sayısı \(\approx\) aralık/\(dx\) 2m17
Ortalama = alan / genişlik \((1/(b-a)) \int_a^b f\,dx\) 5m14
\(\int_0^\pi \sin\,dx = 2\) \(\sin\)’in \([0,\pi]\) altındaki alan 6m37
Ortalama \(\sin = 2/\pi\) \(\approx 0{,}64\); alan/genişlik 6m50
Ortalama değer = uç nokta eğimi \((F(b) - F(a))/(b - a)\) 7m19
Ortalama eğim = toplam eğim \(f = F'\) teğetlerinin ortalaması 8m13
Sonlu → sonsuz = integral İkinci “integral düşün” sezgisi 11m58

10.12 ML Bağlantıları Özeti

İpucu7 köprü
  1. Sürekli ortalama = integral / genişlik → beklenen değer \(E[X] = \int x \cdot p(x)dx\); bir aralıkta ortalama kayıp.
  2. Sonlu örnek → integral → Monte Carlo entegrasyon, Büyük Sayılar Yasası.
  3. Ortalama = uç nokta eğimi → ortalama değer teoremi, telescoping; bir yörüngede net ilerleme yalnızca uçlara bağlı.
  4. “Sonlu fikri sürekliye genelle = integral” → olasılık teorisi: beklenti, varyans, entropi, KL diverjansı.
  5. İşaretli alan ortalaması → net/DC bileşen; pozitif ve negatif katkıların dengesi.
  6. Uniform beklenti \((a+b)/2\) → düzgün dağılım, ağırlık başlatma aralıkları.
  7. Epoch ortalama kaybı → “integral / genişlik” hesabının doğrudan pratik karşılığı.
ÖnemliTek bir şey alıp gideceksen

Sürekli bir şeyin ortalaması = integral (işaretli alan) bölü genişlik. Ve bu, antitürevin uç noktaları arasındaki eğime eşittir — alanın eğimle ilişkisinin ikinci kanıtı. Sonlu bir “ortalama/toplam” fikrini sonsuz bir continuum’a taşımak istediğinde refleksin “integral” olsun; bu, olasılık ve beklenti teorisinin kapısıdır.