Derin Öğrenmeye Giriş — MIT 6.S191 (Amini & Soleimany)’dan

ML Builder için Türkçe Notlar

Yazar

Phase 1

Yayınlanma Tarihi

2026-05-28

1 Bu kitap nedir?

Bu, MIT 6.S191 — Introduction to Deep Learning dersinin (Alexander Amini & Ava Soleimany, 2026 + 2025 misafir konuşmacılar) Türkçe ders notlarıdır. Hedef: izlerken paralel okunabilecek; sonradan tek başına da yeterli olabilecek bir referans seti üretmek.

Her bölüm bir “Builder Notu” katmanı taşır — fakat bu kez ters yönde. Önceki üç matematik kursu (Calculus, Lineer Cebir, Olasılık) ML’in temellerini kuruyordu; bu kurs ML’in kendisi. Köprüler artık iki yönlü:

Geriye: backprop → Calculus zincir kuralı, attention → 18.06 dot product + Stat 110 koşullu olasılık, cross-entropy → Stat 110 entropi, weight init → Stat 110 normal dağılım.
İleriye: scaling laws, distributed training, MLOps, hardware (DGX Spark, H100, GB200), production inference (vLLM, ONNX, TensorRT).

Kaynak

Resmî site: introtodeeplearning.com — MIT 6.S191, Alexander Amini & Ava Soleimany
Video dizisi: YouTube — MIT 6.S191 Playlist (2025 + 2026 edition’ları)
Çeviri ve genişletme: Phase 1 (TR + matematik geri köprü + production ileri köprü)

2 Nasıl Okumalı

Sıralı oku. İlk 6 ders (2026 edition) çekirdektir: önceki dersin dilini kullanır. Ders 7-9 (2026 misafir) production tarafına açılır; Ders 10-13 (2025 misafir) LLM/agents, etik ve bilim için AI’a uzanır.

Pratik bir tavsiye

Her bölüm sonundaki PyTorch egzersizleri atlanmayacak. Perceptron’u elle yazmak, backprop’u sıfırdan implement etmek, küçük bir transformer’ı kendi tokenizer’ınla eğitmek — bu pratikler derin öğrenmeyi parmaklarına yerleştirir. Bu kurs okuma değil, inşa etme kursudur.

3 13 Ders

#	Ders	Edition	Ana Fikir
1	Derin Öğrenmeye Giriş	2026	Perceptron, gradient descent, backprop
2	Derin Dizi Modelleme	2026	RNN, attention, transformer
3	Derin Bilgisayarlı Görü	2026	Convolution, CNN, hiyerarşi
4	Derin Üretken Modelleme	2026	VAE, GAN, diffusion (sezgi)
5	Derin Pekiştirmeli Öğrenme	2026	Ajan, policy, Q-learning, RLHF
6	Yeni Sınırlar	2026	Diffusion matematiği, OOD, adversarial, LLM
7	Yapay Zekânın Üç Yasası	2026 misafir	MLOps, eval, jailbreak (Doug Blank, Comet)
8	Bilim için Yapay Zekâ	2026 misafir	Emulator, geometric DL, Aurora, MatterGen (Bishop, MSR)
9	Devasa Paralel Eğitim	2026 misafir	DDP, sharding, MoE, scaling (Lechner, Liquid AI)
10	LLM Sonrası-Eğitim	2025 misafir	SFT, LoRA, DPO, model merging (Labonne)
11	Büyük Dil Modelleri ve Ajanlar	2025 misafir	LLM, prompting, ReAct, Toolformer (Erica, Google)
12	AI için Hipokrat Yemini	2025 misafir	Risk×ödül, AB AI Yasası, açıklanabilirlik (Doug Blank)
13	Yaşam Bilimleri için AI	2025 misafir	Discrete diffusion, EvoDiff, protein (Ava Soleimany)

4 Notasyon

Vektör: $\mathbf{x} \in \mathbb{R}^n$ (bold lowercase)
Matris: $\mathbf{W} \in \mathbb{R}^{m \times n}$ (bold uppercase)
Türev: $\frac{\partial L}{\partial w}$ — kayıp fonksiyonunun $w$ ağırlığına duyarlılığı
Beklenen değer: $\mathbb{E}_{x \sim p}[f(x)] = \int f(x)\,p(x)\,dx$
Cross-entropy: $H(p, q) = -\sum_i p_i \log q_i$
Softmax: $\sigma(z)_i = \frac{e^{z_i}}{\sum_j e^{z_j}}$

Tüm matematik KaTeX ile render ediliyor.

5 Önkoşullar

Bu kursu en iyi şu üç kursu önceden ya da paralel okuyarak takip edersin:

3Blue1Brown — Essence of Calculus (TR) — türev (gradient), integral (beklenen değer), zincir kuralı (backprop)
MIT 18.06 — Linear Algebra (TR) — matris-vektör çarpımı (Wx + b), SVD (LoRA), özdeğerler (PCA)
Stat 110 — Olasılık (TR) — koşullu olasılık (attention), normal dağılım (weight init), entropi (cross-entropy)

Üç kurs Notion’da kardeş projeler olarak mevcut; bu set onlarla geriye köprüler kurar.

Bir tek şey

Derin öğrenme üç fikrin birleşimidir: (1) gradient descent — kaybı en aza indirmek için parametreleri türev yönünde güncellemek; (2) zincir kuralı + autodiff — milyonlarca ağırlığa duyarlılığı verimli hesaplamak; (3) ölçek + indüktif önyargı — yeterli veri, compute ve doğru mimari (CNN için lokallik, RNN için sıralı bellek, Transformer için attention) verildiğinde modelin kendisi gerisini keşfeder. Geri kalan her şey bunun varyasyonu.

6 Builder Eksen — İki Yön

Yön	Konsept	Bağlandığı yer
← Geriye	Backprop, zincir kuralı	Calculus Ders 4
← Geriye	Gradient descent	Calculus Ders 2 + 11 (Taylor 1. derece)
← Geriye	Cross-entropy, KL	Stat 110 entropi, koşullu olasılık
← Geriye	Softmax	Calculus $e^x$ + Stat 110 multinomial
← Geriye	Attention ($Q \cdot K^\top$)	Stat 110 koşullu olasılık + 18.06 dot product
← Geriye	Weight init (Xavier/He)	Stat 110 normal dağılım, varyans
← Geriye	Linear layer (`Wx + b`)	18.06 matris-vektör çarpımı
← Geriye	PCA / spectral	18.06 özdeğer / SVD
→ İleriye	Scaling laws (Chinchilla)	Production
→ İleriye	Distributed training (DDP, FSDP)	Hardware
→ İleriye	Quantization (INT8, FP8, QLoRA)	Inference
→ İleriye	MLOps (W&B, eval pipeline)	Production

Her dersin “Builder Notu” callout’unda derse özgü 1-2 geriye + 1-2 ileriye köprü kurulur — zorlama değil, gerçek olanlar.

--- title: "Önsöz" --- # Bu kitap nedir? Bu, **MIT 6.S191 — Introduction to Deep Learning** dersinin (Alexander Amini & Ava Soleimany, 2026 + 2025 misafir konuşmacılar) Türkçe ders notlarıdır. Hedef: izlerken paralel okunabilecek; sonradan tek başına da yeterli olabilecek bir referans seti üretmek. Her bölüm bir "Builder Notu" katmanı taşır — fakat bu kez **ters yönde**. Önceki üç matematik kursu (Calculus, Lineer Cebir, Olasılık) ML'in **temellerini** kuruyordu; bu kurs **ML'in kendisi**. Köprüler artık iki yönlü: - **Geriye:** backprop → Calculus zincir kuralı, attention → 18.06 dot product + Stat 110 koşullu olasılık, cross-entropy → Stat 110 entropi, weight init → Stat 110 normal dağılım. - **İleriye:** scaling laws, distributed training, MLOps, hardware (DGX Spark, H100, GB200), production inference (vLLM, ONNX, TensorRT). ::: {.callout-note title="Kaynak"} - **Resmî site:** [introtodeeplearning.com](https://introtodeeplearning.com) — MIT 6.S191, Alexander Amini & Ava Soleimany - **Video dizisi:** [YouTube — MIT 6.S191 Playlist](https://www.youtube.com/playlist?list=PLtBw6njQRU-rwp5__7C0oIVt26ZgjG9NI) (2025 + 2026 edition'ları) - **Çeviri ve genişletme:** Phase 1 (TR + matematik geri köprü + production ileri köprü) ::: # Nasıl Okumalı Sıralı oku. İlk 6 ders (2026 edition) çekirdektir: önceki dersin dilini kullanır. Ders 7-9 (2026 misafir) production tarafına açılır; Ders 10-13 (2025 misafir) LLM/agents, etik ve bilim için AI'a uzanır. ::: {.callout-tip title="Pratik bir tavsiye"} Her bölüm sonundaki **PyTorch egzersizleri** atlanmayacak. Perceptron'u elle yazmak, backprop'u sıfırdan implement etmek, küçük bir transformer'ı kendi tokenizer'ınla eğitmek — bu pratikler derin öğrenmeyi parmaklarına yerleştirir. Bu kurs okuma değil, **inşa etme** kursudur. ::: # 13 Ders | # | Ders | Edition | Ana Fikir | |---|------|---------|-----------| | 1 | Derin Öğrenmeye Giriş | 2026 | Perceptron, gradient descent, backprop | | 2 | Derin Dizi Modelleme | 2026 | RNN, attention, transformer | | 3 | Derin Bilgisayarlı Görü | 2026 | Convolution, CNN, hiyerarşi | | 4 | Derin Üretken Modelleme | 2026 | VAE, GAN, diffusion (sezgi) | | 5 | Derin Pekiştirmeli Öğrenme | 2026 | Ajan, policy, Q-learning, RLHF | | 6 | Yeni Sınırlar | 2026 | Diffusion matematiği, OOD, adversarial, LLM | | 7 | Yapay Zekânın Üç Yasası | 2026 misafir | MLOps, eval, jailbreak (Doug Blank, Comet) | | 8 | Bilim için Yapay Zekâ | 2026 misafir | Emulator, geometric DL, Aurora, MatterGen (Bishop, MSR) | | 9 | Devasa Paralel Eğitim | 2026 misafir | DDP, sharding, MoE, scaling (Lechner, Liquid AI) | | 10 | LLM Sonrası-Eğitim | 2025 misafir | SFT, LoRA, DPO, model merging (Labonne) | | 11 | Büyük Dil Modelleri ve Ajanlar | 2025 misafir | LLM, prompting, ReAct, Toolformer (Erica, Google) | | 12 | AI için Hipokrat Yemini | 2025 misafir | Risk×ödül, AB AI Yasası, açıklanabilirlik (Doug Blank) | | 13 | Yaşam Bilimleri için AI | 2025 misafir | Discrete diffusion, EvoDiff, protein (Ava Soleimany) | # Notasyon - **Vektör:** $\mathbf{x} \in \mathbb{R}^n$ (bold lowercase) - **Matris:** $\mathbf{W} \in \mathbb{R}^{m \times n}$ (bold uppercase) - **Türev:** $\frac{\partial L}{\partial w}$ — kayıp fonksiyonunun $w$ ağırlığına duyarlılığı - **Beklenen değer:** $\mathbb{E}_{x \sim p}[f(x)] = \int f(x)\,p(x)\,dx$ - **Cross-entropy:** $H(p, q) = -\sum_i p_i \log q_i$ - **Softmax:** $\sigma(z)_i = \frac{e^{z_i}}{\sum_j e^{z_j}}$ Tüm matematik [KaTeX](https://katex.org/) ile render ediliyor. # Önkoşullar Bu kursu en iyi şu üç kursu önceden ya da paralel okuyarak takip edersin: - **[3Blue1Brown — Essence of Calculus (TR)](../Calculus/)** — türev (gradient), integral (beklenen değer), zincir kuralı (backprop) - **MIT 18.06 — Linear Algebra (TR)** — matris-vektör çarpımı (`Wx + b`), SVD (LoRA), özdeğerler (PCA) - **Stat 110 — Olasılık (TR)** — koşullu olasılık (attention), normal dağılım (weight init), entropi (cross-entropy) Üç kurs Notion'da kardeş projeler olarak mevcut; bu set onlarla **geriye köprüler** kurar. ::: {.callout-important title="Bir tek şey"} Derin öğrenme üç fikrin birleşimidir: **(1) gradient descent** — kaybı en aza indirmek için parametreleri türev yönünde güncellemek; **(2) zincir kuralı + autodiff** — milyonlarca ağırlığa duyarlılığı verimli hesaplamak; **(3) ölçek + indüktif önyargı** — yeterli veri, compute ve doğru mimari (CNN için lokallik, RNN için sıralı bellek, Transformer için attention) verildiğinde modelin kendisi gerisini keşfeder. Geri kalan her şey bunun varyasyonu. ::: # Builder Eksen — İki Yön | Yön | Konsept | Bağlandığı yer | |-----|---------|----------------| | ← Geriye | Backprop, zincir kuralı | Calculus Ders 4 | | ← Geriye | Gradient descent | Calculus Ders 2 + 11 (Taylor 1. derece) | | ← Geriye | Cross-entropy, KL | Stat 110 entropi, koşullu olasılık | | ← Geriye | Softmax | Calculus $e^x$ + Stat 110 multinomial | | ← Geriye | Attention ($Q \cdot K^\top$) | Stat 110 koşullu olasılık + 18.06 dot product | | ← Geriye | Weight init (Xavier/He) | Stat 110 normal dağılım, varyans | | ← Geriye | Linear layer (`Wx + b`) | 18.06 matris-vektör çarpımı | | ← Geriye | PCA / spectral | 18.06 özdeğer / SVD | | → İleriye | Scaling laws (Chinchilla) | Production | | → İleriye | Distributed training (DDP, FSDP) | Hardware | | → İleriye | Quantization (INT8, FP8, QLoRA) | Inference | | → İleriye | MLOps (W&B, eval pipeline) | Production | Her dersin "Builder Notu" callout'unda derse özgü 1-2 geriye + 1-2 ileriye köprü kurulur — zorlama değil, gerçek olanlar.