Derin Öğrenmeye Giriş — MIT 6.S191 (Amini & Soleimany)’dan
ML Builder için Türkçe Notlar
1 Bu kitap nedir?
Bu, MIT 6.S191 — Introduction to Deep Learning dersinin (Alexander Amini & Ava Soleimany, 2026 + 2025 misafir konuşmacılar) Türkçe ders notlarıdır. Hedef: izlerken paralel okunabilecek; sonradan tek başına da yeterli olabilecek bir referans seti üretmek.
Her bölüm bir “Builder Notu” katmanı taşır — fakat bu kez ters yönde. Önceki üç matematik kursu (Calculus, Lineer Cebir, Olasılık) ML’in temellerini kuruyordu; bu kurs ML’in kendisi. Köprüler artık iki yönlü:
- Geriye: backprop → Calculus zincir kuralı, attention → 18.06 dot product + Stat 110 koşullu olasılık, cross-entropy → Stat 110 entropi, weight init → Stat 110 normal dağılım.
- İleriye: scaling laws, distributed training, MLOps, hardware (DGX Spark, H100, GB200), production inference (vLLM, ONNX, TensorRT).
- Resmî site: introtodeeplearning.com — MIT 6.S191, Alexander Amini & Ava Soleimany
- Video dizisi: YouTube — MIT 6.S191 Playlist (2025 + 2026 edition’ları)
- Çeviri ve genişletme: Phase 1 (TR + matematik geri köprü + production ileri köprü)
2 Nasıl Okumalı
Sıralı oku. İlk 6 ders (2026 edition) çekirdektir: önceki dersin dilini kullanır. Ders 7-9 (2026 misafir) production tarafına açılır; Ders 10-13 (2025 misafir) LLM/agents, etik ve bilim için AI’a uzanır.
Her bölüm sonundaki PyTorch egzersizleri atlanmayacak. Perceptron’u elle yazmak, backprop’u sıfırdan implement etmek, küçük bir transformer’ı kendi tokenizer’ınla eğitmek — bu pratikler derin öğrenmeyi parmaklarına yerleştirir. Bu kurs okuma değil, inşa etme kursudur.
3 13 Ders
| # | Ders | Edition | Ana Fikir |
|---|---|---|---|
| 1 | Derin Öğrenmeye Giriş | 2026 | Perceptron, gradient descent, backprop |
| 2 | Derin Dizi Modelleme | 2026 | RNN, attention, transformer |
| 3 | Derin Bilgisayarlı Görü | 2026 | Convolution, CNN, hiyerarşi |
| 4 | Derin Üretken Modelleme | 2026 | VAE, GAN, diffusion (sezgi) |
| 5 | Derin Pekiştirmeli Öğrenme | 2026 | Ajan, policy, Q-learning, RLHF |
| 6 | Yeni Sınırlar | 2026 | Diffusion matematiği, OOD, adversarial, LLM |
| 7 | Yapay Zekânın Üç Yasası | 2026 misafir | MLOps, eval, jailbreak (Doug Blank, Comet) |
| 8 | Bilim için Yapay Zekâ | 2026 misafir | Emulator, geometric DL, Aurora, MatterGen (Bishop, MSR) |
| 9 | Devasa Paralel Eğitim | 2026 misafir | DDP, sharding, MoE, scaling (Lechner, Liquid AI) |
| 10 | LLM Sonrası-Eğitim | 2025 misafir | SFT, LoRA, DPO, model merging (Labonne) |
| 11 | Büyük Dil Modelleri ve Ajanlar | 2025 misafir | LLM, prompting, ReAct, Toolformer (Erica, Google) |
| 12 | AI için Hipokrat Yemini | 2025 misafir | Risk×ödül, AB AI Yasası, açıklanabilirlik (Doug Blank) |
| 13 | Yaşam Bilimleri için AI | 2025 misafir | Discrete diffusion, EvoDiff, protein (Ava Soleimany) |
4 Notasyon
- Vektör: \(\mathbf{x} \in \mathbb{R}^n\) (bold lowercase)
- Matris: \(\mathbf{W} \in \mathbb{R}^{m \times n}\) (bold uppercase)
- Türev: \(\frac{\partial L}{\partial w}\) — kayıp fonksiyonunun \(w\) ağırlığına duyarlılığı
- Beklenen değer: \(\mathbb{E}_{x \sim p}[f(x)] = \int f(x)\,p(x)\,dx\)
- Cross-entropy: \(H(p, q) = -\sum_i p_i \log q_i\)
- Softmax: \(\sigma(z)_i = \frac{e^{z_i}}{\sum_j e^{z_j}}\)
Tüm matematik KaTeX ile render ediliyor.
5 Önkoşullar
Bu kursu en iyi şu üç kursu önceden ya da paralel okuyarak takip edersin:
- 3Blue1Brown — Essence of Calculus (TR) — türev (gradient), integral (beklenen değer), zincir kuralı (backprop)
- MIT 18.06 — Linear Algebra (TR) — matris-vektör çarpımı (
Wx + b), SVD (LoRA), özdeğerler (PCA) - Stat 110 — Olasılık (TR) — koşullu olasılık (attention), normal dağılım (weight init), entropi (cross-entropy)
Üç kurs Notion’da kardeş projeler olarak mevcut; bu set onlarla geriye köprüler kurar.
Derin öğrenme üç fikrin birleşimidir: (1) gradient descent — kaybı en aza indirmek için parametreleri türev yönünde güncellemek; (2) zincir kuralı + autodiff — milyonlarca ağırlığa duyarlılığı verimli hesaplamak; (3) ölçek + indüktif önyargı — yeterli veri, compute ve doğru mimari (CNN için lokallik, RNN için sıralı bellek, Transformer için attention) verildiğinde modelin kendisi gerisini keşfeder. Geri kalan her şey bunun varyasyonu.
6 Builder Eksen — İki Yön
| Yön | Konsept | Bağlandığı yer |
|---|---|---|
| ← Geriye | Backprop, zincir kuralı | Calculus Ders 4 |
| ← Geriye | Gradient descent | Calculus Ders 2 + 11 (Taylor 1. derece) |
| ← Geriye | Cross-entropy, KL | Stat 110 entropi, koşullu olasılık |
| ← Geriye | Softmax | Calculus \(e^x\) + Stat 110 multinomial |
| ← Geriye | Attention (\(Q \cdot K^\top\)) | Stat 110 koşullu olasılık + 18.06 dot product |
| ← Geriye | Weight init (Xavier/He) | Stat 110 normal dağılım, varyans |
| ← Geriye | Linear layer (Wx + b) |
18.06 matris-vektör çarpımı |
| ← Geriye | PCA / spectral | 18.06 özdeğer / SVD |
| → İleriye | Scaling laws (Chinchilla) | Production |
| → İleriye | Distributed training (DDP, FSDP) | Hardware |
| → İleriye | Quantization (INT8, FP8, QLoRA) | Inference |
| → İleriye | MLOps (W&B, eval pipeline) | Production |
Her dersin “Builder Notu” callout’unda derse özgü 1-2 geriye + 1-2 ileriye köprü kurulur — zorlama değil, gerçek olanlar.