Derin Öğrenmeye Giriş — MIT 6.S191 (Amini & Soleimany)’dan

ML Builder için Türkçe Notlar

Yazar

Phase 1

Yayınlanma Tarihi

2026-05-28

1 Bu kitap nedir?

Bu, MIT 6.S191 — Introduction to Deep Learning dersinin (Alexander Amini & Ava Soleimany, 2026 + 2025 misafir konuşmacılar) Türkçe ders notlarıdır. Hedef: izlerken paralel okunabilecek; sonradan tek başına da yeterli olabilecek bir referans seti üretmek.

Her bölüm bir “Builder Notu” katmanı taşır — fakat bu kez ters yönde. Önceki üç matematik kursu (Calculus, Lineer Cebir, Olasılık) ML’in temellerini kuruyordu; bu kurs ML’in kendisi. Köprüler artık iki yönlü:

  • Geriye: backprop → Calculus zincir kuralı, attention → 18.06 dot product + Stat 110 koşullu olasılık, cross-entropy → Stat 110 entropi, weight init → Stat 110 normal dağılım.
  • İleriye: scaling laws, distributed training, MLOps, hardware (DGX Spark, H100, GB200), production inference (vLLM, ONNX, TensorRT).
NotKaynak

2 Nasıl Okumalı

Sıralı oku. İlk 6 ders (2026 edition) çekirdektir: önceki dersin dilini kullanır. Ders 7-9 (2026 misafir) production tarafına açılır; Ders 10-13 (2025 misafir) LLM/agents, etik ve bilim için AI’a uzanır.

İpucuPratik bir tavsiye

Her bölüm sonundaki PyTorch egzersizleri atlanmayacak. Perceptron’u elle yazmak, backprop’u sıfırdan implement etmek, küçük bir transformer’ı kendi tokenizer’ınla eğitmek — bu pratikler derin öğrenmeyi parmaklarına yerleştirir. Bu kurs okuma değil, inşa etme kursudur.

3 13 Ders

# Ders Edition Ana Fikir
1 Derin Öğrenmeye Giriş 2026 Perceptron, gradient descent, backprop
2 Derin Dizi Modelleme 2026 RNN, attention, transformer
3 Derin Bilgisayarlı Görü 2026 Convolution, CNN, hiyerarşi
4 Derin Üretken Modelleme 2026 VAE, GAN, diffusion (sezgi)
5 Derin Pekiştirmeli Öğrenme 2026 Ajan, policy, Q-learning, RLHF
6 Yeni Sınırlar 2026 Diffusion matematiği, OOD, adversarial, LLM
7 Yapay Zekânın Üç Yasası 2026 misafir MLOps, eval, jailbreak (Doug Blank, Comet)
8 Bilim için Yapay Zekâ 2026 misafir Emulator, geometric DL, Aurora, MatterGen (Bishop, MSR)
9 Devasa Paralel Eğitim 2026 misafir DDP, sharding, MoE, scaling (Lechner, Liquid AI)
10 LLM Sonrası-Eğitim 2025 misafir SFT, LoRA, DPO, model merging (Labonne)
11 Büyük Dil Modelleri ve Ajanlar 2025 misafir LLM, prompting, ReAct, Toolformer (Erica, Google)
12 AI için Hipokrat Yemini 2025 misafir Risk×ödül, AB AI Yasası, açıklanabilirlik (Doug Blank)
13 Yaşam Bilimleri için AI 2025 misafir Discrete diffusion, EvoDiff, protein (Ava Soleimany)

4 Notasyon

  • Vektör: \(\mathbf{x} \in \mathbb{R}^n\) (bold lowercase)
  • Matris: \(\mathbf{W} \in \mathbb{R}^{m \times n}\) (bold uppercase)
  • Türev: \(\frac{\partial L}{\partial w}\) — kayıp fonksiyonunun \(w\) ağırlığına duyarlılığı
  • Beklenen değer: \(\mathbb{E}_{x \sim p}[f(x)] = \int f(x)\,p(x)\,dx\)
  • Cross-entropy: \(H(p, q) = -\sum_i p_i \log q_i\)
  • Softmax: \(\sigma(z)_i = \frac{e^{z_i}}{\sum_j e^{z_j}}\)

Tüm matematik KaTeX ile render ediliyor.

5 Önkoşullar

Bu kursu en iyi şu üç kursu önceden ya da paralel okuyarak takip edersin:

  • 3Blue1Brown — Essence of Calculus (TR) — türev (gradient), integral (beklenen değer), zincir kuralı (backprop)
  • MIT 18.06 — Linear Algebra (TR) — matris-vektör çarpımı (Wx + b), SVD (LoRA), özdeğerler (PCA)
  • Stat 110 — Olasılık (TR) — koşullu olasılık (attention), normal dağılım (weight init), entropi (cross-entropy)

Üç kurs Notion’da kardeş projeler olarak mevcut; bu set onlarla geriye köprüler kurar.

ÖnemliBir tek şey

Derin öğrenme üç fikrin birleşimidir: (1) gradient descent — kaybı en aza indirmek için parametreleri türev yönünde güncellemek; (2) zincir kuralı + autodiff — milyonlarca ağırlığa duyarlılığı verimli hesaplamak; (3) ölçek + indüktif önyargı — yeterli veri, compute ve doğru mimari (CNN için lokallik, RNN için sıralı bellek, Transformer için attention) verildiğinde modelin kendisi gerisini keşfeder. Geri kalan her şey bunun varyasyonu.

6 Builder Eksen — İki Yön

Yön Konsept Bağlandığı yer
← Geriye Backprop, zincir kuralı Calculus Ders 4
← Geriye Gradient descent Calculus Ders 2 + 11 (Taylor 1. derece)
← Geriye Cross-entropy, KL Stat 110 entropi, koşullu olasılık
← Geriye Softmax Calculus \(e^x\) + Stat 110 multinomial
← Geriye Attention (\(Q \cdot K^\top\)) Stat 110 koşullu olasılık + 18.06 dot product
← Geriye Weight init (Xavier/He) Stat 110 normal dağılım, varyans
← Geriye Linear layer (Wx + b) 18.06 matris-vektör çarpımı
← Geriye PCA / spectral 18.06 özdeğer / SVD
→ İleriye Scaling laws (Chinchilla) Production
→ İleriye Distributed training (DDP, FSDP) Hardware
→ İleriye Quantization (INT8, FP8, QLoRA) Inference
→ İleriye MLOps (W&B, eval pipeline) Production

Her dersin “Builder Notu” callout’unda derse özgü 1-2 geriye + 1-2 ileriye köprü kurulur — zorlama değil, gerçek olanlar.