Human vs Machine Learning – Relaxed Alertness
İnsan beyninde öğrenme (rest and digest) ve tepki (fight-or-flight) gibi iki farklı mod vardır.Makine öğrenmesi modellerinde de benzer şekilde “training” (öğrenme) ve “prediction” (tahmin) modları bulunur.Her iki sistem de farklı psikolojik/hesaplamalı koşullarda bilgi işler ve karar verir.
| HUMAN | MACHINE |
|---|---|
| Rest and Diggest | Training |
| Fight-or-flight | Prediction |
Beginning of Artificial Intelligence
İlk sinir ağları, insan beynindeki biyolojik nöronlardan ilham alınarak 1950'lerde geliştirildi.Ancak aynı dönemde Von Neumann mimarisi (CPU temelli sistemler) çok daha verimli ve güvenilir olduğundan, sinir ağları geri planda kaldı.1990'larda Deep Blue satrançta şampiyonu yense de, bu kaba kuvvet hesaplamayla başarıldı.Brute-force’un yetersiz kaldığı tavla gibi oyunlarda ise sinir ağları test edildi.Oldukça başarılı sonuçlar alınmasına rağmen, sinir ağları uzun süre “ciddi değil” diye küçümsendi.
Early Neural Networks
Bilgisayarlar, insan görevlerini otomatikleştirmek amacıyla geliştirildi.Başlarda, insan zekâsını tamamen taklit eden "genelleştirilmiş yapay zekâ"nın (AGI) yakın zamanda mümkün olacağına inanılıyordu.Ancak zamanla anlaşıldı ki, insan benzeri genel zekâ, o dönem bilgisayarların kapasitesinin çok ötesindeydi.Bu nedenle yapay zekâ araştırmaları, tekil görevlere odaklanan "narrow AI" sistemlerine yöneldi.
Expert Systems
Uzman sistemler, belirli konularda karar verebilen kurallara dayalı yapay zekâ sistemleridir.Her durum için manuel olarak programlanan binlerce kural içerirler.Yüzlerce mühendisin birlikte çalışmasıyla oluşturulan bu sistemler, esnek değildir: öğrenemez, sadece önceden tanımlanmış senaryolarda çalışır.
IBM'in Deep Blue sistemi, bu yaklaşımın bir örneğidir.
Modern öğrenen yapay zekâlar yaygınlaşmadan önce, bu sistemler karar otomasyonu için baskın yöntemdi.Ancak bu sistemler limitlere sahipti.
Limitations of Expert Systems
Uzman sistemler, sadece insanlar tarafından yazılabilen açık kurallarla çalışır.Ancak görsel tanıma gibi birçok görev, insanlar için kolay olsa da bilgisayar için soyuttur.
Örneğin: Bir resimde dalga mı var? Kedi mi var? Taksi mi var?
Bunu insan hemen fark eder, ama uzman sisteme bu tanımları kodlamak neredeyse imkânsızdır.Bu nedenle uzman sistemler, sezgi ve bağlam gerektiren problemleri çözmekte çok sınırlıdır.
How Do Children Learn? – Derin Öğrenmeye Giden Yol
Çocuklar bir kavramı öğrenmeden önce, o kavrama dair birçok örnekle karşılaşır.
Her seferinde doğru cevabı duyarak deneme-yanılma yoluyla hatalarını düzeltir.
Zamanla, önemli örüntüleri kendiliğinden fark eder.
Derin öğrenme de benzer çalışır:
- Verilerle karşılaşır
- Etiketlerle (doğru cevap) yönlendirilir
- Hatalarına göre ağırlıklarını ayarlayarak öğrenir
Bu benzerlik, neden derin öğrenmenin etkili olduğunu gösterir.
Data – Derin Öğrenmenin Temel Yakıtı
Sinir ağları öğrenebilmek için büyük miktarda veriye ihtiyaç duyar.Örneğin bir kediyi tanıyabilmesi için; hem farklı kedilere ait binlerce görüntü, hem de kedi içermeyen resimler görmelidir.
Geçmişte bu miktarda veriye ulaşmak zordu.Ancak dijital çağ ve internet sayesinde artık milyarlarca örnek veriye erişmek mümkün.Bu veri bolluğu, derin öğrenmeyi güçlü kılan temel faktörlerden biridir.
Computing Power – Derin Öğrenmeyi Mümkün Kılan Güç
Sinir ağlarının öğrenebilmesi için sadece çok veri değil, aynı zamanda yüksek hesaplama gücü gerekir.Bu sistemler temel olarak milyonlarca matris çarpımı yapar ve bu da çok yoğun işlem gücü gerektirir.
İnsan beyni hâlâ daha fazla veri işleyebilir, ancak AI sistemleri bunu telafi etmek için yüksek hesaplama gücünden yararlanır.Grafik işlemciler (GPU’lar), tıpkı oyunlardaki gibi matris işlemleri yaptığı için, bu amaç için çok uygundur.Günümüzde derin öğrenmenin başarısında, modern GPU mimarisi kritik bir rol oynamaktadır.
The Importance of the GPU – Paralel Hesaplama Gücünün Önemi
Sinir ağları ve bilgisayar grafikleri, aynı temel matematiği kullanır: yoğun matris işlemleri.Bu nedenle grafikler için tasarlanmış donanımlar (GPU'lar), sinir ağı eğitiminde de son derece etkilidir.CPU'lar sınırlı sayıda çekirdeğe sahiptir ve işlemleri sırayla yapar.GPU'lar ise binlerce çekirdekle aynı anda milyonlarca işlemi yürütebilir.Bu paralellik sayesinde, büyük veri kümeleriyle sinir ağı eğitimi mümkün hâle gelir.Derin öğrenme devriminin önünü açan en önemli faktörlerden biri GPU mimarisidir.
Deep Learning Flips Traditional Programming
Geleneksel programlamada önce sınıflandırma kuralları tanımlanır, sonra bu kurallar kodlanır.Bilgisayar da bu kuralları kullanarak veri üzerinde işlem yapar.
Derin öğrenme ise bu yapıyı tersine çevirir:
- Sisteme yalnızca veri ve doğrular (etiketler) verilir.
- Model, hangi özelliklerin sonucu etkilediğini **kendi öğrenir**.
Bu sayede açıkça tanımlanması zor olan karmaşık örüntüler (görüntü, ses, dil) makine tarafından öğrenilebilir hâle gelir.
Deep Learning – Öğrenme Süreci
1. Sisteme bir veri kümesi verilir: Girdi (örnek) + Doğru çıktı (etiket) → Bu eşleşmelere “dataset” denir.
2. Model tahminler yapar, biz doğru mu yanlış mı olduğunu söyleriz.
3. Geri bildirimlerle model kendini düzeltir ve her tekrar döngüsünde daha iyi sınıflandırma yapar.
Kritik fark: Kuralları insan tanımlamaz. Model, veri üzerindeki örüntüleri analiz ederek **kuralları kendi öğrenir.**
Klasik Programlama mı, Deep Learning mi?
| Klasik Öğrenme | Derin Öğrenme |
|---|---|
| Kurallar nettir, açıkça tarif edilebilir. | Kurallar belirsiz, karmaşık veya sezgiseldir. |
| Genellikle if/else gibi yapılarla çözülebilir. | İnsanlar bile açıklamakta zorlanır. |
| Daha az kaynak tüketir, hızlıdır. | Model, veriden kendi kurallarını öğrenir. |
| Büyük veri + yüksek işlem gücü ister. | |
| Derin sinir ağları milyarlarca parametre içerir. |
Doğru yaklaşım problemi anlamaktan geçer.Eğer kurallar tanımlanabiliyorsa → klasik kodlama.Eğer kurallar bilinmiyorsa → deep learning tercih edilir.
Deep Learning vs. Diğer AI Yöntemleri
Deep Learning’in Ayırt Edici Özellikleri:
- Çok sayıda gizli katman (hidden layers)
- Ağların derinliği ve karmaşıklığı
- Milyarlarca parametre (örnek: GPT-3 → 175B)
- Karmaşık ilişkileri öğrenebilme yeteneği
----------------------------
“Deep” Ne Anlama Geliyor?
----------------------------
- Derin öğrenme, çok katmanlı mimari anlamına gelir.
- Her katman, girdiyi daha soyut seviyede işler.
- Sistem kuralları dışarıdan programlanmaz, kendi öğrenir.
-------------------------------
Neden Son 10 Yılda Parladı?
-------------------------------
- Büyük veri, güçlü GPU'lar ve yeni mimariler (Transformer gibi) sayesinde.
- Görsel tanıma, konuşma analizi, doğal dil işleme gibi alanlarda devrim yarattı.
Ne Zaman Derin Öğrenme Kullanılır?
Klasik Programlama:
- Kurallar açık ve nettir.
- Programlaması kolaydır.
- Daha verimli ve doğrudan çözümler sunar.
Derin Öğrenme:
- Kurallar karmaşık, sezgisel ya da tanımlanması zordur.
- İnsanların tarif etmekte zorlandığı görevlerde kullanılır.
- Görüntü tanıma, konuşma, duygu analizi gibi alanlarda tercih edilir.
Bu bir paradigma değişimidir. Her problemi çözmek için derin öğrenme kullanmak doğru değildir. Eğer bir görevin kuralları net olarak yazılabiliyorsa, klasik programlama genellikle daha mantıklıdır. Ancak sezgisel ya da çok boyutlu bir yapı varsa, DL çok daha başarılı olur.
Derin Öğrenme'nin Diğer AI Yaklaşımlarından Farkı
- Ağ derinliği ve karmaşıklığı çok daha yüksektir.
- Milyarlarca parametreye sahip modeller kullanılabilir.
- Çok sayıda gizli katman (hidden layer) içerir.
- Karmaşık kuralları öğrenmede olağanüstü başarılıdır.
Derin öğrenmedeki "derin" ifadesi, modelin çok sayıda katman içermesinden gelir. Özellikle dil anlama, görüntü işleme gibi zor görevlerde bu katmanlar karmaşık yapıları çözmeye yardımcı olur. Örneğin GPT-4 gibi modeller yüz milyarlarca parametreye sahiptir.
Bilgisayarla Görü (Computer Vision)
Uygulama Alanları:
- Robotik ve üretim otomasyonu
- Nesne tanıma
- Otonom araçlar
Bilgisayarla görme, makinelerin insan gibi görmesini sağlamayı amaçlar. Derin öğrenmenin gelişmesiyle birlikte bu alan hızla ilerlemiştir çünkü artık daha fazla etiketlenmiş görüntü mevcuttur.
Doğal Dil İşleme (NLP)
Uygulama Alanları:
- Gerçek zamanlı çeviri
- Ses tanıma
- Sanal asistanlar
NLP sayesinde insanlar ve makineler arasındaki iletişim daha doğal hâle gelmiştir. Derin öğrenme bu alanda çok ciddi sıçramalar yaratmış, özellikle gerçek zamanlı uygulamalarda insan benzeri performans ortaya çıkmıştır.
Öneri Sistemleri (Recommender Systems)
Uygulama Alanları:
- İçerik önerisi (Spotify, Netflix)
- Hedefli reklamcılık
- Online alışveriş önerileri
Açıklama:
Öneri sistemleri, kullanıcı davranışlarını öğrenerek kişiye özel içerik sunar. Derin öğrenme bu sistemlerin daha isabetli ve kişiselleştirilmiş öneriler sunmasını sağlar.
Pekiştirmeli Öğrenme (Reinforcement Learning)
Öne Çıkan Başarılar:
- AlphaGo'nun dünya şampiyonunu yenmesi
- StarCraft ve Dota gibi karmaşık oyunlarda uzman oyuncuların geçilmesi
Pekiştirmeli öğrenme, bir ajan’ın ödül-maliyet dengesine göre öğrenmesini sağlar. Derin pekiştirmeli öğrenme (Deep RL) sayesinde makineler artık karmaşık stratejileri bile öğrenebilmektedir.
Derin öğrenme, çok katmanlı yapısı sayesinde çok sayıda parametreyi işleyebilir ve bu sayede karmaşık görevleri başarıyla yerine getirebilir.
SON
Bu yazımızda Derin Öğrenme'nin ne olduğu ve mantığının nasıl işlediği üzerine konuştuk. Bir sonraki yazımızda Jupyter Notebook örnekleri ve kod bloklarıyla MNIST veri setini kullanarak uygulama gerçekleştireceğiz.MNIST veri seti, Derin Öğrenme'nin "Hello World"'ü gibidir...
Sağlıcakla...
