Yapay Sinir Ağları ve Derin Öğrenme

Şubat 20, 2025

Yapay sinir ağları temelleri 1950’lerde atılan insan beyninin çalışma şeklini temel alarak insan sinir hücrelerinin modellenmesi ve birtakım algoritmalar yardımı ile giriş elemanlarının belli mantık fonksiyonlarına tabii tutularak çıkışlar ürettiği, karmaşık problemlerin çözümünde kullanılan karar mekanizmalarıdır. Başka bir deyişle, yapay sinir ağları, kontrol elemanı olarak kendisine girilmiş verileri analiz etmekte, bu veriler ile genellemeler yapmakta ve daha sonra hiç görmediği yeni verilerle karşılaştığında bu veriler ile ilgili kararlar vermektedir.

Perceptron

Yapay sinir ağının en küçük parçası Perceptron, insan nöron hücresinin modellenmiş hali olarak 1957 yılında lineer bir fonksiyon olarak tanımlanmıştır. Modelde, yapay nöron çıkışları aksonda taşınan işareti, ağırlıklar sinapsları, transfer fonksiyonu hücre gövdesini, toplama fonksiyonu dendriti ve işlemci elemanı nöronu ifade etmektedir. Ağırlıklar bir hücreye gelen bilginin önemini göstermektedir fakat bu durum değerinden bağımsızdır, yani sıfır ağırlıklı bir bilgi çok önemli de olabilir. Toplama fonksiyonu ağırlıklar yardımı ile hücreye giren net bilgiyi hesaplar, bu hesap için çeşitli matematik fonksiyonları kullanılmaktadır. Aktivasyon fonksiyonu ise hücreye gelen net bilgiyi işleyerek üreteceği çıktıyı belirler. Modelin çok katmanlı olması ya da her katmanda bulunan nöron sayısı öğrenmenin kalitesini doğrudan etkilemez, aynı katmandaki nöronların değil de bir üst ya da alt katmandaki nöronla iletişim önemli olandır, bu iletişimdeki ağırlık öğrenmenin iyi ya da kötü olduğunu dolaylı olarak etkilemiş olur.

Derin Öğrenme

Derin öğrenmenin klasik yapay sinir ağlarından bir farkının olduğu söylenemez, derin öğrenmede klasik yapay sinir ağlarından farklı olarak daha çok veri, katman ve daha çok işlemci gücü kullanılmaya başlanmıştır. Daha çok işlemci gücü karar için, daha çok doğrusal olmayan aktivasyon fonksiyonları, ikileme ve düzenlileştirme yöntemlerinin kullanımı elverişliliğini sağlamıştır. Bugün derin öğrenme modeli olarak 3 ana model kullanılmaktadır. Bunlar; çok katmanlı perceptron, evrişimsel sinir ağı ve yinelemeli sinir ağıdır.

Tek Katmanlı Perceptron

Tek katmanlı perceptronun birçok mantıksal ifadeyi öğrendiği gösterilebilmiştir fakat XOR işlemini gerçekleştiremediği için bırakılmıştır. Daha sonrasında geri beslemeli sinir ağları kullanılmaya başlanmıştır fakat gelişmeler 2000’lere kadar çok başarı gösteremediği için zaman zaman denenerek tekrar bırakılmıştır taki 2009 yılında bir grup araştırmacının ses tanıma sistemlerinde yapay sinir ağlarını kullanmasına kadar. Bu gelişme sonrasında, teknolojinin de gelişmesi ile birlikte derin öğrenme birçok alanda kullanılmaya başlanmıştır. Bunların başlıcaları nesne tanıma, ses algılama, otomatik tercüme, görüntü altyazılama, sürücüsüz araç, derin üretici gibi modellerin kullanıldığı tıp, haberleşme, trafik, tahmin işlemi yapan alanlardır.

Sayısal Görüntü İşleme, Bilgisayarlı Görü

Sayısal görüntü işlemeden bahsetmek için önce görüntünün tanımını yapmak gerekmektedir. Görüntü üç boyutlu nesnelerin iki boyutlu bir şekilde haritalandırılmasıyla oluşturulmaktadır. Bu haritalandırmada her noktanın konum ve renk bilgisi, analog ya da dijital bir şekilde tutulmaktadır. Sayısal görüntü işleme bu görüntülerden dijital olanı üzerinde çalışmaktadır çünkü dijital görüntü analog (sürekli) görüntünün ayrık örnekler cinsinden ifade edilerek sayısallaştırılmış halidir. Sayısallaştırılmış görüntü üzerinde oldukça karmaşık algoritmalar uygulanarak görüntü işlenmiş ve birçok uygulama alanında kullanılabilir hale getirilmiş olur.

Görüntü İşleme Aşamaları

Görüntüyü işleyebilmek için görüntünün üzerindeki gürültüyü azaltmak üzere bir hazırlık evresi gerçekleştirilir, bu evrede amaç bulanıklık ya da kötü görüntüyü netleştirmektir. Bunun için görüntüye düşük, orta ve yüksek seviyeli örnekleme ve niceleme işlemleri uygulanır. Düşük seviyeli işlemler elde etme ve ön işlemedir. Bu aşamada elde edilen görüntü iyileştirme, onarma, sıkılaştırma gibi ön işlemlerden geçirilerek işlenmek üzere daha başarılı bir görüntü haline getirilir. Daha sonra orta seviye olan bölümleme ve çıkarım işlemlerine geçilir. Bölümleme kısmı görüntü işlemenin en karışık kısmıdır. Bu kısımda görüntünün öne çıkarılmak istenen özellikleri üzerinde çalışılır, nesne ve arka plan ya da birbirinden farklı özelliklere sahip alanların ayrıştırılma işlemi yapılır. Çıkarım işleminde ise artık arka plandan ayrılmış nesnenin amaçlanan özelliklerinin öne çıkarılması aşamasıdır. Bu işlemden sonra yüksek seviyeli yorumlama aşamasına geçilir. Yorumlama aşamasında, çeşitli karar verme algoritmaları kullanılarak öne çıkarılmış nesnelerin ya da bölgelerin etiketlendirilmesi ve sınıflandırılması yapılarak görüntü işlenmiş olur. Bilgisayarlı görüde sayısal görüntü işlemeye ek olarak, özellik çıkarma, yorumlama ve anlama aşamaları bulunmaktadır.

Bilgisayarlı Görü

Bilgisayarlı görü, insan gözünün temel olarak yapabileceği işlemlerin bilgisayarlı sistemlere yaptırılarak, insan beyninin nesneleri sınıflandırdığı gibi bilgisayara nesnelerin sınıflandırılmasını sağlatma çalışmalarının tümüdür. Yani bir ya da daha fazla dijital görüntü işlenerek bilgisayarın üç boyutlu dünya algısını oluşturmasını sağlamaya çalışmaktır. Bu çalışmalar, henüz insan beyni kadar hızlı bir şekilde görüntüleri yorumlayacak seviyeye ulaşamasa da (ışık, mesafe, konum ayrımı) son 10 yılda oldukça iyi mesafe kaydetmiştir. Bu mesafe yine yapay sinir ağları ve derin öğrenme sayesinde kat edilmeye başlanmıştır.