Yapay Görmenin Evrimi

Yapay Görmenin Evrimi

Yapay Görmenin Evrimi

Derin öğrenmenin ortaya çıkmasından önce, yapay görmenin gerçekleştirebileceği görevler çok sınırlıydı ve geliştiriciler ve insan operatörler tarafından çok fazla manuel kodlama ve çaba gerektiriyordu. Örneğin, yüz tanıma işlemi gerçekleştirmek istiyorsanız, aşağıdaki adımları uygulamanız gerekirdi.

Bir veritabanı oluşturun: İzlemek istediğiniz tüm öznelerin görüntülerini belirli bir formatta tek tek yakalamanız gerekirdi.

Görüntülere açıklama ekleyin: Ardından her bir görüntü için, gözler arasındaki mesafe, burun köprüsünün genişliği, üst dudak ile burun arasındaki mesafe ve her bir kişinin benzersiz özelliklerini tanımlayan düzinelerce başka ölçüm gibi birkaç önemli veri noktası girmeniz gerekirdi.

Yeni görüntüler yakalayın: Ardından, ister fotoğraflardan ister video içeriklerinden olsun, yeni görüntüler yakalamanız gerekir. Ardından, görüntüdeki kilit noktaları işaretleyerek ölçüm sürecinden tekrar geçmeniz gerekiyordu. Ayrıca görüntünün çekildiği açıyı da hesaba katmanız gerekiyordu.

Tüm bu manuel çalışmalardan sonra, uygulama nihayet yeni görüntüdeki ölçümleri veritabanında depolananlarla karşılaştırabilir ve size izlediği profillerden herhangi birine karşılık gelip gelmediğini söyleyebilirdi. Aslında çok az otomasyon vardı ve işin çoğu manuel olarak yapılıyordu. Ve hata payı hala büyüktü.

Makine öğrenimi, yapay görme sorunlarını çözmek için farklı bir yaklaşım sağladı. Makine öğrenimi sayesinde geliştiricilerin artık her bir kuralı görme uygulamalarına manuel olarak kodlamaları gerekmiyordu. Bunun yerine, görüntülerdeki belirli desenleri tespit edebilen daha küçük uygulamalar olan "özellikler" programladılar. Daha sonra örüntüleri tespit etmek, görüntüleri sınıflandırmak ve içlerindeki nesneleri tespit etmek için doğrusal regresyon, lojistik regresyon, karar ağaçları veya destek vektör makineleri (SVM) gibi istatistiksel bir öğrenme algoritması kullandılar.

Makine öğrenimi, klasik yazılım geliştirme araçları ve yaklaşımları için tarihsel olarak zorlu olan birçok sorunun çözülmesine yardımcı oldu. Örneğin, yıllar önce makine öğrenimi mühendisleri meme kanseri sağkalım pencerelerini insan uzmanlardan daha iyi tahmin edebilen bir yazılım yaratmayı başardılar. Ancak yazılımın özelliklerini oluşturmak düzinelerce mühendisin ve meme kanseri uzmanının çabasını gerektirdi ve geliştirilmesi çok zaman aldı.

Derin öğrenme, makine öğrenimi için temelde farklı bir yaklaşım sağladı. Derin öğrenme, örnekler aracılığıyla temsil edilebilen herhangi bir sorunu çözebilen genel amaçlı bir işlev olan sinir ağlarına dayanır. Bir sinir ağına belirli bir veri türünün çok sayıda etiketli örneğini verdiğinizde, bu örnekler arasındaki ortak kalıpları çıkarabilir ve bunları gelecekteki bilgi parçalarını sınıflandırmaya yardımcı olacak matematiksel bir denkleme dönüştürebilir.

Örneğin, derin öğrenme ile bir yüz tanıma uygulaması oluşturmak için yalnızca önceden oluşturulmuş bir algoritma geliştirmeniz veya seçmeniz ve bunu tespit etmesi gereken kişilerin yüz örnekleriyle eğitmeniz gerekir. Yeterli sayıda örnek verildiğinde (çok sayıda örnek), sinir ağı özellikler veya ölçümler hakkında başka talimatlar olmadan yüzleri tespit edebilecektir.

Derin öğrenme, yapay görme için çok etkili bir yöntemdir. Çoğu durumda, iyi bir derin öğrenme algoritması oluşturmak, büyük miktarda etiketli eğitim verisi toplamak ve sinir ağlarının katmanlarının türü ve sayısı ve eğitim dönemleri gibi parametreleri ayarlamaktan ibarettir. Önceki makine öğrenimi türleriyle karşılaştırıldığında, derin öğrenmenin geliştirilmesi ve uygulanması hem daha kolay hem de daha hızlıdır.

Kanser tespiti, sürücüsüz arabalar ve yüz tanıma gibi mevcut yapay görme uygulamalarının çoğu derin öğrenmeden faydalanmaktadır. Derin öğrenme ve derin sinir ağları, donanım ve bulut bilişim kaynaklarındaki kullanılabilirlik ve ilerlemeler sayesinde kavramsal alandan pratik uygulamalara taşınmıştır.

Bir Görüntüyü Deşifre Etmek Ne Kadar Sürer?

Kısacası pek bir şey değil. Yapay görmenin neden bu kadar heyecan verici olduğunun anahtarı da bu: Geçmişte süper bilgisayarların bile gerekli tüm hesaplamaları yapması günler, haftalar hatta aylar sürebilirken, günümüzün ultra hızlı çipleri ve ilgili donanımları, hızlı, güvenilir internet ve bulut ağları ile birlikte süreci yıldırım hızına çıkarıyor. Bir diğer önemli faktör de yapay zeka araştırmaları yapan birçok büyük şirketin, özellikle de Facebook, Google, IBM ve Microsoft'un makine öğrenimi çalışmalarının bir kısmını açık kaynaklı hale getirerek çalışmalarını paylaşmaya istekli olmalarıdır.

Bu da başkalarının sıfırdan başlamak yerine kendi çalışmalarını geliştirmelerine olanak tanıyor. Sonuç olarak, yapay zeka endüstrisi giderek gelişiyor ve kısa bir süre önce haftalar süren deneyler bugün 15 dakika sürebiliyor. Yapay görmenin birçok gerçek dünya uygulaması için bu süreç mikrosaniyeler içinde sürekli olarak gerçekleşiyor, böylece bugün bir bilgisayar bilim insanlarının "durumsal farkındalık" dediği şeyi yapabiliyor.