Okuma süresi: 14 dk

Son yıllarda günlük hayatımızda, haberlerde, reklamlarda, hemen hemen her yerde bir şekilde duyduğumuz bir kavram, yapay zeka (YZ, İng. AI, Artificial Intelligence). Sürekli, insan müdahalesi gerektirmeyen akıllı araçların hayatımıza gireceği, tıp doktorlarına ya da radyoloji uzmanlarına gerek kalmadan yapay zekanın hastalıkları teşhis edebileceği, savaşların artık robotlarla ya da dronlarla olacağı gibi haberleri okuyoruz. Bir parça gerçeklerden kopup popüler kültüre, sinema ve edebiyata bakarsak 50’lerden bu yana robotların dünyayı ele geçirdiğini görüyoruz. Kısacası, yapay zeka günümüzde akademik çalışmaların ötesinde, şirketlerin yatırım yaptıkları ve kârlarını artırmalarında kullandıkları bir araç, basın ve popüler kültürde ise oldukça sık işlenen bir konu ve bizlerin de gündelik hayatımızda kullandığımız cihazların bir parçası olarak karşımıza çıkıyor.

Londra merkezli risk sermayesi şirketi MMC’nin 2019 yılındaki bir raporuna [1] göre, 13 Avrupa Birliği ülkesinde faaliyet alanları ve fonlandıkları alanın yapay zeka olduğunu ifade eden en aktif 2.830 start-up şirketin çalışmaları incelendiğinde bunların 1.580’inin, yani sadece %60’ının şirket değerine etki edecek ölçüde yapay zeka kullandıkları tespit edilmiş. Bu sonuçları dikkate alacak olursak, okuduğumuz, izlediğimiz haberlerin önemli bir kısmında bize sunulan, yapay zeka değil. 

Hatta, yapay zekanın kendisi pek zeki sayılmaz da. Bugünün en gelişmiş algoritmaları dahi, biz insanlarda olan sağduyu ile akıl yürütme (common sense reasoning), bilinç (consciousness) ve nedensellik (causality) gibi mekanizmalara sahip değil ve çok farklı problemlerde iyi performans gösterecek yeterlilikte değil (generalisation). Yapay genel zekanın çok ötesindeyiz ve bugünün en gelişmiş algoritmaları bile bir bebeğin zekasına nazaran oldukça ilkel.

Smith ve Gasse [2], bebeklerin öğrenmesinden alınacak altı dersi şöyle özetliyor: 7-8 aylık bir bebek, (1) bir öğretmene ihtiyaç durmadan etrafını farklı sensörlerle gözlemler (multimodal), (2) başlangıçta çok zeki değildir, ama öğrendiklerinin üzerine bir şeyler ekleyerek zamanla öğrenir (incremental), (3) fiziksel bir dünyada yaşar, etrafındakilerle etkileşimde bulunur (physical), (4) amaç odaklı olmak yerine hareketleri, davranışları oyun oynama, keşfetme üzerine kuruludur. Yeni problemler ve yeni çözümler üretir (explore). (5) Sosyaldir, kendinden daha olgun, öğrenmesini destekleyen kişilerle iletişim kurabilir (social). (6) Bir dil, yani sembollerden oluşan ortak bir iletişim aracını öğrenebilir (language).

Bu ve sonraki yazıda yapay zekanın kısa tarihini ele alacağım. Devam eden yazılarımda ise, hem yapay zeka konusunda dikkate değer gördüğüm yeni çalışmalar hem de yapay zekanın bilimin diğer alanlarında yeniliklere yol açan uygulamalarından bahsedeceğim.

Turing testi: Makineler Düşünebilir mi?

Öncelikle bu soru ile başlamakta ve İngiliz matematikçi, bilgisayar bilimci Alan Turing’ten bahsetmekte fayda var. Turing, teorik bilgisayar bilimleri ve yapay zekanın kurucularından biri olarak kabul ediliyor. 1950 yılında, “Hesaplama Makineleri ve Zeka” başlıklı makalesinde “makineler düşünebilir mi?” diye soruyor. Zekayı tanımlamak göreceli olarak daha zor olduğundan, bunu anlamanin bir yolu olan, sonrasında Turing testi adıyla anılacak taklit oyunuyla açıklıyor.

Bir kadın, bir erkek ve sorular soran bir üçüncü kişi olduğunu düşünelim. Bu üçüncü kişi, diğer ikisine yazılı sorular sorarak, hangisinin erkek, hangisinin kadın olduğunu anlamaya çalışır. Saçının uzunluğunu söyler misin? Bir şiir yazar mısın? 34957 ile 70764’u toplayıp sonucunu yaz ya da satranç oynar mısın? Diyelim ki, erkek yanlış cevaplar vererek sorgulayıcıyı yanıltmaya çalışsın. Kadını kendi söylediğine inandırmak için en iyi seçeneği, doğru cevaplar vermek olacaktır. Burada, adamı çıkarıp yerine yapay zekaya sahip bir bilgisayar koyalım. İşte bu taklit oyununda, erkeğin yerine konan bilgisayar onun kadar başarılı olabilecek midir? Bu soru, bilgisayarın ne kadar zeki olduğunun bir ölçüsünü belirliyor. Diğer bir ifadeyle, Turing testi bilgisayarların bir işi ayırt edilemeyecek ölçüde insana benzer yapıp yapmadığını ölçüyor. Burada, Turing testinin eksikleri olduğunu belirtmekte fayda var. Ayrıca, yapay zeka araştırmacılarının tek ölçüsü Turing testini geçecek sistemler geliştirmek değil, nasıl ki, uçak mühendisleri bir uçağı, güvercinleri bir güvercin olduğuna ikna edecek ölçüde kuş gibi uçma kriteri ile test etmiyorlar 🙂 [3].

Turing, aynı zamanda beynimizdekinden daha basit, yapay sinir hücrelerinden oluşan bir ağ öneriyor. Turing’in önerisine göre, bu ağın “öğrenme” gibi bir amacı yerine getirebilmesi için, bu ağdaki sinir hücreleri birbirleriyle rastgele bağlantılar kurmalı, bu bağlantıları her adımda yeni bağlantılar ekleyerek ya da çıkararak iyileştirilmelidir. Bu şekilde milyonlarca simülasyon yapıldığında, her adımda ağdaki bağlantılar giderek daha işlevsel hale gelecek, makine öğrenmeyi başarmış olacaktır.

Her ne kadar bu makalesi bilgisayar bilimlerinin temel köşe taşlarından biri olsa da, Turing’in patronu Charles Galton Darwin (Charles Darwin’in torunu) tarafından bir öğrenci ödevi olarak görülmüş ve aşağılanmıştı [4]. Turing, buna rağmen bu makalesini yayınladı. Belki, yapay sinir ağlarını rastgele bağlantılar yerine bilgisayarlar yardımıyla  oluşturmak ve eğitmek mümkündü. O yıllarda, Thomas Kilburn liderliğinde Manchester Üniversitesi’nde bir grup araştırmacı bilgisayarlar geliştirmek için çalışıyordu ve Turing de bu ekibin bir parçasıydı. Kilburn o yıllarda başka hesaplamalar için ihtiyaç duyduğundan, Turing’in Manchester bilgisayarlarını kullanımını kısıtlayacak ve Turing yapay sinir ağları simülasyonlarını hiç yapamayacaktı. Ancak, yeterince büyük bir yapay sinir ağının evrensel hesaplama makinesi olarak davranacağını ispatladı.

İlk yapay sinir ağları simülasyonu, Turing’in öldüğü yıl, 1954’te MIT’de Belmont Farley ve Wesley Clark tarafından yapıldı. 128 nörondan (Şekil 1) oluşan küçük bir ağı basit örüntüleri tanıyacak şekilde eğitmeyi başardılar. Nöronların %10’u rastgele değiştirildiğinde bile ağ performansını kaybetmeden çalışmaya devam ediyordu. Bu, bilgisayar programlarını değil, ancak insan beyni için söz konusu olan başka bir olayı akla getirmektedir. Demiryolu işçisi Phineas Gage’ın 1848 yılında geçirdiği ilginç kazada demir bir sırık beyninin sol lobunu parçalamıştır. Böylesi ölümcül bir olaydan sağ kurtulan Gage sağlığına kavuşmuş, ancak bu olay kişilik ve davranışlarında değişikliğe neden olmuştur.

 

İleri Beslemeli Yapay Sinir Ağı [5]

Yapay nöronlar ve sinir ağları, biyolojik olanların basit bir benzetimi olarak geliştirilmiş olsa da, öğrenme yöntemi bakımından onlardan farklıdır. Şekilde, iki katmanlı ileri beslemeli yapay sinir ağı görülmektedir. Kırmızı ile görülen düğümler gizli katman olarak adlandırılır. Sarı renkteki düğümler ise bir bağlanım (regression) ya da sınıflandırma (classification) problemini çözmek üzere hata fonksiyonunun minimize edileceği çıktılardır. Diğer bir ifadeyle, sinir ağı veri üzerinde eğitilerek istenen etiketlere oldukça yakın değerleri çıktı olarak verecek, yani hatayı minimize edecek şekilde ağırlıkları öğrenir (Ağırlıklar bir ilk değerden başlayarak, öğrenme boyunca değerleri güncellenen değişkenlerdir). Çizgilerle gösterilen bağlantılar çeşitli matematiksel yöntemlerle öğrenilecek olan ağırlıklardır. Her düğüm kendinden önceki katmanda bağlı olduğu düğümlerin ağırlıklı doğrusal birleşimidir. Aynı zamanda, bu birleşimlerin ardından aktivasyon fonksiyonları (sigmoid, tanh, ReLU) uygulanır.

“Yapay Zeka” kavramının kökeni

Bir yıl sonra, 1955’te Dartmouth Koleji’nde genç bir bilgisayar bilimleri profesörü olan John McCarthy, Marvin Minsky, Nathaniel Rochester ve Claude Shannon ile birlikte bir proje önerisi yazdı ve “yapay zeka” terimi ilk kez burada kullanıldı. 2 aylık bir sürede, 10 kişilik bir ekiple, insanın öğrenme sürecinin ya da zekanın tüm boyutlarının makinelerin simüle edebileceği şekilde tanımlanması, hatta makinelerin dil kullanımı, soyutlama ve kavramları oluşturması, insanların çözebildiği problemleri çözmeleri ve kendilerini geliştirmeleri gibi alanlardan bir ya da birkaçını 1956 yılının yazında düzenledikleri çalıştayda çözeceklerini öngörüyorlardı.

1956 Dartmouth çalıştayı katılımcılarından bazıları. Claude Shannon (ön sıra sağda), John McCarthy (arka sıra sağda), Marvin Minsky (arka sıra ortada), Ray Solomonoff (ön sıra en sol) ve Nathaniel Rochester (arka sıra sol). Fotoğraf: Margaret Minsky.

Bu çalıştay, yapay zekayı çözemediğinden hedeflerine ulaşamadı, hatta sağduyuya dayalı akıl yürüten makineler bugün bile geliştirilemedi. Ancak, orada yapay zeka bir araştırma alanı olarak tanımlandı ve katılımcılar devam eden yıllarda buradan aldıkları motivasyonla yapay zeka araştırmalarına devam ettiler. Mesela, çalıştayın katılımcılarından ve 1975 Turing ödülünün sahibi Allen Newell, birkaç yıl sonra 1958’de 10 yıl içinde bilgisayarların satranç dünya şampiyonunu yeneceğini söylemişti. Ancak, bu yaklaşık 40 yıl sonra, IBM’in süper bilgisayarı Deep Blue, zamanın satranç dünya şampiyonu Garry Kasparov’u 1997 yılında yendiğinde gerçekleşti.

1997 yılında zamanın satranç dünya şampiyonu Garry Kasparov’un IBM’in süper bilgisayarı Deep Blue’ya karşı oynadığı oyundan bir kare.
Fotoğraf: https://de.chessbase.com/post/20-jahre-kasparov-gegen-deep-blue

Yapay Zeka’nın yazları ve kışları

Amerikalı bir şirket olan Gartner’in hype döngüsü denen bir grafik gösterimi var. Yeni bir teknolojinin doğuşundan itibaren, beklentilerin bir artış gösterdiğini, bir maksimum noktadan sonra bir hayal kırıklığı kanalına girdiğini gösteriyor. Ardından, bunu bir aydınlanma eğimi ve verimlilik platosu izliyor.

Gartner Hype Döngüsü

Gartner hype döngüsündeki gibi yapay zekanın tarihinde de, araştırmacıların arttığı, devlet destekli projelerin çok olduğu yaz dönemleri ve bu olumlu manzaranın kışa döndüğü dönemler var. Kısaca bu dönemleri ele alalım.

Yapay zekada temelde iki yaklaşım var. Aslında bu iki yaklaşımın biraz da, bilgisayar bilimciler ve psikologlar (öğrenme bilimi araştırmacıları) arasında 1950’lerden beri süregelen bir çekişme olduğunu söylemek mümkün. İlki, büyük veri yokken, klasik yapay zeka diyebileceğimiz, bilgi temelli öğrenme (knowledge-based, GOFAI- Good Old Fashioned AI) yöntemleri kullanıldı. Sembolik yapay zeka da diyebileceğimiz bu yaklaşım üç temel bileşenden oluşur: girdileri ifade eden, insan tarafından anlaşılabilecek semboller, bu sembollerin aldığı değerlere bağlı; VE, VEYA, İSE bağlaçları gibi ayrık mantık kuralları ve arama yöntemleri. Semboller kümesi üzerinde, istenen örüntülere ulaşmamızı sağlayacak kuralları öğrenmek için arama yöntemleri kullanılır. Örneğin, şu an piyasada bulunan birçok satranç programı, 1950’de “bilgi teorisi”nin kurucusu kabul edilen Claude Shannon’un yayınladığı fikirlere dayalı, ileri arama ağacı ve minimax temelli budama yöntemleri ile çalışır. Öte yandan, sembolik yapay zeka, hâlâ GPS temelli navigasyon ve robotlar için rota planlaması gibi alanlarda oldukça başarılı sonuçlar vermektedir. Ancak, makine öğrenmesi denilen alan birçok problemde bilgi temelli yöntemlerin yerini almış durumda. Makine öğrenmesi yöntemlerini kapsayan bu yaklaşım, bağlantıcı (connectionist) yapay zeka olarak da adlandırılır. Bu alan, beyindeki sinir ağlarından esinlenerek, girdiler ile çıktılar arasında belli sayıda öğrenilebilir parametreleri olan modeller kullanmaktadır.

1950’lere dönecek olursak, Turing’in de 1950 tarihli makalesinde bahsettiği ve 1954’te ilk defa MIT’den Belmont Farley ve Wesley Clark tarafından eğitilen sinir ağlarının en popüler örneği, Frank Rosenblatt’ın Perceptron algoritmasıdır. Hatta, bu algoritma o kadar heyecanla karşılanmıştı ki, 1958’de New York Times haberi “Elektronik Beyin, kendi kendine öğretebiliyor” başlığıyla aktarmıştır . Aslında haberde devrim niteliğinde olan, Rosenblatt’ın ilk deneylerinin ardından, 2 milyon dolar değerindeki IBM 704 bilgisayarının, rastgele verilen girdilerin sağında, solunda ve ortasında çizilen kareleri tanıyabilmesidir! Bu yıllarda Perceptron ile başlayan ilerlemelere en büyük engel, donanım ve hesaplama kapasitelerinin kısıtlı olmasıdır.

İşte bu 50’lerde başlayan yaz dönemi, 60’larda da devam etmiş, ancak 1967’den itibaren sert bir düşüş yaşamıştır. Amerika’da, yapay zekanın basit makine çevirisi uygulamalarında, otonom tank projesinin başarısızlığa uğraması, senatör Mike Mansfield’in 1969’da askeri araştırmalara yönelik doğrudan ve dolaylı harcamaların kesilmesi yönündeki raporu ve DARPA’nın yapay zeka projelerinde kesintiye gitmesi, kış dönemini getirmiş, bu konularda araştırmaların ani bir şekilde azalmasına sebep olmuştur. Birleşik Krallık’ta da, 1973 yılında yapay zeka hakkında Lighthill raporu, devlet destekli tüm yapay zeka projelerinin sonlanmasına sebep olmuştur.

60’ların sonunda başlayan ve yaklaşık on yıl süren yapay zekanın ilk kışı, 70’lerin sonundan itibaren yaza dönmüş ve özellikle uzman sistemler ve bilgi temelli öğrenme popüler olmuştur. Uzman sistemler, belli bir alanda mantık kuralları uygulayarak uzman bilgisine ulaşan sistemlerdir. Her uzman sistem öğrenme içermese de, genel olarak bilgi temsili ve mühendisliğini kullanarak alanlarında insan kararlarını taklit etmeyi amaçlarlar. Edward Feigenbaum’un uzman sistemlerin temelini atan çalışmaları (Dendral projesi) ve Stanford Üniversitesi’nde yaklaşık altı yıllık çalışmanın ürünü olan MYCIN en önemli örneklerindendir. MYCIN, kan pıhtılaşmasının teşhisinde kullanılan bir uzman sistem. Doktora çok sayıda evet/hayır soruları sorarak, sonunda aldığı cevaplara göre teşhis edilmek istenen hastalığa sebep olabilecek bakterileri ve tedavileri için gerekli ilaçları belirsizlik tahminleriyle birlikte önerir. MYCIN, performansındaki düşüklük, o zamanlarda klinik teknolojilerde bir standardın olmaması ve etik/hukuki kaygılar sebebiyle klinik olarak kullanılamamıştır. Ancak MYCIN’in geliştirilmesi, bilgi mühendisliği, “karar ağaçları” gibi yöntemler ve karar teorisi destekli uzman sistemlerin gelişmesine önayak olmuştur.

80’lerin sonundan itibaren de, yapay zekanın ikinci kışı denilebilecek bir dönem başladı. Yapay zekadan beklentiler çok yüksekti, ancak bilgi mühendisliği temelli sistemler çok karmaşık kurallar gerektiriyor ve sadece belirli bir alanda iyi performans gösterebiliyorlardı. Bu durum, yine devlet desteğinin azalması, bu alanlarda çalışan araştırmacıların azalması ve basının bu konularda içeriklere daha az yer vermesi sonucunu doğuracaktı.

 

Yazar: Ömer Sümer

Editörler: Güney Akbalık, Bilge San, Tuba Bucak

KAYNAKÇA

[1] D. Kelnar, and A. Kostadinov, “The State of AI 2019: Divergence,” MMC Ventures and Barclays, London, Rep., 2019. [Online]. Available: https://www.stateofai2019.com/ 

[2] L. Smith and M. Gasser, “The Development of Embodied Cognition: Six Lessons from Babies,” Artificial Life 2005 11:1-2, 13-29, https://www.mitpressjournals.org/doi/abs/10.1162/1064546053278973

[3] S. Russel and P. Norvig, “Artificial Intelligence: A Modern Approach,” Prentice Hall Press, 2009.

[4] B. J. Copeland, “Turing: Pioneer of the Information Age,” Oxford University Press, 2012.

[5] F. H. Friedman, R. Tibshirani, and T. Hastie, “The Elements of Statistical Learning: Data Mining, Inference, and Prediction,” Springer, 2009, Ch. 11.

Bu yazıdan bahsedilen birçok konuyu detaylı olarak ele alan ve benim de yararlandığım şu konuşmayı tavsiye ederim:

[6]  H. Kautz, “Robert S. Engelmore Memorial Award Lecture: The Third AI Summer,” The Thirty-Fourth AAAI Conference on Artificial Intelligence, February 2020, New York [Online]. Available: https://vimeo.com/389560858. [Accessed: 2 April 2020].