Çeviren: Şule Selçuk
Düzenleyen: Ümit Sözbilir
İstediğiniz kişiyi veya görüntüyü zihninizde düşünerek sayısal fotoğraflarınız arasında arama yaptığınızı hayal edin veya bir kalem bile oynatmadan yeni bir mutfak tasarımı taslağı çizdiğinizi hayal edin ya da sevdiğiniz bir kişiye hiç kamera ile çekilmemiş bir gün batımı fotoğrafını gönderdiğinizi hayal edin. Zihninizi okuyabilen bir bilgisayar, felçli olan ve iletişim kurmak için başka bir yolu olmayan kişilerin yanı sıra günlük yaşamda birçok kullanım alanı bulabilir. Bilim insanları başka bir kişi tarafından görülen veya hayal edilen görüntüleri yorumlayacak ve doğru şekilde çoğaltacak türünün ilk örneği olan bir çözüm yolu oluşturdular. Bu teknolojinin pratik kullanıma hazır olması on yıllar alabilir ancak araştırmacılar zihnimizin gözünü dışarıya yansıtmamıza yardımcı olabilecek yapım sistemlerine bir adım daha yakınlar.
Sinema izleyicilerin bir filmi izlerken gördüklerini bir şekilde üretebilen bir çözüm yolu geliştirilmesine yardımcı olan ve Indiana’nın West Lafayette’deki Purdue Üniversitesinden bir bilgisayar bilimci olan Zhongming Liu, “Bunun bu kadar iyi çalışmasından etkilendim.” dedi. “Bu gerçekten müthiş bir şey.” diye de ekledi.
Zihinsel imgeleri çözmek için çözüm yolları kullanmak yeni bir şey değil. 2011’den bu yana araştırmacılar, görüntüleri izlerken daha önce kaydedilen etkinlikle beyin etkinliğini eşleştirerek film görümsetmeleri, fotoğraflar ve hatta hayal görüntülerini yeniden yarattılar. Ancak bu yöntemlerin hepsinin kendi sınırları vardır. Bazıları yalnızca yüz şekli gibi dar alanlarla ilgilenir bazıları sıfırdan görüntü oluşturamaz- bunun yerine önceden programlanmış görüntülerden veya “kişi” veya “kuş” gibi kategorilerden birinin seçilmesi gerekir. Bu yeni çalışma anında tanınabilir görüntüler üretebilir ve hatta görülmeyen ancak hayal edilen şekilleri çoğaltabilir.
Bir kişinin ne gördüğünü bulmak için, araştırmacılar yüzünü beyne giden kan akışını sinirsel etkinlik için bir vekil olarak ölçen işlevsel manyetik rezonans görüntülemeye (fMRI) döndü. Her biri birkaç defa 1000’den fazla resme bakarken görsel işlem alanlarını 2 milimetrelik bir çözünürlükle oluşturdular. Amaç, herhangi bir görüntüye -mesela bir leopar- cevap olarak sadece etkinliği göz önünde bulundurmak ve nihayetinde bir bilgisayarın neredeyse aynı etkinliği üreten bir görüntü çizmesini sağlamaktı.
Ancak ekip konularını bilgisayardan doğru olana kadar arka arkaya çizimleri göstermek yerine, beyin için yedek bir yazılım, bir dizi basit işleme elemanının katmanı olan bir derin sinir ağı (DSA) kurdu. Japonya’daki Kyoto Üniversitesinde çalışan bir sinir bilimci ve çalışmanın kıdemli yazarı olan Yukiyasu Kamitani “Derin bir sinir ağının beynin sıradüzensel işlemesi için iyi bir vekil olduğuna inanıyoruz.” dedi. “DSA kullanarak, basit ışık karşıtlığından yüzler gibi daha anlamlı içeriklere kadar beynin görsel sisteminin farklı seviyelerinden bilgi çıkarabiliriz.” diye ekledi.
Araştırmacılar bir “kod çözücü” kullanarak beynin görüntülere verdiği tepkilerin temsillerini yarattı ancak bunu DSA içerisinde yaptılar. O andan itibaren artık gerçek fMRI ölçümlerine ihtiyaçları kalmadı, sadece DSA çevirilerine gereksinim duydular.
Birisinin ne görüntülediğini tahmin ederken çeviri bir şablon gibi davranır ve fMRI verileri bir kenara bırakılır. Sistem daha sonra DSA’nın bu şablonla eşleşecek şekilde yanıt vermesini sağlayacak bir resim çizmeye çalışır. Bir leopar, ördek veya vitray bir pencere olsun, istenen görüntüyü çizene kadar deneme yanılma yoluyla bunu yapar. Sistem, TV’deki karıncalanmaya benzer şekilde rastgele bir şeyle başlar ve 200 tur boyunca resmini yavaşça iyileştirir. Uygun görüntüye daha da yaklaşmak için sistem DSA etkinliği ile şablonlu DSA etkinliği arasındaki farkı hesaplar. Bu hesaplamalar uygun görüntüye yaklaşana kadar bir tarafa bir benek (piksel) diğer tarafa bir benek şeklinde dürtme yapmasına neden olur.
Nihai ürünü daha doğru hale getirmek için bu durumda girdilerine dayanarak gerçekçi görüntüler oluşturmak için ayarlanmış bir çözüm yolu olan “derin jeneratör ağı” (DJA) araştırma kapsamına alındı. DJA, resimlerin daha doğal görünmesini sağlar. Araştırmacılar geçen ay ön baskı sunucusu bioRxiv’e yüklenen bir makalede bunun bir kez eklendiğinde, tarafsız bir insan gözlemcisinin, bir resmin hangi fotoğraftan oluştuğunu, görüntünün %99’unu yeniden yaratması gerektiğini söyleyebildiğini belirttiler.
Daha sonra, bilim insanları insanların zihinlerini sadece görüntüleri imgeleyerek okumaya çalıştılar. Bu kez, bir balık, bir uçak ve basit renkli şekiller dahil olmak üzere daha önce görüntülenen görüntüleri hatırlamalarını istedikten sonra üç deneğin beynini taradılar. Bu yöntem fotoğraflar için iyi çalışmadı ancak üreteç şekiller için zamanın %83’ünde tanınabilir bir görüntü yarattı.
Columbia Üniversitesi’nin Zuckerman Enstitüsü’nde bilgisayımsal sinirbilimci olan Nikolaus Kriegeskorte, bu çalışma için “ilginç ve dikkatli bir çalışma” diyor. Kriegeskorte bilgisayar tarafından oluşturulan görüntülerdeki yanlışlıkların ne kadarının beyin etkinliği ölçümlerindeki kısıtlamalardan kaynaklandığını ve beynimizin görüntüleri yorumlama şeklindeki hataları ne ölçüde yansıttığını merak ediyor. Kriegeskorte “Yüksek çözünürlüklü fMRI ve diğer beyin görüntüleme teknikleri sonuçları daha da geliştirilebilir.” diyor. Daha iyi ölçümler ve çözüm yollarının sürekli iyileştirilmesi ile bir gün zihinsel resimlerle iletişim kurabiliriz.