Shakespeare Gibi Yazabilen Ritim ve Kafiye Ustası Yapay Zekâ
Çeviren: Mert Günçiner Düzenleyen: Esranur Maral
Özet: “Deep-speare’’ isimli yapay zekâ okuyucuların insan yazımı şiirlerden ayırt edemeyeceği dörtlükler yazmayı başardı.
Aşağıda William Shakespeare’in yazdığı soneden (on dört mısralı şiir) bir dörtlük:
Burada da sone yazması için programlanmış bir yapay zekâ olan Deep-speare’in[1] eseri:
Deep-speare’in dörtlükleri dikkatle okunduğunda kulağa saçma gelmesine rağmen şiir kurallarına gayet iyi uyuyor. Bir İngilizce öğretmeninin de takdir edebileceği gibi her satırda sunulan ritim, kafiye, şiir düzeni ve dil bilgisi gibi özellikler ilk bakışta uygun duruyor. Araştırma ekibinin de gösterdiği gibi yapay zekânın şiirleri dünyaya tanıtıldığında azımsanamayacak kadar çok insan buna kandı: çoğu okuyucu yapay zekânın yazdığı şiirleri insan yapımı olanlarından ayıramadı.
Araştırma ekibi, makine öğrenmesi üzerine araştırmalar yapan üç kişi ve bir edebiyatçıdan oluşuyor. Yapay zekâ çevrim içi bir kütüphane olan Project Gutenberg’den alınan 2.700 tane soneyi analiz etti. Derin öğrenme (Deep learning) metoduyla bir şiirin nasıl yazılabileceğini öğrendi. Veri tabanına yüklenmiş şiirlere defalarca çalıştı ve benzer örnekleri üretene kadar devam etti. Benzer projelerde yapıldığının aksine veri tabanına çalışması için ek bir ritim, telaffuz kılavuzu veya herhangi bir sözlük dâhil edilmedi. Onun yerine sone yazması için gerekli olan üç kuralı Deep-speare kendi keşfetti: kafiye, ritim düzeni, dil yapısının doğası (hangi kelimeler birbirleriyle kullanılır gibi).
Çalışmanın amacı derin öğrenmeyi doğal bir dil yaratabilmeye kadar ilerletebilmekti. Bu bağlamda şiirin dil bilgisi adına sunduğu ilgi çekici özelliklerden de yararlanılmış oldu. Sone gibi şiir türleri ritim ve kafiye söz konusu olduğunda genellikle katı şablonlar üzerine kuruludur. Deep-speare’in mimarisi ise bu katı şablonları takip ederek bir ürün çıkarabilmeyi kendi kendine öğrenebilmesi amaçlanarak inşa edildi.
Bu projeyle birlikte son yıllarda yükselen yapay zekâyla beslenmiş bilgisayar alanında yaratıcı girişimlerin örnekleri: Londra’da bir açık artırma şirketi olan Christie’s yapay zekâ ürünü resimleri açık artırmaya sundu, müzisyen Bach’ın tarzını taklit edebilen besteci bir yapay zekâ olan DeepBach ve çeşitli heykel ve koreografiler üretebilen diğer programlar buna benzer eserler yarattı. Dil bilimi ve edebiyat söz konusu olduğunda da OpenAI araştırma laboratuvarlarında geliştirilmiş GPT-2 adında bir metin üretici program başlangıç cümlesinden yola çıkarak görece tutarlı paragraflar yazabilmeyi başardı. Tüm bu modeller aynı zamanda genel işleyişi algılamakta ve kendilerine uyarlamakta son derece başarılılardı. Genel kurallara uydukları sırada rastgele ortaya çıkan şaşırtıcı sonuçlar ise
“tesadüfi yaratıcılık’’ örnekleriydi. Buna ek olarak derin öğrenme ne kadar rastgele öğeyi miras bilgi olarak alırsa gözlemlenen sonuçlar çok daha çeşitli oldu. Bu farklılıklar sayesinde, uygulamayı yöneten insanın da her sonucu inceleyebilecek kadar sabırlı olduğunu varsayarsak birbirinden yaratıcı çalışmalar mümkün hale geliyor. Son olarak yazı, ses, resim ve video dosyaları gibi birbirinden değişik verilerle birlikte çalışabilecek bir model oluşturmak o kadar da zor değil.
Bir sone iki ayrı özelliğiyle göze çarpar: 14 satır uzunluğuna ve iki parçadan oluşan “argüman’’ yapısına[2] sahip olmasıyla. Şiirin içerisinde önce bir soru sorulur ve sonrasında ona bir cevap sunulur. 16. yüzyıl İngiliz şairleri bir sone tarzı olan beşli ölçüyü (iambic pentameter) geliştirdiler. 10 heceden oluşan satırlar normal bir vurgulu- vurgusuz hece yapısına sahiptir. İngilizce bir sone genellikle üç veya dört satırdan oluşan dörtlüklere (kıta) sahiptir. Bu satırlar tema içerisindeki “sorunu’’ işler. Bunu ABAB CDCD EFEF GG ile kafiyeli iki satırlık beyitler takip eder. Shakespeare bunu o kadar sık kullandı ki bu tarz şiirler artık Shakespeare-tarzı soneler olarak biliniyor.
Deep-speare projesinde özellikle Shakespeare’in sorun temasını işlediği kıtalar oluşturulmaya çalışıldı. Doğal olarak tüm 14 satırda işlenen ikili argüman yapısı yerine beşli ölçüye sahip yapıları (iambic pentameter) kopyalamak üzerine odaklanıldı. Yapay zekâ geliştiricileri önce kıtaları üretmede uzmanlaşıp sonraki meydan okumalara yelken açmak istiyor.
Şiirsel Süreç
Yapay zekâ şairimiz Deep-speare Shakespeare’in sonelerinin dörtlüklerine benzer kıtaları oluşturabiliyor. Bu on dört satırlık şiirler bazı kafiye düzenleri ve vurgulu-vurgusuz hecelerden oluşan beşli ölçü kuralları çerçevesinde hareket ediyor. Deep-speare sadece alışılmış üç aşamalı doğal dil yaratma modeline uyuyor: İlk olarak kullanım olasılıkları göz önünde bulundurularak kelimeler seçilir. İkinci olarak her satırın şiir içindeki ritmine bakılır. Üçüncü olarak da her satırın kafiye kurallarına uyumluluğu kontrol edilir.
Bir dörtlük yaratabilmek için yapay zekâ öncelikle alışılmış kafiye düzenlerinden birini rastgele seçer. Bu örnekte “ABBA’’ kafiyesini seçmiş olsun. Yani ilk ve son satırlar birbirleriyle ve ortadaki diğer iki satır da kendi içlerinde kafiyeli olacak şekilde. Sonrasında ise şiir şaşırtıcı bir yolla oluşturulur: son satırın son kelimesinden başlayacak şekilde tersten ilerleyerek, sağdan sola devam edip her satırı tamamlayacak şekilde.
1- Deep-speare son satırın son kelimesini seçerek başlar (“wait”). Bu işlem İngilizcedeki tüm kelimelerin cümlenin o bölgesinde bulunma olasılıkları incelenerek seçilir. Burada rekabet içerisindeki beş kelimeyi görüyorsunuz. Model en yüksek ihtimalli kelimeyi seçmektense aday kelimeler arasından rastgele bir seçim yapıyor. (Not: “<unk>’’ sembolü olasılığı düşük ve seçilmesi olanaksız olan diğer kelimeleri temsil ediyor.)
2- Yapay zekâ tersten ilerleyerek kelime seçimi işlemini son satırın her bölgesine uyguluyor. Kelime seçimi için gereken olasılık hesapları ise aynı cümle içerisinde bulunan kelimeler göz önünde tutularak sürekli ve yeniden hesaplanıyor.
3- Deep-speare şiirde yer alacak diğer satırları şu şekilde seçiyor: takip edilen ritim modeli aday satırlara bakıyor ve hepsine bir ritim puanı atıyor. Bu adaylar içerisinde beşli ölçüye en çok uyanlar seçiliyor.
4- Yapay zekâ yukarıdan aşağıya giderek şiirin diğer satırları için de bu adımları uyguluyor.
5- Birinci ve ikinci satırların son kelimeleri seçilirken ise (örnekte “pray’’ ve “state” kelimeleri) kafiye modeli aday kelimelere bir kafiye puanı atayarak örnekteki “way” ve “wait” kelimeleriyle kafiyeli olacak kelimeleri seçiyor.
Ritim, Kafiye ve Dil Modelleri
Bu sistem üç yapıyla desteklendi: beşli ölçüyü öğrenmiş bir ritim modeli, hangi kelimelerin birbirleriyle kafiyeli olduğunu bilen bir kafiye modeli ve hangi kelimelerin genellikle birbirleriyle kullanıldığını aklında tutan bir dil modeli. Bu dil modeli soneyi kelimesi kelimesine oluşturan ana yapıydı.
Dil modeli hangi kelimelerin dil içerisinde (bu örnekte İngilizce) bir anlam oluşturduğuna karar verir. Bu işlem herhangi bir cümleye olasılık puanı atanmasıyla meydana gelir. Doğru dürüst tasarlanmış bir dil modeli akıcı kelimelere yüksek olasılık puanı atarken anlamsız cümlelere düşük olasılık puanı atar. Aynı zamanda birbirini takip eden kelimeler düşünülerek dilin nasıl düzenlenip yorumlandığının da göz önünde bulundurulması gerekir. Bu ilke sayesinde cümle oluştururken çıkan zorluğu sözcüklerin yarattığı devasa sorunu daha küçük kelimelerin yaratacağı sorunlara bölerek çözümlememiz kolaylaşır. Bir dil modelinin görevi yarım kalmış bir cümleye bakarak sıradaki kelimenin ne olacağına karar vermektir. Bu aşamada bildiği tüm kelimelere ve cümle içerisindeki kelimelerle uyumluluklarına bakar ve hepsine birer olasılık değeri atar.
Dil modeli tüm bu olasılık hesaplarını eğitim aşamasında aldığı bütün kelimeleri sindirerek yapar. Araştırmacılar genelde bu kelimeler için Vikipedi girdilerini, Reddit’teki tartışmaları ve diğer doğal dil geliştirme sistemleri için kelime bilgisi sunan veri tabanlarını kullanırlar. Bu kelime hazinesi içerisindeki yapay zekâ hangi kelimelerin birbirleriyle uyumlu olduğunu öğrenir. Deep-speare projesinde bu kelime kaynağı Gutenberg’in çevrim içi kütüphanesinde bulunan tüm şiir eserleri ve özellikle 2.700 tane Shakespeare-tarzı soneler tarafından sağlandı. Bu soneler yaklaşık 367.000 kelimeye tekabül etti.
Bir dil modelinin kalitesi birbiri peşi sıra gelen kelimelerin yaratacağı “sürpriz” etkisi göz önünde bulundurularak belirlenir. Eğer belli bir kelimeye yüksek olasılık değeri verildiyse bu akla gelecek ilk kelimelerden olacağı için sürpriz etkisi bir o kadar da düşük olacaktır. Benzer şekilde düşük olasılık değerine sahip kelimeler de yüksek sürpriz etkisi yaratacaktır. Dil modeli bir metin üzerinde çalışırken sürpriz etkisinin derecesi belirleyici etken olarak kullanılır. Eğer ki oluşturulan metne eldeki aday kelimelerden en başarılı olanları eklendiğinde bu sürpriz etkisi gözlemlenmiyorsa o zaman sistem yeterli kelime doygunluğuna ulaşmış demektir. Bu doygunluğa ulaşma seviyesi de bir dilin sahip olduğu karmaşık yapıya ne kadar yaklaşıldığının göstergesidir. (Her kelimenin işlenişini öğrenen bir sistem sonuç olarak pek de şaşırmayacaktır.) Buna “San Fransisco’’ gibi sık gözlemlenen çoklu kelimeler ve dil bilgisi kuralları, cümleyi oluşturan söz dizimleri ve günlük kullanımdaki kelime sıfatları da dâhil. (Bir kahvenin genelde “güçlü” veya “zayıf” değil de “sert” veya “yumuşak (içimli)” olabileceği gibi.)
Eğitime sokulan dil modeli cümleleri bitirebilmekle beraber sıfırdan cümle bile kurabiliyor. Bu işlemler sırasında rastgele yüksek olasılıklı bir kelime seçip, onu cümleye yerleştirip sonrasında gelebilecek kelimeler için yeniden olasılık hesabı yapılıyor. Bu süreç sonunda Deep-speare satırlarca şiir yazmayı başardı.
Deep-speare’in dil modeli Project Gutenberg’in soneler hazinesinden alınan kelimeleri çalışırken bağımsız bir ritim modeli ise beşli ölçü hakkında öğrenim yapıyordu. Ritim modeline her satırın 10 heceden ve vurgulu-vurgusuz düzenden oluştuğu bilgisi verildi. Model her satırdaki noktalama işaretlerini ve harfleri kontrol ederek hangilerinin hecelerle uyuştuğunu ve hangi hecelerin vurgulandığını belirledi. Örneğin “summer” kelimesinin iki parçadan oluştuğu anlaşılmalı: vurgulu bir “sum” kelimesi ve vurgusuz bir “mer” kelimesi. Deep-speare dörtlüklerini yazdığı sırada dil modeli şiire eklenecek aday satırları oluşturmakla meşguldü. Dil modeli bu sırada ritim modelinin beşli ölçüye göre belirlediği düzen çerçevesinde hareket etti. Sonrasında bu işlem sonraki satır için tekrarlandı.
Bu sırada kafiye modeli de boş durmayarak sone hazinesinden gerekli öğrenmeyi gerçekleştirdi. Tabii sadece her satırın son kelimesinin harflerine dikkat ederek. Eğitilme süreci sırasında kafiye modeline her satırın sonunu getiren harfin dörtlükteki diğer satırların son harfiyle kafiyeli olacağı bilgisi verildi. Sonrasında ise hangi kelimelerin gerçekten kafiyeli olduğunun bulunması beklenildi. Örnek olarak yukarıda bahsettiğimiz Shakespeare’in sonesinden alıntılanan kısma bakabiliriz. Kafiye modeli “day” ve “May” kelimelerinin yüksek bir kafiye puanına sahip olduğuna karar verdi: “temperate” ve “date” kelimelerinde yaptığı gibi.
Deep-speare kendi eserini çıkarabilecek kadar eğitim aldıktan sonra kendisine üç ayrı kafiye şablonu verildi: AABB, ABBA ve ABAB. Bunlar Shakespeare-tarzı sonelerde en çok görülen kafiyeler. Yazım aşamasında Deep-speare bunlardan birini rastgele seçti. Akabinde dil modeli devreye girdi ve satırlarca şiiri kelimesi kelimesine yaratmak için işe koyuldu. Kafiye sağlanması gerektiği anlarda ise kafiye modeline aday kelimeler sundu.
Aşağıda Deep-speare’in oluşturduğu iki tane dörtlük örneği var. İlki pek eğitime girmemiş, kafiye şemasını tam olarak kavrayamamış dolayısıyla kafiye sağlayamamış ve anlamsal olarak da pek bir şey ifade etmiyor.
by complex grief’s petty nurse. had wise upon
along
came all me’s beauty, except a nymph of song
to be in the prospect, he th of forms i join
and long in the hears and must can god to run
İkinci dörtlükte eğitimi neredeyse tamamlanmış ve modeller üzerinde ilerleme sağlanmış bir sürüme ait. Tutturduğu kafiyeler (Bu örnekte ABBA) son derece yerinde ve beşli ölçüye de uymakta. Ayrıca sadece dil bilgisi kurallarına uyulmakla kalınmamış aynı zamanda da şairane olmuş!
shall i behold him in his cloudy state
for just but tempteth me to stop and pray
a cry: if it will drag me, find no way
from pardon to him, who will stand and wait
Deep-speare’in şiirini incelediğimizde eğitim verilerinden kopya çekmiş olabileceği fikri doğdu. Fakat araştırmacılar tüm şiirleri kontrol ettiklerinde buna rastlamadılar. Deep-speare’in hâlihazırdaki soneleri ezberleyip sunmadığı ve tüm şiirleri kendi yazdığı anlaşıldı.
Yapay Zekânın Şiirleri Ne Kalitede?
Her ne kadar kendi yazmış olursa olsun bu sonelerin iyi kalitede olacağı anlamına gelmiyor. Deep-speare’in dörtlüklerine bir kalite kontrol uygulaması insan eliyle ve iki farklı değerlendirilme tekniğiyle yapıldı. İlk çeşit değerlendiriciler Amazon’un Mechanical Turk platformundan seçildi. Bu insanların İngilizce ile temel bir ilişkileri vardı fakat şiir konusunda uzman değillerdi. Onlara basitçe biri insan tarafından öbürüyse makine tarafından yazılmış iki şiir örneği sunuldu ve hangisinin insan tarafından yazılmış olabileceği soruldu.
Araştırmacılar ilk sonuçları gördüklerinde dehşete düştü. İnsan yapımı olan şiirler neredeyse herkes tarafından ayırt edilebilmişti. Makine tarafından yazılmış şiirlerin bu seviye çuvallamasından sonra tüm planlar suya düşmek üzereydi.
Daha sonra bu neredeyse yüzde yüze varacak tahmin başarısı için akıllara başka bir açıklama geldi: İnsanlar hile yapmıştı. İnsan yazımı şiirlerin hepsi Project Gutenberg çevrim içi kütüphanesinden alındığına göre değerlendiriciler bu şiirleri basitçe kopyala yapıştır yöntemiyle internette aratıp doğru sonuçlara ulaşmış olabilirlerdi. Bunun ardından araştırmacılar aynı şiirleri internette arattıklarında tahmin ettikleri gibi aynı şiirlerle karşılaştılar. Bu sayede önceki deney sonucu asılsız ilan edilmişti.
Hile yapımını engelleyebilmek için şiir metinleri resimler haline getirildi ve tüm süreç tekrarlandı. Sonra ne mi oldu? Tahmin başarısı %100’den %50 civarlarına düştü. Bunun anlamı insan yazımı şiirlerle makine yazımı şiirlerin birbirinden o kadar da farklı olmadığıydı. Tabii ki değerlendiriciler hâlâ resimde yazan kelimeleri tek tek Google arama motoruna girebilirdi fakat bu ek bir çaba gerektirirdi.
Bu ilk değerlendirilme yöntemiydi. İkinci yöntem ise Toronto Üniversitesinde edebiyat profesörü ve bir yardımcı yazar olan Adam Hammond idi. Öncekinin aksine şiirler bu sefer tahmin etme yoluyla değerlendirilmeyecekti. Bunun yerine Hammond’a insan ve makine yazımı sonelerinden oluşan rastgele bir karışım verildi ve bu şiirleri dört ayrı özelliğe göre puanlaması istendi: kafiyesi, ritmi, okunabilirliği ve kişide uyandırdığı duygusal etki.
Hammond Deep Speare’in dörtlüklerinin kafiye ve ritimlerine çok yüksek puanlar verdi. Hatta bu puanlar insan yazımı şiirlerin ritim ve kafiye puanlarından daha yüksekti. Fakat Hammond bu sonuca şaşırmadı çünkü insan şairler bazı etkileri yakalamak adına çoğu zaman kural dışı davranabiliyordu. Okunabilirlik ve yaratılan duygusal etki söz konusu olduğunda ise makine yazımı soneler düşük puan aldı. Edebiyat uzmanı kolay bir şekilde hangilerinin Deep-speare tarafından yazıldığını anlayabiliyordu.
Halktaki Karşılığı
Araştırmanın en ilginç yönlerinden biriyse halkın buna nasıl karşılık verdiğiydi. 2018’deki hesaplamalı dil bilimleri konferansında çalışmanın bulguları sunulduktan sonra dünya çapındaki haber kaynakları bunu herkese yaydı. Çoğu makale aşağıdaki dörtlüğü Deep-speare’in insan benzeri şiir yazabileceğini gösterebilmek adına alıntıladı:
With joyous gambols gay and still array,
no longer when he ’twas, while in his day
at first to pass in all delightful ways
around him, charming, and of all his days.
Hammond BBC radyosuna röportaj verirken sunucu bu dörtlüğün nasıl yorumlandığını görebilmek için sesli bir şekilde okudu. Hammond sunucuya dörtlükteki dil bilgisi hatasını fark edip etmediğini sordu: “he ’twas,” kullanımı “he it was.” yerine şiirlerde kullanılan dil bilgisi olarak hatalı bir parçaydı. Sunucu bunu fark etmediğini söyledi.
Eliza Etkisi
Yapay zekânın muhteşemliğini görebilmek adına yapılan bazı apaçık hataları göz ardı etme çok sık görülen bir olaydır. Sosyal bilimci Sherry Turkle bunu “Eliza Etkisi (the Eliza effect)” olarak adlandırır. Bunun kökeni ilk metin bazlı yapay zekâ deneylerine dayanır. 1960’larda Massachusetts Teknoloji Üniversitesinde (MIT) bilgisayar bilimci Joseph Weizenbaum’un geliştirdiği dünyanın ilk chatbot[3] uygulaması olan Eliza bir psikoterapistin konuşma tarzını taklit etmeyi başarmıştı. İlkel ve hataları kolay göze çarpan bir deneme olmasına rağmen insanlarda yarattığı etkiyi gören Weizenbaum çok şaşırmıştı. 1970’lerde Weizenbaum’un MIT’den iş arkadaşı Turkle belirli kısıtlamalara ve hatalara sahip Eliza’nın buna rağmen sorulan sorulara insancıl bir şekilde yanıt verdiğini gördü.
Eliza etkisi, Turkle’ın tanımıyla “insanın teknoloji hayalleri karşısında sağduyusunu yitirebilmesi”, anlaşılan Deep-speare ile halkta yeniden karşılığını buldu. Toplum bu şiirlerin yapay zekânın gücünü kanıtladığına inanmak adına bazı hatalarını göz ardı etti.
Çalışmanın Geleceği
Bu kasıtlı ve hatalı bakış, ortadan kaldırılmazsa yapay zekânın gelişimini sekteye uğratabilir. Araştırmacılar hâlâ yapay zekânın okunabilirlik ve yarattığı duygusal etki puanlarını yükseltmeye çabalıyor. Genel tutarlılığı artırmak adına bir yaklaşım, Vikipedi gibi devasa miktarda metin içeren bir veri tabanıyla yapay zekâyı eğitim aşamasında beslemek olabilir. Bu sayede hangi kelimelerin beraber kullanıldığı daha kolay öğretilebilir. Sonra genel dil şeması üzerinden hazırlanan bu yapı sonra sone yazımında dil kullanımı gibi belirli konular üzerine eğitim alabilir.
Araştırmacılar aynı zamanda insan şairlerin eserlerini nasıl yarattığını düşünüyor: Bir şair sandalyesine öylesine oturup, “İlk kelimem ne olsa bari?” diye düşünüp bu zor kararı verdikten sonra ikinci kelimeye odaklanmaz herhâlde. Bunun aksine, şairin kafasında genel bir tema olur ve şair bu temayı anlatacak kelimeleri aramaya koyulur. Bu bağlamda Deep-speare’e aşk veya acı gibi belirli bir konu verip onun üzerinden şiir yazmasını isteyerek bir adım atılmış olundu. Bir konu üzerinden ilerlemek dörtlükteki genel uyumluluğu ve devamlılığı sağlayabilmekte işi kolaylaştırır, modelin seçeceği kelimeler konu itibarıyla sınırlanmış olur. Araştırmacılar aynı zamanda daha kademeli yapıya sahip bir dil modeli yaratmayı istiyorlar: şiir için öncelikle üst düzey bir anlatı yaratıp bu çatı altında kelimeleri tek tek oluşturabilecek bir model.
Bu biraz iddialı bir amaç tabii ki. Araştırmacıların umudu Deep-speare’in eserlerinin Shakespeare’inkilere yaklaşamayacaksa bile en azından Shakespeare’in yazdığı bir şiirde anlatılan karaktere yaklaşabilmesi:
He had the dialect and different skill,
Catching all passions in his craft of will.
Farklı yeteneklere ve yeterli dile sahipti
Tutkularının peşinden götüren sanata olan iradesiydi
[1]Deep-speare ismi bir yapay zekâ metodu olan Deep Learning (Türkçe: Derin Öğrenme) kelimesi ile William Shakespeare’in soyadı birleştirilerek verilmiş.
[2] Buradaki iki parçalı argüman yapısı tematik bir anlam taşıyor. İçerdikleri 14 satır içerisinde sorun ve çözüm, soru ve cevap gibi ikili bir etkileşimin yer alması.
[3] Yapay zekâ yazılımlarıyla işletilen sohbet robotu.