Bilgisayar Bilimleri

Üretken Yapay Zekâ Dünyasının Yeni Mesleği Sufle Mühendisliği

Yazan: Sunil Ramlochan

Derleyen: Ayça Soyubelli   

Düzenleyen: Ümit Sözbilir

Özet: ChatGPT gibi üretken yapay zekâ modellerinin hızlı yükselişinin bazı meslekleri tarihe karıştırdığı bir sır değil ancak yeni kariyer fırsatları da yaratmaya başladı bile. Bu yeni mesleklerden biri de yavaş yavaş ivme kazanan “prompt” mühendisliği. Yakın zamanda sıklıkla duyduğumuz bu mesleğin Türkçede herkesin kullandığı ortak bir ismi henüz olmasa da sufle mühendisliği, istem mühendisliği veya komut mühendisliği olarak karşımıza çıkıyor. Bu yazıda sufle mühendisliğinin; tanımını, çalışma yöntemlerini ve alanlarını inceleyeceğiz.

Kullanıcılar büyük dil modellerine soru sorarlar veya komut verirler. Bu girdiler doğal dil işleme bağlamında talimat olarak adlandırılır. Sufle mühendisleri, bu talimatlar üzerinde değişiklikler yaparak ChatGPT gibi yapay zekâ modellerini kullanıcıların hedefine en uygun yanıtları üretebilmesi için yönlendirirler.

Sufle mühendisliği, nispeten yeni bir disiplindir ve teknoloji ile insanların etkileşiminde devrim yaratan üretken yapay zekânın ayrılmaz bir parçasıdır. Bu yenilikçi disiplin, talimatların ve üretken yapay zekâ modellerini çalıştıran veri yapılarının; titizlikle tasarlanması, iyileştirilmesi ve mümkün olan en iyi duruma getirilmesine odaklanır. Yapay zekâ sistemlerini belirli çıktılara yönlendirerek insan ve yapay zekânın etkileşiminin kesintisiz gerçekleşmesinde sufle mühendisliği anahtar konumundadır.

1. Büyük Dil Modelleri İçin Sufle Mühendisliğinin Önemi

Derin öğrenme yöntemi ile eğitilen büyük dil modelleri, yazıları bir insanın algıladığı gibi algılayabilir ve insanlar gibi yazı üretebilir. ChatGPT gibi büyük dil modelleri, insan tarafından yazılmış gibi yazılar üretebilmek ve girilen yazıları anlamak için doğal dil işleme yöntemini kullanır. Bu modeller, sohbet edebilme konusunda oldukça gelişmiştir ancak konuşmayı başlatabilmek için belirli talimatların girilmesine bel bağlar. Bir sorunun sorulma şekli bile modelin vereceği cevabı büyük oranda etkiler.

2. ChatGPT Nedir?

ChatGPT, OpenAI şirketi tarafından GPT-3.5 dil modeli ile üretilmiş bir büyük dil modeli (large language model)1  sohbet robotudur [1]. Karşılıklı konuşma şeklinde etkileşime girer ve insanların verebileceği yanıtlara şaşırtıcı derecede benzeyen yanıtlar verme yeteneğine sahiptir.

Büyük dil modelleri, veri kümeleriyle eğitilerek bir dizi kelimeden sonra sıradaki kelimeyi tahmin eder. İnsan geri bildirimi ile pekiştirmeli öğrenme yöntemi (Reinforcement Learning from Human Feedback)2  de ChatGPT’nin verilen komutları algılayarak tatmin edici cevaplar verebilmesi için eğitiminde bir katman olarak kullanılır.

ChatGPT gibi bir dil modelinden Fransa’nın başkentini öğrenmek istediğimizi varsayalım. “Fransa” gibi belirsiz bir girdi sağlarsak yapay zekâ modeli istenen bilginin ne olduğunu tam olarak anlayamayabilir ve Fransa hakkında genel bilgiler verebilir.

suflu mühendisliği
(Kaynak: ChatGPT)

Bunun yerine talimatı daha belirli olacak şekilde düzenleyerek “Fransa’nın başkenti neresidir?” diye girersek, yüksek ihtimalle, aradığımız cevap olan “Paris” cevabını verecektir.

(Kaynak: ChatGPT)

3. Modeli Yönlendirme Süreci

Sufle mühendisliği basit bilgi toplama talimatlarıyla sınırlı değildir. Yaratıcı içerik üretebilir, kişiselleştirilmiş önerilerde bulunabilir, müşteri hizmetlerinde kullanılarak otomatik cevaplar verebilir veya bilimsel araştırmalarda kullanılabilir. Daha güçlü dil modellerinin geliştirilmesi ve bu modellerin kullanım alanlarının artmasıyla sufle mühendisliğinin önemi de artmıştır.

Karmaşık konularda üretken yapay zekâ kullanıldığında bağlam eklenmesi, ince ayar yapılması veya modelin vereceği çıktıyı etkileyecek diğer faktörlerle denemeler yapılması gibi çeşitli yöntemler sufle mühendisleri tarafından kullanılır.

Bir yapay zekâ modeli için sorular üretmek veya ifadeler formüle etmek basit gibi görünse de bu iyi yapılandırılması gereken ve yedi adımdan oluşan tekrarlamalı bir süreçtir.

3.1. Hedef Belirleme

İlk adım yapay zekânın tam olarak ne üretmesini istediğinizi belirlemektir. Örneğin yenilenebilir enerjiyle ilgili bir blog yazısı yazmak isteyen bir içerik üreticisiyseniz yapay zekâdan yazınız için konular önermesini isteyebilirsiniz. Bu adımda önemli olan isteğinizin açık ve cümleye dökülebilir durumda olmasıdır.

3.2. İlk Talimatı Hazırlama

İlk talimat; hedefe bağlı olarak bir soru, bir komut veya bir senaryo olabilir. Bir önceki adımda verilen örnek için “Yenilenebilir enerji hakkında beş blog konusu öner.” talimatı güzel bir başlangıç olacaktır.

3.3. Talimatı Deneme

Bu adımda, bir sonraki adımda analiz edilmek üzere ilk talimat dil modeline girilir. Model muhtemelen yenilenebilir enerji hakkındaki konuları içeren bir liste oluşturacaktır. Listenin maddeleri seçtiğiniz konuyla alakalı olsa da aradığınız bakış açısı veya özgüllükten yoksun olabilir.

(Kaynak: ChatGPT)

3.4. Yanıtı Analiz Etme

Yapay zekânın ürettiği çıktının hedefle uyumlu olup olmadığı dikkatlice gözden geçirilir. Çıktı beklentiyi karşılamıyorsa hangi yönlerden eksik olduğuna karar verilir. Örneğin yenilenebilir enerji konusunda model istediğinizden daha genel konuları önermiş olabilir.

3.5. Talimatı İyileştirme

Deneme ve analizlerden elde edilen bilgiler ışığında talimatta değişiklikler yapılır. Bu değişiklikler talimatı daha kesin hâle getirmek, talimata bağlam eklemek veya ifade biçimini değiştirmek olabilir. Örneğin ilk talimat “Yenilenebilir enerji sektöründe yenilikçi çözümlere odaklanan beş blog konusu öner.” olarak güncellenebilir.

(Kaynak: ChatGPT)

3.6. Süreci Tekrarlama

Deneme, analiz etme ve iyileştirme aşamaları model hedeflenen cevabı verene kadar tekrarlanır. Talimatın, modeli çoğunlukla istenen sonuca yönlendirmesi önemlidir.

3.7. Uygulama

Talimat tutarlı bir şekilde hedefe uygun sonuçlar verdikten sonra üretken yapay zekâ uygulamalarında kullanılmaya hazırdır. Bir sohbet robotu ile konuşmak, yapay zekâ destekli araştırmalar yapmak veya içerik üretmek için kullanılabilir.

Sufle mühendisliği analitik düşünme, yaratıcılık ve teknik zekânın büyüleyici bir karışımıdır. Sadece soru sormak değil en yararlı cevapları elde etmek için doğru soruları doğru biçimde sormakla ilgilidir.

4. Sufle Mühendisliğinin Temel Unsurları

Yapay zekâ modelinin talimatlar ile doğru yönlendirilebilmesi ve istenen cevapları verebilmesi sufle mühendisleri için oldukça önemlidir. Sufle mühendisleri genellikle geleneksel insan dilinde ifade edilen bu talimatları tasarlarken yapay zekânın tam olarak hedeflenen konuyla ilgili cevap vermesi için onu yönlendirmeyi hedefler.

Tasarım süreci genellikle insan dilinin kurallarını takip eder. Bu kurallar:

Duruluk: Talimatlar açık olmalıdır.

Bağlam: Yapay zekâ modelini yönlendirecek talimatlar içinde uygun bağlam olmalıdır.

Hassaslık: Talimat yapay zekânın istenen çıktıyı vermesini sağlamalıdır.

Uyarlanabilirlik: Talimat çeşitli yapay zekâ modellerinde kullanmaya uygun olmalıdır.

4.1. Yapay Zekânın Bilgi Tabanını Genişletme

Bu süreç yapay zekâya belirli veri tiplerini kullanarak gerekli çıktıları üretmeyi öğretmeyi içerir. Böylece model, çıktılarını kademeli olarak geliştirebilecektir. Bir yapay zekânın bilgi tabanını genişletmek için birkaç yöntem kullanılabilir.

4.1.1. Talimat Aracılığıyla Bilgi Ekleme

Bu yaklaşım talimat yoluyla doğrudan bilgi girişini içerir.Talimat içinde örnekler vermek ve az atışla öğrenme (few-shot learning) (bkz. 5.2. Az Atışla Yönlendirme.) izlemini uygulamak bir modele talimat ile bilgi ekleme yönteminin ayrılmaz iki parçasıdır.

4.1.2. Katmanlı Bilgi Ekleme (Layered Knowledge Addition)

Bu yöntem ana veri tabanı üzerinde bulunmak üzere destekleyici bir katman oluşturma fikri üzerine kurulmuştur. Yöntemin detayları çoğunlukla kullanılan yapay zekâ modelinin türüne bağlıdır.

4.1.3. Veri tabanında Kontrol Noktaları Oluşturma

Yazılı talimatlara karşılık görüntü şeklinde çıktı veren modeller için özellikle faydalı bir izlemdir.

4.1.4. İnce Ayar Yapma (Fine-Tuning)

Bu yöntem çıktılarını geliştirebilmek için yapay zekâ sisteminde bazı değişiklikler yapmaya dayanır. Bu ayarlamalar; parametrelerde, eğitim verisinde veya talimatlarda yapılan değişiklikleri içerebilir. Özellikle modern dil modellerinde kullanıma uygun bir yöntemdir.

4.1.5. Gömme (Embedding)

Veri, yapay zekâ sisteminin anlayabileceği biçimde sunularak modelin daha kesin ve amaca uygun çıktılar üretmesi sağlanır.

Sufle mühendisleri, bu yöntemleri en uygun biçimde uygulayarak yapay zekâ sistemlerinin bilgi tabanlarının iyileştirilmesi ve genişletilmesinde kritik bir rol oynar. Bu süreçler ise daha etkili ve doğru sonuçlar veren yapay zekâ modellerinin yolunu açar.

5. Temel Teknikler ve Kavramlar

Hızla gelişen üretken yapay zekâ alanında sufle mühendisliğinin temel tekniklerini öğrenmek giderek daha önemli hâle gelmektedir. Bu teknikler, GPT-3 ve GPT-4 gibi büyük dil modellerini işletmek ve bu modellerin performansını iyileştirerek doğal dil işleme alanında yol katetmek için oldukça önemlidir.

5.1. Sıfır Atışla Yönlendirme (Zero-Shot Prompting)

Bir model öğrenirken ona örnek olarak sunulan girdi-çıktı eşleştirmelerini kullanır. Kullanılan teknik “vuruş” veya “atış3” olarak adlandırılan örneklerin sayısını belirler.

GPT-4 gibi önemli dil modelleri doğal dil işleme görevlerinin ele alınma biçiminde devrim yaratmıştır. Bu modellerin öne çıkan özelliklerinden biri de sıfır atışla öğrenebilmesidir. Sıfır atışla yönlendirme verilen talimatların açık örnekleri sunulmadan modelin onları algılayıp yerine getirebilmesi demektir.

5.2. Az Atışla Yönlendirme (Few-Shot Prompting)

Az atışla öğrenme (few-shot learning) olarak da adlandırılan bu teknik, girdi-çıktı eşleşmelerinin belirli örneklerini sağlayarak GPT-3 gibi geniş dil modellerinin aranan çıktıları oluşturmasına yardımcı olur. Bağlam içi öğrenmeyi kolaylaştırarak modeli örneklerle eğitir ve uygun yanıtlar vermesi için yönlendirir. Az atışla yönlendirme yöntemi karmaşık görevlerde büyük dil modellerinin performansını artırmada hayati bir rol oynar.

Sıfır atışın etkileyici sonuçlarına rağmen az atışla yönlendirme bir atış, üç atış, beş atış gibi örnekler sunarak karmaşık görevleri yerine getirmek için daha etkili bir izlem olmuştur. Bunun yanında az atışla yönlendirme belirli mantıksal problemleri ele alırken bazı kısıtlamalar yaratır. Bu durumlar için sofistike yönlendirme (sophisticated prompt engineering) veya düşünce zinciriyle yönlendirme (chain-of-thought prompting) gibi farklı teknikler kullanılabilir.

5.3. Anlamsal Gömmeler ve Vektör Veri Tabanı

Anlamsal gömmeler, kelimelerin veya ifadelerin anlamsal çıkarımlarını kapsayan metnin sayısal vektör tasvirleridir. Bu vektörlerin karşılaştırılması ve analizi metnin ögeleri arasındaki farklılıkları ve benzerlikleri ortaya çıkarır.

Arama yapılırken anlamsal gömmelerin kullanılması özellikle büyük veri kümelerinde ilgili bilgilerin hızlı ve verimli bir şekilde elde edilmesini sağlar. Anlamsal aramanın daha hızlı arama yapabilmesi, hesaplama giderlerinin daha az olması ve modelin olayları uydurmaktan kaçınabilmesi gibi özellikleri ince ayar tekniğine göre daha avantajlı olduğunu gösterir. Bu özellikleri sayesinde bir modelden belirli bir bilgi alınması hedeflendiğinde anlamsal arama tercih edilir.

Öneri motorları, programların arama fonksiyonları ve metin sınıflandırma gibi birçok alanda bu gömmeler kullanılır. Örneğin bir yayın hizmeti için film öneri motoru oluşturulurken anlamsal gömmeler hedefe uygun filmleri metinsel açıklamalarına göre belirleyebilir. Motor, açıklamaları vektör şeklinde ifade ederek aralarındaki mesafeyi ölçebilir ve vektör uzayında birbirine yakın olan filmleri önerebilir. Bu yöntemle daha az kusurlu bir kullanıcı deneyimi sağlanır.

5.4. Büyük Dil Modellerinde İnce Ayar Yapma

İnce ayar işlemi sohbet robotları gibi önceden eğitilmiş modellerin performansını artırmak için kullanılır. İnce ayar, örnekler sunarak ve modelin değişkenlerini değiştirerek modelin verilen görevlere daha açık ve bağlamsal olarak uygun yanıtlar vermesini sağlar. Bu görevler, amaçlanan çıktıyla daha uyumlu olacak olan sohbet robot diyaloglarını, kod oluşturmayı ve soru formülasyonunu kapsayabilir. Bunu eğitimi sırasında ağırlıklarını (weights) düzenleyen bir sinir ağına benzetebiliriz. Örneğin ince ayar yapılarak müşteri hizmetleri sohbet robotlarının sektöre özgü terimleri veya argo kelimeleri anlama kapasitesi artırılabilir. Böylece robot müşterilerin istekleriyle uygun yanıtlar verebilir.

Bir öğrenme aktarımı (transfer learning)4 çeşidi olan ince ayar, önceden eğitilmiş bir modeli tekrar kapsamlı bir eğitime gerek duymadan yeni görevleri yerine getirebilmesi için değiştirir. Önceden eğitilmiş modelin değişkenlerinde küçük değişiklikler yapılarak yeni görevlerini daha etkili gerçekleştirebilmesi sağlanır.

Tüm bu iyi taraflarının yanında GPT-3 gibi geniş dil modellerinde ince ayar yapmanın da kendine özgü zorlukları vardır. Özellikle ince ayar yapmanın modelin bilgi elde etme gücünü artıracağı inancı yaygın bir yanlış anlaşılmadır. İnce ayar, modele yeni görevler veya örüntüler katsa da yeni bilgi bunların arasında değildir. Bunlara ek olarak ince ayar yapmak zaman alıcı, karmaşık ve maliyetli olabilir. Dolayısıyla belirli bir sayının üstünde modelde kullanıldığında pratik veya içinden çıkılabilir olmaktan uzak olacaktır.

5.5. Düşünce Zinciri ile Yönlendirme

Düşünce zinciri (chain of thought), dil modellerinin geleneksel yönlendirme yöntemleriyle verimli bir şekilde yerine getiremediği karmaşık görevleri çok yönlü muhakeme ederek yerine getirebilmesini sağlayan yenilikçi bir tekniktir. Bu yaklaşımın en önemli özelliği çok adımlı problemleri birbirinden ayrı ara adımlara ayrıştırmasıdır.

Bu tekniği uygularken talimata “Doğru cevabı bulduğumuza emin olmak için adım adım ilerleyelim.” gibi ifadeler eklenir. Böylece karmaşık problemleri çözmeye çalışırken modelin sistematik ilerlediğinden emin olunur. Sufle mühendisleri düşünce zinciri yöntemini kullanarak daha geniş bir alanda etkili olabilmesi için dil modellerinin kapasitesini artırabilir.

5.6. Bilgi Üreterek Yönlendirme

Bilgi üretme (knowledge generation) yöntemi görevleri ele alırken yapay zekânın bilgi üretme kabiliyetinden yararlanır. Bu yöntem gösterileri kullanarak modeli belirli bir probleme doğru yönlendirir. Burada yapay zekâ daha sonra verilen problemleri çözmek için gereken bilgileri üretebilir. Bilgi üreterek isteme yöntemi veri kümeleri gibi dış kaynaklar eklenerek daha da güçlendirilebilir böylece yapay zekânın problem çözme yetkinlikleri artırılabilir.

Bilgi üreterek isteme yöntemi iki temel aşamadan oluşur:

  1. Bilgi Üretimi: Bu aşamada büyük dil modelinin konunun kendisi veya konuyla ilgili konu başlıkları hakkında neleri bildiğini ölçen bir değerlendirme yapılır. Bu süreç modelde önceden var olan bilgiyi anlamayı ve kullanabilmeyi sağlar.
  2. Sonuç Çıkarırken Bilgi Ekleme: Talimat verme aşamasında dil modelinin konuyla ilgili bilgisi direkt girdi verisi veya veri tabanlarıyla desteklenir. Böylece modelin konuyu daha kapsamlı öğrenmesi sağlanarak alınan sonuçta olabilecek eksiklikler giderilir.

Özet olarak bilgi üreterek isteme tekniği, yapay zekâ modelinin hâlihazırda sahip olduğu bilgiler ile ona sağlanan yeni bilgiler arasında bir köprü kurarak modelin performansını ve problem çözebilme kapasitesini artırır.

5.7. Öz Tutarlılık ile Yönlendirme

Öz tutarlılık (self consistency); düşünce zinciri kavramını genişleten, gelişmiş bir tekniktir. Bu tekniğin öncelikli hedefi düşünce zinciri tekniğinin bir özelliği olan acemice kod çözmeyi (naive greedy decoding), çeşitli akıl yürütme yolları kullanarak ve en tutarlı yanıtları seçerek geliştirmektir. Bu teknik, aritmetik ve sağduyulu muhakeme gerektiren görevlerde düşünce zinciri tekniğinin performansını önemli ölçüde artırır. Yapay zekâ modeli, oy çokluğunu kabul ettiği bir sistemle daha doğru ve güvenilir çözümlere ulaşabilir.

Öz tutarlılık ile yönlendirme sürecinde dil modeline birçok soru-cevap veya girdi-çıktı çifti sağlanır. Model bu veriyi kullanarak her bir soru ile eşleştirilen çıktının arkasında yatan karar verme sürecini öğrenir. Daha sonra modele bu örnek çiftlerinin girdisi talimat olarak girilerek problemi sağlanan veridekine benzer bir akıl yürütme şekliyle çözmesi istenir. Bu işlem sadece süreci kolaylaştırmakla kalmaz, aynı zamanda model içinde tutarlı bir düşünce sistemi sağlar. Böylece modeli tutarlı ve verimli bir şekilde yönlendirirken tekniği anlamak ve uygulamak da kolaylaştırılır. Bu gelişmiş yönlendirme tekniği dil modellerinin problem çözme yeteneklerini artırırken yapay zekâ alanında devam eden gelişimi de göstermektedir.

5.8. Kendine Yansıtma ile Yönlendirme

GPT-4 ile kullanılan kendine yansıtma (self reflection) tekniği yapay zekânın; kendi hatalarını değerlendirebildiği, hatalarından öğrenebildiği ve bunun sonucunda performansını artırabildiği yenilikçi bir yaklaşım sunar. GPT-4, kendi kendini sürdüren bir döngüye katılarak problem çözmek ve doğruluk oranı yüksek cevaplar üretmek için geliştirilmiş izlemler formüle edebilir. Tekniğin öne çıkan bu özelliği GPT-4’te ondan önceki modellere kıyasla daha gelişmiştir ve birçok görevde performansını artırabilmesini sağlar.

Yansıtma yöntemini kullanarak mevcut uygulamanın tekrar tekrar iyileştirilmesi somut bir gerçeğin bulunmasının zor olduğu durumlarda doğruluğu yüksek çözümler üretilmesini kolaylaştırır. Böylece başarı kriteri azaltılarak yapay zekâ modeli şu anda çözmek için insan zekâsına ihtiyaç duyulan bir dizi karmaşık problemi çözebilir. 

Gelecekte, yansıtma ile yönlendirme uygulamaları yapay zekâ modellerinin daha fazla çeşit probleme çözüm bulabilmesini sağlayabilir. Kendine yansıtma yöntemi yapay zekâ modellerinin yeteneklerinin önemli ölçüde geliştirilme potansiyelini gösterir. Bu gelişim sayesinde modeller; daha çok uyum sağlayabilen, daha dayanıklı ve karmaşık sorunlarla başa çıkabilir hâle gelir.

5.9. Doğru Yönlendirmede Hazırlamanın Önemi

Hazırlama (priming), kullanıcıların beklenen çıktı için bir talimat vermeden önce bir dizi yineleme ile ChatGPT gibi bir büyük dil modeliyle etkileşime girdiği etkili bir yönlendirme tekniğidir. Bu etkileşim, yapay zekânın anlayışını verimli bir şekilde yönlendirmeyi ve konuşmanın bağlamına uyumlu davranış sergilemesini sağlamayı hedefler. Bunu sağlamak için modele çeşitli sorular sorulabilir, belirli ifadeler girilebilir veya direktif verilebilir.

Bu işlem yapay zekânın bağlamı ve kullanıcının beklentilerini daha kapsamlı anlamasını sağlayarak daha iyi çıktılar vermesini sağlar. Hazırlamanın esnek bir yöntem olması kullanıcıların baştan başlamasına gerek kalmadan değişiklik yapabilmesini mümkün kılar. Model eldeki görev için etkin bir şekilde hazırlanarak kullanıcı gereksinimlerine yanıt verebilecek şekilde mümkün olan en iyi duruma getirilir. Yapay zekâ modellerinin farklı kullanıcı ihtiyaçlarını ve bağlamları anlama ve bunlara yanıt verme konusundaki doğal uyum sağlayabilme yetisi sayesinde kullanıcıların her biri bu yöntemi kullanarak kişiselleştirilmiş bir etkileşime girerler.

6. Sufle Mühendisleri Hangi Alanlarda Çalışır?

6.1. Müşteri Hizmetleri Sohbet Robotu

(Kaynak: Enterprise DNA Blog)

Müşterilerin sorularını cevaplandırması için bir sohbet robotuna ihtiyacı olan bir şirkette bir sufle mühendisi, müşterilere daha iyi yardımcı olabilmek amacıyla onlardan gerekli bilgileri alabilecek talimatları tasarlar.

Örneğin bir kullanıcı “Giriş yapamıyorum.” cümlesini girdiğinde sohbet robotu “Sorun yaşadığınız için üzgünüm. Giriş yapmaya çalışırken bir hata mesajı alıyor musunuz?” çıktısını verecek şekilde tasarlanır. Böylece yaşanan sorunun çözülmesinde faydası olacak bilgiler kullanıcıdan alınmış olur.

6.2. Yapay Zekâ Destekli İçerik Üretimi

(Kaynak: Enterprise DNA Blog)

Bir yazarın hazırlayacağı içerik için konu başlıkları üreterek fikir edinmek istediğini düşünelim. “Yazı için fikir ver.” gibi düzgün tasarlanmamış bir talimat verildiğinde hedeflenen konuyla alakası olmayan bir çıktı alınacaktır. Bir sufle mühendisi “2023’te sürdürülebilir moda trendleriyle ilgili beş makale konusu fikri oluştur.” gibi konuyla ilgili en iyi çıktının alınacağı talimatı tasarlar.

6.3. Bilimsel Araştırmalara Yardımcı Yapay Zekâ

Bir konuda bilgi edinmek isteyen bir kullanıcı; yapay zekâ kullanarak birçok makaleyi tek bir talimatla tarayabilir, sorduğu soruların cevabını alabilir veya taranan makalelerin özetini çıktı olarak alabilir. Bir spor eğitmeninin danışanlarına kreatin kullanmalarını önermeden önce kreatinin kas kütlesini artırmada faydalı olup olmadığını bilimsel makalelerden yardım alarak öğrenmek istediğini düşünelim. Talimat “Kreatin faydalı mıdır?” şeklinde girilirse kreatinin faydalarını inceleyerek bilgi veren bir çıktı alacaktır.

(Kaynak: Consensus)

Bunun yerine “Kreatin kas kütlesini artırmaya yardımcı olur mu?” sorusunu girerse modeli hedefine uygun çıktı vermeye yönlendirecektir.

(Kaynak: Consensus)

Sufle mühendisinin rolünün önemli bir yönü, talimatları test etme ve modelin yanıtlarına göre talimatları iyileştirme işlemleridir. Bir müşteri hizmetleri sohbet robotunun cevaplarını iyileştirmek gibi basit görünen bir projeden bir programın neredeyse tamamını yapay zekâ modeline yazdırmak gibi karmaşık projelere kadar geniş bir alanda sufle mühendisliğine ihtiyaç duyulur.

7. Sufle Mühendisliğinin Geleceği

Sufle mühendisliği, yapay zekânın hızla geliştiği ve hayatlarımızdaki yerinin arttığı bu dönemde yapay zekâ ile insanlar arasındaki etkileşimi iyileştirmesi sebebiyle önemli bir konumdadır. Sufle mühendisinin amacı yapay zekâ sisteminin hedefle alakalı, işe yarar ve hedeflenen çıktıyla benzerlik gösteren çıktılar vermesini sağlamaktır. Verilen örneklerden de anlaşıldığı gibi sufle mühendisliği sanılanın aksine yapay zekâya basit sorular sormaktan ibaret değildir. Sufle mühendislerinin; yapay zekâyı talimatlarla yönlendirmek, doğru talimatları bulmak, modeli eğitmek, gelişmesine yardımcı olmak, bir talimat kütüphanesi oluşturmak, talimatları test etmek ve kategorize etmek gibi birçok görevi yerine getirebilmesi gerekir.

İleri düzey yapay zekâ sistemlerine olan talebin artışıyla birlikte sufle mühendisliği de değişerek daha kritik bir rol hâline gelecektir. Bu alan gelişmeye devam ederken sufle mühendislerinin gelişmeleri takip etmesi ve edindikleri bilgileri insanlarla paylaşması yapay zekâ sistemlerinin başarısını artırmak için oldukça önemlidir.


1 Büyük dil modeli; yeni içerikleri üretebilmek, anlayabilmek, özetleyebilmek ve tahmin edebilmek için derin öğrenme tekniklerini ve büyük veri kümelerini kullanan bir tür yapay zekâ algoritmasıdır. [2]

2 Bir yapay zekâ modelini eğitmek için ödüller ve karşılaştırmalar gibi pekiştirmeli öğrenme tekniklerini insan rehberliğiyle birleştiren bir makine öğrenimi yaklaşımıdır. [3]

3 (İng.) Shot.

4 Makine öğreniminde kullanılan öğrenme aktarımı, önceden eğitilmiş bir modelin yeni bir problem üzerinde yeniden kullanılmasıdır. Bu öğrenme çeşidinde, yapay zekâ modeli daha doğru çıktılar oluşturabilmek için önceki görevlerden edinilmiş bilgileri kullanır. [4]

Kaynak
[1] Introducing ChatGPT. (2022, November 30). OpenAI. [2] Kerner, S. M. (2023, October 23). large language models (LLMs). Techtarget. [3] Patrizio, A. (2023, October 1). reinforcement learning from human feedback (RLHF). Techtarget. [4] Donges, N. (2022, September 12). What is transfer learning? Exploring the popular deep learning approach. Built In. [5] Ramlochan, S. (2023, October 12). What is Prompt Engineering? Prompt Engineering. [6] McKay, S. (2023, December 7). What is Prompt Engineering? Explanation With Examples | Master Data Skills + AI. Enterprisedna.
Başa dön tuşu