Bugün ChatGPT’nin, kendi deyimiyle, ilk doğum günü!
2023 için “Üretken Yapay Zekanın Yılı Oldu” desek yerinde olur.
Tam 1 yıl önce bugün OpenAI ChatGPT’yi erişime açtığında, sonrasında böylesine büyük bir dönüşüm dalgasının başlayacağını kendileri dahi beklemiyorlardı. Bunu hem kendi ifadelerinden biliyoruz hem de sistem 2 ay içinde 100 milyon kullanıcıya ulaştığı sırada hala berbat bir kullanıcı deneyimine ve performansa sahip olmasından anlayabiliyoruz 🙂
OpenAI Satış Direktörü Aliisa Rosenthal’in ChatGPT’nin erişime açılmasının birinci yıl dönümünde attığı twit:
“Bir yıl önce bu gece ekip bana Slack’ten, ‘fazla dikkat çekmeyecek ve araştırma amaçlı bir ön izleme‘yi sabaha erişime açıyoruz ama muhtemelen satış ekibini etkilemeyecektir demişti. İyi doğdun ChatGPT.“
GAN ve Transformer mekanizmaları sırasıyla 2014 ve 2017’de keşfedilmiş olsa da
Google’ın BERT ile kendi servislerine çağ atlatmaya başlaması 2018’e denk gelse de
GPT serisinin ilk versiyonu 2018’de, asıl ciddi aşamayı kaydeden GPT-3 ise 2020’de ortaya çıkmış olsa da baş döndürücü bir dönüşümü başlatan ChatGPT oldu.
Yapay Zeka Teknolojilerinin Demokratikleşmesi ve Domino Etkisi
Yapay Zeka teknolojilerinin daha önce görülmemiş bir hızla demokratikleşmesi ve herkesin erişimine uygun hale gelmesi bir domino etkisi yarattı. Bu domino etkisini yaratan en önemli faktör belki de ilk defa ChatGPT ile birlikte, ortalama insanın da Yapay Zeka’dan nasıl faydalanabileceğini kendi kendine keşfedebilmesi idi. Milyonlarca insan eş zamanlı olarak, yeteneklerinin sınırları henüz netleşmemiş bir modelle etkileşime girdi. Bunun nihayetinde hem kamuoyu nezdindeki Yapay Zeka algısı hem de bu sistemleri geliştiren insanların vizyon ve ufku kalıcı biçimde değişti. Ardı ardına keşfedilen kullanım senaryoları, güvenlik için alınan tüm önlemlerin 30 gün içerisinde boşa düşürülmesi, farklı yeteneklerle bu dil modellerinin bir arada düşünülmesi fikri gibi, teknoloji dünyasının seyrini önemli ölçüde etkileyecek pek çok olay gerçekleşti. Tüm bunları mümkün kılan ise “son teknoloji” modellerin yalnızca az sayıdaki insanın denemesi için sınırlandırılması pratiğinin terk edilmesi oldu.
2023: Üretken Yapay Zeka Yılına Genel Bir Bakış
Daha şimdiden 30.11.2022 tarihinin, teknoloji tarihi yazımında önemli bir milat olarak kayıtlara geçeceğine dair pek çok uzman hem fikir. Peki bu tarihte ChatGPT’nin erişime açılmasıyla başlayan değişim dalgasında hangi dominolar devrildi?
Böylesi bir liste her okuyucuyu sıkacak kadar uzun olurdu doğrusu. Zira, şaşırtıcı derecede fazla “önemli gelişme” yaşandı. O yüzden dil modelleri parantezine alarak, bu yaşadığımız sıradaşı yılı en iyi özetleyen olayları şöyle derleyebiliriz:
Üretken Yapay Zeka’nın yeteneklerini yüz milyondan fazla kişi denemeye başlayınca, bu teknolojinin sahip olduğu potansiyelin düşünülenden çok daha fazla olduğu fark edildi. Akıl akıldan üstündür. İnsanlar inanılmaz yaratıcı kullanım senaryoları keşfetmeye başladılar. Üstelik kullandıkları şey doğru düzgün bir ürünleşme sürecinden bile geçmemiş, prototipten hallice bir sohbet ekranıydı. Bu gelişme, dil modellerinin de “metin tamamlama” yaklaşımından” sohbetvari etkileşim” (conversational agents) yaklaşımına doğru yönünü değiştirmesini sağladı.
Önce özel sektör harekete geçti. Yalnızca 3-4 ay içerisinde Üretken Yapay Zeka çalışan irili ufaklı binlerce start-up ortaya çıkıverdi. Bu döneme “Üretken Yapay Zekanın Kambriyen Patlaması” deniyor 🙂 Zira, tıpkı fosil kayıtlarında bir anda milyonlarca türün görünmeye başladığı gibi çok sayıda girişimci ve hizmet sağlayıcı ortaya çıkıverdi. Bunu daha hızlandıracak şekilde milyonlarca dolar yatırım sermayesi bu yeni sahaya akmaya başladı.
OpenAI ve dolayısıyla Microsoft bu yeni sahada “amiral gemisi” statüsüne sahip işler çıkardı ve 1 yıl boyunca bu liderlik pozisyonlarını korumayı başardılar. Biraz panikle ve aceleye getirilmiş şekilde Google’ın PaLM, Bard ve PaLM 2 hamleleri beklenen etkiyi yaratmadı. OpenAI servisleri hızla “endüstri standardı” haline geldi.
Yeni nesil yapay zekanın insanlarla doğrudan etkileşime girebiliyor olması, sosyal hayata etkileri açısından çarpıcı örnekler yarattı. Başta Avrupa Birliği olmak üzere politika yapıcılar ve devletler yapay zeka ile ilgili harekete geçmek zorunda kaldılar.
Anthropic’in Claude modeli ve bunu hizmete sunduğu sohbet ara yüzü, bu devrimi başlatan ChatGPT’ye karşı en ciddi rakip olarak ortaya çıktı. Google’ın Bard hamlesi ile birlikte bir rekabet ortamı yarattılar. Her ne kadar bu iki platformun kullandığı modeller GPT serisinin gerisinde kalsa da yarattıkları rekabet ortamı OpenAI’ı hiç beklenmedik bir anda GPT-4’ü çıkarmaya zorladı. Ayrıca ChatGPT’nin UX ve ekosistem desteğini kayda değer ölçüde iyileştirildi çünkü artık alternatifler vardı. Rekabet her zaman iyidir.
ChatGPT’nin dünyayla buluşmasında yalnızca 3 gün önce, kendi dil modelleri olan Galactica ile büyük bir fiyasko yaşayan Meta (Facebook) cephesi ise çok ilginç ve akıllıca bir politika benimseyerek tüm kartlarını açık kaynak üzerine oynadı. İlk ciddi ölçekli açık kaynak dil modeli olan Llama’nın ağırlıkları önce “sızdırıldı”. Daha sonra Llama 2 ise resmi olarak tüm dünyayla paylaşıldı. Llama serisi ve bunların üzerine bağımsız geliştiricilerin açık kaynak olarak yaptığı iyileştirmeler beklentilerin çok ötesinde sonuçlar verdi. OpenAI, Google, Amazon gibi devleri daha da hızlanmaya iten gelişmelerden biri de açık kaynak dil modellerinin gösterdiği bu yüksek ivmeli gelişim oldu.
1 yıl önce gezegende pek az kişinin varlığından haberdar olduğu büyük dil modelleri, artık güncel teknoloji magazininin ayrılmaz bir parçası. Öyle ki yalnızca 1 yıl içerisinde 100’den fazla model ve model varyantı hizmete sunuldu. Geride kalan bir senenin ardından daha şimdiden devasa bir üretken yapay zeka literatürü ve literatürün uygulamalarına dayanan global ölçekli bir ekosistem ortaya çıktı.
Geçen bu süre zarfında yazılım tabanlı hizmetler sunan bütün büyük oyuncular servislerini yapay zeka ile güçlendirmeyi ajandalarının en üst sırasına aldılar ve henüz ikinci aydan itibaren Microsoft, Google, Adobe, Canva, Salesforce, Bloomberg, Amazon, Linkedin vb neredeyse bütün büyük oyuncular yeni nesil yapay zeka kabiliyetlerini duyurmaya, test etmeye hatta kullanıma sunmaya başladılar. Bunu orta ve küçük düzeyli servisler takip etti.
ChatGPT’nin yarattığı ilgi dalgası yalnızca yatırımcıları, politikacıları ve son kullancıyı etkilemedi elbette. Çok sayıda nitelikli insan ve kuruluş enerjilerini üretken yapay zeka sahasına yoğunlaştırmaya başladı. Yeni oyuncularla birlikte benzeri görülmemiş bir dinamizm kazanan bu ekosistem, her gün yeni bir aracın, her hafta yeni bir model varyantının, her hafta yeni bir kullanım senaryosunun gündeme geldiği sıra dışı bir atmosfere sahip oldu.
Üretken yapay zeka dalgası da her trend gibi bir noktada belirli bir doygunluğa ulaştı. Ulaştı ulaşmasına ancak özellikle yılın son 2 çeyreğindeki yeni gelişmeler kamuoyu ilgisini bir kez daha tazeledi. OpenAI’ın yine bir Kasım ayında duyurduğu yenilikler “her şeyin daha yeni başladığı” kanaatini güçlendirdi. Gelişmiş bir dil modelini bilgisayarlı görü, görsel sentezi, ses sentezi, çok formlu girdi, retrieval gibi yeteneklerle bir araya getirdiğimizde yapabileceklerimiz bambaşka bir boyuta geçiyor. Ve biz buradaki potansiyelin henüz sadece üst katmanlarını keşfetmekteyiz.
Hugging Face, Replicate, Streamlit gibi yeni platformlar yeni birer “GitHub” olma yolunda büyük aşama kaydetti. Hugging Face’de açık kaynak olarak paylaşılan binlerce üretken yapay zeka projesinin varlığı, bağımsız geliştiricilerin de bu oyunda söyleyecek büyük sözü olduğunu ispatlar nitelikte.
Öte yandan, modellerin halüsinasyon adı verilen zaafları veya dil yeteneklerinin kötüye kullanımıyla dezenformasyonun yayılma hızının artması, etik dışı davranış ve söylemler üretilebilmesi, fikri mülkiyet haklarının yeni durumda nasıl ele alınacağı gibi temel sorunların hiçbiri geçen 1 yıl içine çözüme kavuşturulamadı.
2024: Bizi Neler Bekliyor?
Geleceği kestirmek daima güçtür. Hele bir de konu üretken yapay zeka olduğunda 3 ay sonrasını kestirmek dahi güç. Yine de bazı trendler görünür olmuş durumda. Bana göre 2024’te üretken yapay zeka tarafında en çok aşağıdaki konuları konuşuyor/bekliyor olacağız:
- 1) Google’ın çok beklenen Gemini Hamlesi: Gemini modeli erişime açılacak mı? Kimler erişebilecek? Gerçekten iddia edildiği gibi GPT-4’ü tahtından edebilecek kadar iyi mi?
- 2) GPT-5: OpenAI’da geçtiğimiz günlerde yaşanan yönetsel krize kadar, yakında vadede GPT-5’in eğitilmesiyle ilgili bir plan olmadığı havası hakimdi. Ancak bu yeni durumda 2024 içinde GPT-5’in gelilştirilmesi için adımlar gelirse eskisi kadar sürpriz olmayacaktır. Özellikle de Gemini gerçekten söylentilerde bahsedildiği kadar iyiyse, OpenAI mutlaka bir karşılık vermek zorunda hissedecektir.
- 3) Generative Video: Bu yılın sonuna saklanan güzel sürprizlerle gördük ki üretken yapay zeka modelleriyle prodüksiyonlarda kullanılabilecek kalitede video sentezlenebilmesi giderek daha yakın bir hedefe dönüşüyor. RunwayML Gen-2’nin aldığı son güncelleme, Pikalabs’ın yeni yayınladığı örnekler ve elbette açık kaynak bir tarafında ilerleyen Stable Video Diffusion ile SD XL Turbo – Instant Generation erken demoları büyük bir beklenti yarattı. Önümüzdeki yıl video üretimiyle ilgili daha yetenekli modeller ve araçlara erişmiş olacağız.
- 4) GPT-4’ün dil modelleri tarafındaki liderlik konumuna benzer şekilde görsel üretimi alanında tartışmasız lider olarak görülen Midjourney’den artık beklenen hamlenin gelecek yıl gerçekleşeceğini düşünüyorum. Zira, DALL-E 3’ün dil modeliyle birlikte sohbetvari bir etkileşimle görsel üretme senaryosu, Midjourney’nin tahtını hissedilir biçime salladı. Görsle kalitesi olarak halen MJ önde görünse de MJ ile görsel üretirken harcamak zorunda kalınan efor ve hala bir API ile başka programlar tarafından kullanımına izin verilmemesi artık daha da çok göze batan bir dezavantaj. DALL-E 3 ve GPT-4 iş birliği ile görsel üretme süreci gerçek hayat senaryolarında çok daha uygun. Lider konumunu kaybetmemek için Midjourney ekibinin hem MJ Version 6 hem de web ara yüzü / API hamleleri yapacağını düşünüyorum.
- 5) Retrieval Augmented Generation ya da kısaca RAG kavramı üretken yapay zeka geliştiricilerinin temel uğraş alanına dönüştü. Daha şimdiden onlarca farklı yaklaşım ve teknik kayıtlara geçti. Önümüzdeki yıl bu konuda hem akademik hem de pratik çalışmalarının sayısında büyük bir artış göreceğimizi ve yapay zeka modellerinin kısa süreli belleğini genişletme maceramızda önemli aşama kaydedeceğimizi düşünüyorum.
- 6) AutoGPT, BabyGPT, Autogen ve bunlarla birlikte MemGPT kullanımı gibi pratiklerle keşfedilmeye başlayanan otonom ajan konsepti önerimi artıracak diye düşünüyorum. Multi-agent senaryoları ve otonom ajanların diğer araçları kullanmaları noktasında yeni framework’ler ve başarılı gerçek hayat örnekleri ortaya çıkacaktır. Modellerin tam anlamıyla “ürünleşebilmesi” için otonom kabiliyetlerin artması kritik bir öneme sahip.
- 7) OpenAI veya benzeri servislerin henüz yeni ölçeklenen sistem alt yapıları sıklıkla çökmekte ya da yüksek trafik altında performans düşüşleri yaşamakta. Buna ek olarak, bu tür servisleri abonelik bazlı olarak kullanma önemli maliyetler doğurmakta ve ölçeklenmelerini zorlaştırmakta. Ayrıca bulut tabanlı bu servislere gizli ya da hassas bilgilerin emanet edilememesi de uygulama sahasını daraltmakta. Tüm bunların üzerine özellikle son zamanlarda artık iyice netleşen bir diğer dezavantaj daha ortaya çıktı. Modelleri sağlayan kurumların bazen güvenlik sınırlamaları için aktif modellerde yaptıkları değişiklikler modellerin yeteneklerini her geçen gün budamakta. Bu da ürünleşme sürecinde büyük bir öngörülemezlik yaratmakta. Bunların doğal sonucu olarak 2024’te yerelde hizmete sunulabilen modeller üzerine daha fazla eğilecekler. LM Studio, Ollama gibi erken çerçevelerin gelişeceği ve yenilerin ortaya çıkacağı bir yıl bekliyorum.
- 8) Son olarak da eğitim sahasında yapay zeka ile ilgili genel beklentimi paylaşarak bitirmek istiyorum. Bence eğitim camiasında bu konuya dair hem heves/ilgi hem de kafa karışıklığı bir müddet daha devam edecek. Üretken yapay zekanın eğitimde kullanımı yaygınlaşacak ama bir “tam kabul” durumunun 2024 içerisinde mümkün olacağını düşünmüyorum. Bu süreçte “personal tutor”, “item pool generation”, “case-based scneario/role play” ve “course-based RAG” bence öne çıkan iş modelleri olacak.
Bu İçeriği Paylaş: