HOŞGELDİNİZ!

Birlikte öğrenelim. Birbirimizden öğrenelim.

EYZ

Kariyerimin temelini oluşturan 3 ana sütunla ilgili paylaşımlar yapıyor olacağım:

Eğitim

Retorikte çok önemli pratikte ilk feda edilen kaynakların sahibi; herkesin neyin yanlış olduğunu bildiği ama neyin doğru olduğuna dair pek az kişinin somut bir deneyime sahip olduğu; verilen emeklerin sonuçlarını tespit edebilmek için gereken o uzun sürenin asla tanınmadığı; bir garip mesele...

Yazılım

Her eve lazım ama biraz da neme lazım gözüyle bakılan, dünyanın en mekanik süreçlerinden birine dayanıyor olmasına rağmen daima sihibazlık performansı beklenen, üretmenin hazzını ve sandalyede otururken büyük problemler çözülebileceği gerçeğini yaşamayı mümkün kılan, deli işi, akıl işi, sabır işi...

Zihin

Varlığının delili bizzat kendisi olan yegane nesne, o nesneye yüklü; hepimizin bildiği hiçbirimizin tam olarak anlayamadığı, modelleyemediğimiz, kavrayamadığımız, merak etmekten geri duramadığımız, kabiliyetleri karşısında hayran kalma ve şaşkınlıklara gark olma meselesini bile bir tek kendisinin becerebildiği, evrendeki en enteresan fenomen...

YZ Üretimi Görseller Seçkisi

Bu kısımda, üretken yapay zeka modelleriyle üretilmiş görsel çalışmalar arasından kendi derlediğim örnekleri bulabilirsiniz.

Dikkate Değer Sözler

It's not man versus machine; it's man with machine versus man without. Data and intuition are like horse and rider, and you don't try to outrun a horse; you ride it.

Pedro Domingos - Professor of Computer Science, University of Washington

Blog

ChatGPT 1 Yaşında: Üretken Yapay Zeka Yılı

Bugün ChatGPT’nin, kendi deyimiyle, ilk doğum günü!

2023 için “Üretken Yapay Zekanın Yılı Oldu” desek yerinde olur.

Tam 1 yıl önce bugün OpenAI ChatGPT’yi erişime açtığında, sonrasında böylesine büyük bir dönüşüm dalgasının başlayacağını kendileri dahi beklemiyorlardı. Bunu hem kendi ifadelerinden biliyoruz hem de sistem 2 ay içinde 100 milyon kullanıcıya ulaştığı sırada hala berbat bir kullanıcı deneyimine ve performansa sahip olmasından anlayabiliyoruz 🙂

OpenAI Satış Direktörü Aliisa Rosenthal’in ChatGPT’nin erişime açılmasının birinci yıl dönümünde attığı twit:

Bir yıl önce bu gece ekip bana Slack’ten, ‘fazla dikkat çekmeyecek ve araştırma amaçlı bir ön izleme‘yi sabaha erişime açıyoruz ama muhtemelen satış ekibini etkilemeyecektir demişti. İyi doğdun ChatGPT.

GAN ve Transformer mekanizmaları sırasıyla 2014 ve 2017’de keşfedilmiş olsa da
Google’ın BERT ile kendi servislerine çağ atlatmaya başlaması 2018’e denk gelse de
GPT serisinin ilk versiyonu 2018’de, asıl ciddi aşamayı kaydeden GPT-3 ise 2020’de ortaya çıkmış olsa da baş döndürücü bir dönüşümü başlatan ChatGPT oldu.

Yapay Zeka Teknolojilerinin Demokratikleşmesi ve Domino Etkisi

Yapay Zeka teknolojilerinin daha önce görülmemiş bir hızla demokratikleşmesi ve herkesin erişimine uygun hale gelmesi bir domino etkisi yarattı. Bu domino etkisini yaratan en önemli faktör belki de ilk defa ChatGPT ile birlikte, ortalama insanın da Yapay Zeka’dan nasıl faydalanabileceğini kendi kendine keşfedebilmesi idi. Milyonlarca insan eş zamanlı olarak, yeteneklerinin sınırları henüz netleşmemiş bir modelle etkileşime girdi. Bunun nihayetinde hem kamuoyu nezdindeki Yapay Zeka algısı hem de bu sistemleri geliştiren insanların vizyon ve ufku kalıcı biçimde değişti. Ardı ardına keşfedilen kullanım senaryoları, güvenlik için alınan tüm önlemlerin 30 gün içerisinde boşa düşürülmesi, farklı yeteneklerle bu dil modellerinin bir arada düşünülmesi fikri gibi, teknoloji dünyasının seyrini önemli ölçüde etkileyecek pek çok olay gerçekleşti. Tüm bunları mümkün kılan ise “son teknoloji” modellerin yalnızca az sayıdaki insanın denemesi için sınırlandırılması pratiğinin terk edilmesi oldu.

2023: Üretken Yapay Zeka Yılına Genel Bir Bakış

Daha şimdiden 30.11.2022 tarihinin, teknoloji tarihi yazımında önemli bir milat olarak kayıtlara geçeceğine dair pek çok uzman hem fikir. Peki bu tarihte ChatGPT’nin erişime açılmasıyla başlayan değişim dalgasında hangi dominolar devrildi?

Böylesi bir liste her okuyucuyu sıkacak kadar uzun olurdu doğrusu. Zira, şaşırtıcı derecede fazla “önemli gelişme” yaşandı. O yüzden dil modelleri parantezine alarak, bu yaşadığımız sıradaşı yılı en iyi özetleyen olayları şöyle derleyebiliriz:


Üretken Yapay Zeka’nın yeteneklerini yüz milyondan fazla kişi denemeye başlayınca, bu teknolojinin sahip olduğu potansiyelin düşünülenden çok daha fazla olduğu fark edildi. Akıl akıldan üstündür. İnsanlar inanılmaz yaratıcı kullanım senaryoları keşfetmeye başladılar. Üstelik kullandıkları şey doğru düzgün bir ürünleşme sürecinden bile geçmemiş, prototipten hallice bir sohbet ekranıydı. Bu gelişme, dil modellerinin de “metin tamamlama” yaklaşımından” sohbetvari etkileşim” (conversational agents) yaklaşımına doğru yönünü değiştirmesini sağladı.


Önce özel sektör harekete geçti. Yalnızca 3-4 ay içerisinde Üretken Yapay Zeka çalışan irili ufaklı binlerce start-up ortaya çıkıverdi. Bu döneme “Üretken Yapay Zekanın Kambriyen Patlaması” deniyor 🙂 Zira, tıpkı fosil kayıtlarında bir anda milyonlarca türün görünmeye başladığı gibi çok sayıda girişimci ve hizmet sağlayıcı ortaya çıkıverdi. Bunu daha hızlandıracak şekilde milyonlarca dolar yatırım sermayesi bu yeni sahaya akmaya başladı.


OpenAI ve dolayısıyla Microsoft bu yeni sahada “amiral gemisi” statüsüne sahip işler çıkardı ve 1 yıl boyunca bu liderlik pozisyonlarını korumayı başardılar. Biraz panikle ve aceleye getirilmiş şekilde Google’ın PaLM, Bard ve PaLM 2 hamleleri beklenen etkiyi yaratmadı. OpenAI servisleri hızla “endüstri standardı” haline geldi.


Yeni nesil yapay zekanın insanlarla doğrudan etkileşime girebiliyor olması, sosyal hayata etkileri açısından çarpıcı örnekler yarattı. Başta Avrupa Birliği olmak üzere politika yapıcılar ve devletler yapay zeka ile ilgili harekete geçmek zorunda kaldılar.


Anthropic’in Claude modeli ve bunu hizmete sunduğu sohbet ara yüzü, bu devrimi başlatan ChatGPT’ye karşı en ciddi rakip olarak ortaya çıktı. Google’ın Bard hamlesi ile birlikte bir rekabet ortamı yarattılar. Her ne kadar bu iki platformun kullandığı modeller GPT serisinin gerisinde kalsa da yarattıkları rekabet ortamı OpenAI’ı hiç beklenmedik bir anda GPT-4’ü çıkarmaya zorladı. Ayrıca ChatGPT’nin UX ve ekosistem desteğini kayda değer ölçüde iyileştirildi çünkü artık alternatifler vardı. Rekabet her zaman iyidir.


ChatGPT’nin dünyayla buluşmasında yalnızca 3 gün önce, kendi dil modelleri olan Galactica ile büyük bir fiyasko yaşayan Meta (Facebook) cephesi ise çok ilginç ve akıllıca bir politika benimseyerek tüm kartlarını açık kaynak üzerine oynadı. İlk ciddi ölçekli açık kaynak dil modeli olan Llama’nın ağırlıkları önce “sızdırıldı”. Daha sonra Llama 2 ise resmi olarak tüm dünyayla paylaşıldı. Llama serisi ve bunların üzerine bağımsız geliştiricilerin açık kaynak olarak yaptığı iyileştirmeler beklentilerin çok ötesinde sonuçlar verdi. OpenAI, Google, Amazon gibi devleri daha da hızlanmaya iten gelişmelerden biri de açık kaynak dil modellerinin gösterdiği bu yüksek ivmeli gelişim oldu.


1 yıl önce gezegende pek az kişinin varlığından haberdar olduğu büyük dil modelleri, artık güncel teknoloji magazininin ayrılmaz bir parçası. Öyle ki yalnızca 1 yıl içerisinde 100’den fazla model ve model varyantı hizmete sunuldu. Geride kalan bir senenin ardından daha şimdiden devasa bir üretken yapay zeka literatürü ve literatürün uygulamalarına dayanan global ölçekli bir ekosistem ortaya çıktı.


Geçen bu süre zarfında yazılım tabanlı hizmetler sunan bütün büyük oyuncular servislerini yapay zeka ile güçlendirmeyi ajandalarının en üst sırasına aldılar ve henüz ikinci aydan itibaren Microsoft, Google, Adobe, Canva, Salesforce, Bloomberg, Amazon, Linkedin vb neredeyse bütün büyük oyuncular yeni nesil yapay zeka kabiliyetlerini duyurmaya, test etmeye hatta kullanıma sunmaya başladılar. Bunu orta ve küçük düzeyli servisler takip etti.


ChatGPT’nin yarattığı ilgi dalgası yalnızca yatırımcıları, politikacıları ve son kullancıyı etkilemedi elbette. Çok sayıda nitelikli insan ve kuruluş enerjilerini üretken yapay zeka sahasına yoğunlaştırmaya başladı. Yeni oyuncularla birlikte benzeri görülmemiş bir dinamizm kazanan bu ekosistem, her gün yeni bir aracın, her hafta yeni bir model varyantının, her hafta yeni bir kullanım senaryosunun gündeme geldiği sıra dışı bir atmosfere sahip oldu.


Üretken yapay zeka dalgası da her trend gibi bir noktada belirli bir doygunluğa ulaştı. Ulaştı ulaşmasına ancak özellikle yılın son 2 çeyreğindeki yeni gelişmeler kamuoyu ilgisini bir kez daha tazeledi. OpenAI’ın yine bir Kasım ayında duyurduğu yenilikler “her şeyin daha yeni başladığı” kanaatini güçlendirdi. Gelişmiş bir dil modelini bilgisayarlı görü, görsel sentezi, ses sentezi, çok formlu girdi, retrieval gibi yeteneklerle bir araya getirdiğimizde yapabileceklerimiz bambaşka bir boyuta geçiyor. Ve biz buradaki potansiyelin henüz sadece üst katmanlarını keşfetmekteyiz.


Hugging Face, Replicate, Streamlit gibi yeni platformlar yeni birer “GitHub” olma yolunda büyük aşama kaydetti. Hugging Face’de açık kaynak olarak paylaşılan binlerce üretken yapay zeka projesinin varlığı, bağımsız geliştiricilerin de bu oyunda söyleyecek büyük sözü olduğunu ispatlar nitelikte.


Öte yandan, modellerin halüsinasyon adı verilen zaafları veya dil yeteneklerinin kötüye kullanımıyla dezenformasyonun yayılma hızının artması, etik dışı davranış ve söylemler üretilebilmesi, fikri mülkiyet haklarının yeni durumda nasıl ele alınacağı gibi temel sorunların hiçbiri geçen 1 yıl içine çözüme kavuşturulamadı.

2024: Bizi Neler Bekliyor?

Geleceği kestirmek daima güçtür. Hele bir de konu üretken yapay zeka olduğunda 3 ay sonrasını kestirmek dahi güç. Yine de bazı trendler görünür olmuş durumda. Bana göre 2024’te üretken yapay zeka tarafında en çok aşağıdaki konuları konuşuyor/bekliyor olacağız:

  • 1) Google’ın çok beklenen Gemini Hamlesi: Gemini modeli erişime açılacak mı? Kimler erişebilecek? Gerçekten iddia edildiği gibi GPT-4’ü tahtından edebilecek kadar iyi mi?
  • 2) GPT-5: OpenAI’da geçtiğimiz günlerde yaşanan yönetsel krize kadar, yakında vadede GPT-5’in eğitilmesiyle ilgili bir plan olmadığı havası hakimdi. Ancak bu yeni durumda 2024 içinde GPT-5’in gelilştirilmesi için adımlar gelirse eskisi kadar sürpriz olmayacaktır. Özellikle de Gemini gerçekten söylentilerde bahsedildiği kadar iyiyse, OpenAI mutlaka bir karşılık vermek zorunda hissedecektir.
  • 3) Generative Video: Bu yılın sonuna saklanan güzel sürprizlerle gördük ki üretken yapay zeka modelleriyle prodüksiyonlarda kullanılabilecek kalitede video sentezlenebilmesi giderek daha yakın bir hedefe dönüşüyor. RunwayML Gen-2’nin aldığı son güncelleme, Pikalabs’ın yeni yayınladığı örnekler ve elbette açık kaynak bir tarafında ilerleyen Stable Video Diffusion ile SD XL Turbo – Instant Generation erken demoları büyük bir beklenti yarattı. Önümüzdeki yıl video üretimiyle ilgili daha yetenekli modeller ve araçlara erişmiş olacağız.
  • 4) GPT-4’ün dil modelleri tarafındaki liderlik konumuna benzer şekilde görsel üretimi alanında tartışmasız lider olarak görülen Midjourney’den artık beklenen hamlenin gelecek yıl gerçekleşeceğini düşünüyorum. Zira, DALL-E 3’ün dil modeliyle birlikte sohbetvari bir etkileşimle görsel üretme senaryosu, Midjourney’nin tahtını hissedilir biçime salladı. Görsle kalitesi olarak halen MJ önde görünse de MJ ile görsel üretirken harcamak zorunda kalınan efor ve hala bir API ile başka programlar tarafından kullanımına izin verilmemesi artık daha da çok göze batan bir dezavantaj. DALL-E 3 ve GPT-4 iş birliği ile görsel üretme süreci gerçek hayat senaryolarında çok daha uygun. Lider konumunu kaybetmemek için Midjourney ekibinin hem MJ Version 6 hem de web ara yüzü / API hamleleri yapacağını düşünüyorum.
  • 5) Retrieval Augmented Generation ya da kısaca RAG kavramı üretken yapay zeka geliştiricilerinin temel uğraş alanına dönüştü. Daha şimdiden onlarca farklı yaklaşım ve teknik kayıtlara geçti. Önümüzdeki yıl bu konuda hem akademik hem de pratik çalışmalarının sayısında büyük bir artış göreceğimizi ve yapay zeka modellerinin kısa süreli belleğini genişletme maceramızda önemli aşama kaydedeceğimizi düşünüyorum.
  • 6) AutoGPT, BabyGPT, Autogen ve bunlarla birlikte MemGPT kullanımı gibi pratiklerle keşfedilmeye başlayanan otonom ajan konsepti önerimi artıracak diye düşünüyorum. Multi-agent senaryoları ve otonom ajanların diğer araçları kullanmaları noktasında yeni framework’ler ve başarılı gerçek hayat örnekleri ortaya çıkacaktır. Modellerin tam anlamıyla “ürünleşebilmesi” için otonom kabiliyetlerin artması kritik bir öneme sahip.
  • 7) OpenAI veya benzeri servislerin henüz yeni ölçeklenen sistem alt yapıları sıklıkla çökmekte ya da yüksek trafik altında performans düşüşleri yaşamakta. Buna ek olarak, bu tür servisleri abonelik bazlı olarak kullanma önemli maliyetler doğurmakta ve ölçeklenmelerini zorlaştırmakta. Ayrıca bulut tabanlı bu servislere gizli ya da hassas bilgilerin emanet edilememesi de uygulama sahasını daraltmakta. Tüm bunların üzerine özellikle son zamanlarda artık iyice netleşen bir diğer dezavantaj daha ortaya çıktı. Modelleri sağlayan kurumların bazen güvenlik sınırlamaları için aktif modellerde yaptıkları değişiklikler modellerin yeteneklerini her geçen gün budamakta. Bu da ürünleşme sürecinde büyük bir öngörülemezlik yaratmakta. Bunların doğal sonucu olarak 2024’te yerelde hizmete sunulabilen modeller üzerine daha fazla eğilecekler. LM Studio, Ollama gibi erken çerçevelerin gelişeceği ve yenilerin ortaya çıkacağı bir yıl bekliyorum.
  • 8) Son olarak da eğitim sahasında yapay zeka ile ilgili genel beklentimi paylaşarak bitirmek istiyorum. Bence eğitim camiasında bu konuya dair hem heves/ilgi hem de kafa karışıklığı bir müddet daha devam edecek. Üretken yapay zekanın eğitimde kullanımı yaygınlaşacak ama bir “tam kabul” durumunun 2024 içerisinde mümkün olacağını düşünmüyorum. Bu süreçte “personal tutor”, “item pool generation”, “case-based scneario/role play” ve “course-based RAG” bence öne çıkan iş modelleri olacak.

GPT-4 Sonunda Karşımızda!

2022 yılı, özellikle de son çeyreği, Generative AI (Üretken Yapay Zeka) teknolojileri için baş döndürücü bir hızda geçti. Birbiri ardına yaşanan gelişmeler ve peş peşe görücüye çıkan birçok büyük yapay zeka modeli, yalnızca teknoloji dünyasını heyecanlandırmakla kalmadı kamuoyunun ilgisini de çekti. Aynı trend 2023 yılının ilk çeyreğinde de sürmekte. Görünen o ki bu fırtına bir süre daha dinmeyecek.

Bahsedecek çok fazla şey var;

metin girdilerinden görseller üretmenin standart bir aktiviteye dönüşmesi,

yapay zeka tarafından yazılan içeriklerin akademik türlerden kurgusal öykülere kadar her yana sirayet etmesi,

telif hakları davaları, yepyeni bir start-up ekosisteminin oluşmaya başlaması,

birçok popüler uygulamanın yeni nesil yapay zeka uygulamalarını platformlarına entegre etmesi, Microsoft’un önce arama motoru Bing’e GPT desteği getirmesi

daha sonra 10 milyar dolarlık devasa bir yatırımla GPT’nin yaratıcısı OpenAI ile arasındaki bağları güçlendirmesi,

Google’ın Microsoft’a yanıt niteliğinde apar topar görücüye çıkardığı Bard ile bir nevi “Devrim Arabaları” sendromu yaşaması,

Facebook’un Llama modelinin sızdırılarak kaçak yollardan edinilebilen ilk büyük dil modeli (LLM) olması, tüm bu ilgi dalgasının tetikleyicisi sayılabilecek ChatGPT’nin arkasındaki GPT 3.5 modelinin nihayet API olarak sunulması

Listeyi sayfalarca uzatmak mümkün.

Ama tüm bu olan biten içerisinde tartışmasız biçimde en fazla merakla beklenen şey, GPT-3 ile yeni bir iş modeli türünün oluşmasını sağlayan, GPT 3.5 ile üretken yapay zekayı tüm dünyanın konuştuğu bir şey haline getiren OpenAI’ın GPT-4 modelini ne zaman erişime açacağıydı. 2022 sonu ve 2023 başında yaptığım Generative AI seminerlerinde, bunun mutlaka 2023 yılı içerisinde olacağını, OpenAI erken davranmaya niyetli olmasa bile Google ve Facebook ile bunların büyük yatırımlar yaptıkları Deepmind, Antropic gibi şirketlerin, OpenAI’ın elde ettiği bu “öncü” konumu değiştirebilmek için hamle yapacaklarını ve kaçınılmaz olarak GPT-4’ün çok uzak olmayan bir tarihte kullanıma sunulacağını beklediğimden bahsetmiştim. Ama doğrusu, ben de bu kadar erken beklemiyordum.

Google PaLM API + MakerSuite for GenerativeAI

Tam da öngörüldüğü üzere, Google daha bugün PaLM API ve MakerSuite’i duyurmuştu. Böylece hem PaLM’ın API desteğiyle kullanımıyla birlikte GPT-3 ve GPT 3.5 modellerine rakip olması, hem Google’ın yapay zeka destekli uygulama geliştirmek isteyenler için yeni bir platformu devreye alarak oluşan yeni start-up’lara göz kırpması hem de büyük bir kullanıcı kitlesi bulunan Google Dokümanlara yapay zeka desteği geliyor olması tüm teknoloji meraklılarını heyecanlandırmıştı. Daha bu gelişmelerin potansiyeliyle ilgili Discord tartışmalarımızı bitirememiş hatta blog yazılarımızı bile tamamlayamamıştık ki aşağıdaki duyuru / e-posta ile heyecanımız iyice zirveye çıktı:


Konuşacak çok şey var. Çok daha fazlası olacak. Ancak şu an için eldeki bilgiler şöyle:

Benchmark değerlerine bakılacak olursa GPT-4 tam da beklenildiği gibi mevcut tüm modelleri geride bırakıyor:

GPT-4 ile birlikte GPT serisinin sınav karnesinde de gözle görülür bir iyileşme olmuş gibi duruyor:

OpenAI, tatlı bir sürpriz de yerleştirmiş GPT-4’ün teknik özelliklerini yayınladıkları makaleye. Makalenin biçimsel düzenini oluştururken GPT-4’ün kendisinden faydalanmışlar:

Bu ilginç göndermeyi işaretlerken elbette hemen üst satırda “Erol Can Akbaba” ismi de dikkatimi çekti. GPT-4 makalesinde kendim gibi bir Hacettepeli/ODTÜ’lüye rastlamak çok hoş tesadüf oldu. Sanırım kendisine şuradan ulaşmak mümkün.

GPT-4 ilk aşamada, ChatGPT’yi “Plus” tarifesinden ücretsiz olarak kullananların doğrudan erişimine açılıyor. API olarak kullanmak içinse artık alışık olduğumuz üzere bir bekleme listesine kaydolmamız gerek. Çok enteresan potansiyellerin kapısını aralayan bir yenilikse GPT-4 modelinin “multimodal” çalışacak olması. Yani hem metin hem resim girdileri alıp işleyebilecek.

Resmi duyuruya ve tanıtım videosuna buradan ulaşabilirsiniz. Pek çok önemli ilk bilgi burada yer alıyor.

Fakat şimdilik herkesin odaklandığı nokta, bu yazıyı kaleme aldığım şu sırada başlamış bulunan Canlı Yayın Demo. Bu gösterimi şuradan takip edebilirsiniz:

GPT-4 Official Live Demo