OpenAI’ın Yapay Zekâyla Video Üreten Modeli Sora, Beklentilerin Ne Kadar Önemli Olduğunu Bir Kez Daha Hatırlattı

Geçtiğimiz haftalarda, OpenAI’ın CEO’su Sam Altman, OpenAI’ın metin komutuyla 60 saniyeye kadar fotoğraf gerçekçiliğinde video üretebilen Sora adında yeni bir ürün geliştirdiğini duyurmuştu. Hatırlarsanız şirket, Sora’nın hazırladığını söylediği bir dizi video yayınlamıştı. Ve gerçekten de hepimizin dibi düşmüştü.Şimdiye kadar üretken yapay zekâyla girdiğimiz etkileşim kısıtlıydı. ChatGPT veya Google’ın Gemini’ı gibi ürünler aracılığıyla yapay zekâ deneyimine nail olmuştuk. Bildiğiniz üzere bu sistemler, kullanıcıların bir komuta metin girmesine ve karşılık olarak bir metin yanıtı almasına olanak tanıyor. Çok da hafife almayayım sizi. Belki Dall-E veya Midjourney gibi araçları kullanarak görüntüler oluşturdunuz.Fakat video yapmak, bariz nedenlerden dolayı çözülmesi çok daha karmaşık bir sorun. Bu yüzden OpenAI’ın şimdiye kadar Sora’yla ortaya çıkardığı şeyler gerçekten şaşırtıcı. Bu videonun oluşturulması için verilen komutsa şöyle: “Beyazlara bürünmüş o güzel Tokyo’da insanları günlük hayatın telaşı içinde görüyoruz.. Kamera, güzel karlı havanın tadını çıkaran ve çevredeki dükkânlardan alışveriş yapan birkaç kişinin arkasından çekim yapıyor ve onlar yürüdükçe, şehrin hareketli caddesinde ilerliyor. Muhteşem sakura yaprakları kar taneleriyle birlikte rüzgârda uçuşuyor.”Şirketin yayınladığı videolarla yetinmeyen Altman da X’te kullanıcılardan aldığı komutlarla oluşturduğu videoları paylaşıp durdu. Kelimeleri bir tarayıcıya yazdığınızda bilgisayarın size 60 saniyelik fotoğraf gerçekçiliğinde bir video vereceği fikri akıllara durgunluk verici, değil mi? Ancak dikkatinizi önemli bir noktaya çekmek istiyorum. Bunlar oldukça kontrollü demolar. OpenAI dışında hiç kimse Sora’nın yeteneklerini test etmek için komut giremiyor. Demolar hakkında bilgilendirilen gazetecilerin bile deneme yapmalarına izin verilmedi. Bunun nedenini tahmin etmek basit tabii. Muhtemelen Sora, henüz iyi sonuçları tutarlı bir şekilde üretecek seviyeye gelemedi.Altman’ın X’ten aldığı kullanıcı komutlarıyla hazırladığı örnekler bile özenle seçilmiş.Şimdi burada ele alınması gereken iki önemli konu var. İlki, bu durumun yapay zekâ için yepyeni bir cephe yarattığını kabul etmemiz gerektiği. Sora’nın yüzde yüz yapamasa da bu sonuçları üretebilmesi bir yandan çok ilgi çekiciyken diğer yandan da endişe verici. OpenAI, güvenlikten sorumlu uzmanlarının Sora’ya sınır ve kısıtlamalar getirmesine olanak tanıdığını söylüyor. Muhtemelen bu durumun sebebi, ABD’nin çok tartışmalı geçecek bir başkanlık seçimi dönemine girmesinden kaynaklıyor. Herhalde Altman da Kongre’nin karşısına çıkıp OpenAI’ın ürünlerinin seçim sonucunu etkilemek için kullanılmasında şirketin bir suçunun olmadığını açıklamak istemez. Diğer husussa Sora’ya dair cevaplanmayan pek çok soru var. Mesela bu videoların oluşturulması ne kadar sürüyor? Saatler mi? Sora, şirketin demolarda gösterdiği sonuçları üretme konusunda ne kadar tutarlı? Ve belki de daha da önemlisi, OpenAI, Sora’nın ürettiği bu videolar aracılığıyla yayılacak yanlış bilgiyle nasıl mücadele edecek? Ya da bu videoların insanları suistimal etmek için kullanılmasını nasıl önleyecek?Ayan beyan ortada olan bir soru daha var. OpenAI, Sora’yı eğitmek için ne kullanıyor? Projenin eş başkanlarından Bill Peebles, Wired’a yaptığı açıklamada “Sora’yı hem lisansladığımız hem de kamuya açık içerikten aldığımız eğitim verileriyle geliştiriyoruz.” dedi. Fakat “kamuya açık içeriğin” ne anlama geldiğini veya internette olup da telif hakkıyla korunan materyali içerip içermediğini söylemedi.Eminim çoğunuz haklı olarak telif hakkı ihlâli ve yanlış bilgilendirme konusuna takılacaksınız. Bana kalırsa ikinci sorun, çok daha ilginç. En azından OpenAI’ın vaat ettiği potansiyel açısından. Üretken yapay zekânın detayları doğru şekilde yakalama konusunda oldukça kötü olduğu biliniyor. Tabii, ChatGPT’ye veya Google’ın Gemini’ına bir şeyler yazıyorsanız… Her ikisi de gerçeklikle hiçbir ilişkisi olmayan şeyler uyduruyor. Aynı durum fotoğraflar ve artık videolar için de geçerli olacak gibi görünüyor.Paylaşılan örneklerden birinde yaşlı bir kadının doğum günü için hazırlanan bir pasta ve etrafında onu alkışlayan kişiler vardı, hatırladınız mı? Videodaki kadınlardan biri aslında alkışlamıyor. Parmakları sanki kemiksizmiş gibi anormal bir şekilde hareket ediyor. İlk başta gözünüzden kaçabilir ama bir kere fark ettikten sonra artık bu detayı göz ardı edemiyorsunuz.Sora’yı kusurlarından dolayı eleştirmiyorum. Henüz bir ürün olarak piyasada bile yok. Fakat neler yaptığını düşündüğünüzde şu ana kadar elde edilen sonuçlar gerçekten inanılmaz. OpenAI’ın yayınladığı videolarla bir beklenti yarattığını düşünüyorum. Bakalım verdiği sözü yerine getirebilecek mi? Bu durum yalnızca OpenAI’ya özgü değil tabii. Neredeyse her çıkan yeni ürün bu soruları beraberinde getirir. Şirket, ürününün en iyi yanlarını göstermek için çok kontrollü demolar sunar. Bu yaklaşım mantıklı, ama bitmiş ürün her zaman bu beklentileri karşılamayabilir. Bu yüzden her daim hayal kırıklığı yaşama riski var.Mesela Apple’ın Vision Pro’su gerçekten dikkât çekici bir örnek. Haziran ayında Apple’ın geliştirici konferansı WWDC’de bu cihazı deneme fırsatı buldum. Performansı beni gerçekten etkiledi. Ancak bu izlenim, sadece 30 dakikalık bir deneyim sonrası oluştu. Tabii ki bu deneyimde Apple’ın görmemizi istediği kadarını görebildik.Şimdilerde Vision Pro herkesin kullanımına açıldığından insanlar ürünün sınırlarını zorluyor ve beklentileri karşılamadığı noktaları buluyor. Elbette, Vision Pro hâlâ harika bir teknoloji. Ama artık kimse cihazın ne kadar etkileyici olduğundan bahsetmiyor. Günlük hayatta pek işlerine yaramadığını, hatta hiç kullanışlı olmadığını söylüyorlar. Ve bu yüzden cihazı topluca iade etmek istiyorlar.Bunları neden anlattım diye düşünüyorsunuz tabii. Buradan çıkarılacak ders oldukça basit. Beklentilerinizi çok yüksek tutmamaya çalışın. OpenAI’ın Sora’sının ne kadar etkileyici olduğunu göstermek istemesi şaşırtıcı olmasa da 100 milyon kullanıcının eline geçtiğinde deneyimleri son derece farklı olacak. Eğer bu deneyim vaatlerini yerine getirmezse, çok sayıda kullanıcı hayal kırıklığına uğrayacak. Orijinal yayın tarihi: 16 Şubat 2024Köşe yazarları tarafından burada paylaşılan görüşler, incturkiye.com’a değil, yazara aittir.Çok daha fazlası için Inc. Türkiye bültenlerine kaydolun.(*) Bu yazının çevirisinde Türk okura hitap etmek için birtakım değişiklikler yapılmıştır.