Geçen yıl kurulan bir yapay zeka (AI) girişimi Odyssey, ilk AI ürünü hakkında Pazartesi günü detaylar paylaştı. Şirket, Hollywood seviyesinde görsel efektler yaratabilecek bir AI video modeli geliştirdiğini açıkladı. Bu model, OpenAI’nin henüz piyasaya sürülmemiş Sora aracına benzer şekilde çalışacak.
Odyssey’nin kurucu ortaklarından biri, AI modelinin kullanıcıların çıktıyı ayrıntılı bir şekilde düzenlemesine ve kontrol etmesine olanak tanıyacağını belirtti. Ayrıca, bu modelin farklı katmanları oluşturmak için birden fazla büyük dil modeli (LLM) ile çalıştıklarını ve bu katmanların ayrı ayrı kontrol edilebileceğini ekledi.
Odyssey’nin AI Görsel Modeli Nasıl Çalışır?
Odyssey‘nin CEO’su ve Kurucu Ortağı Oliver Cameron, X (eski adıyla Twitter) üzerinde yaptığı bir dizi paylaşımda, girişimin Google Ventures tarafından yönetilen 9 milyon dolarlık (yaklaşık 75.1 crore Rs) tohum finansmanı aldığını ve kullanıcıların yüksek kaliteli videoları özelleştirebileceği ve düzenleyebileceği bir araç geliştirdiklerini açıkladı. Cameron, Odyssey AI teknolojisinin “Hollywood seviyesi” video üretmek için tasarlandığını belirtti. Şirket, kullanıcıların görsel hikaye anlatımının temel katmanlarını tamamen kontrol etmelerine olanak tanıyacak dört jeneratif modeli eğittiklerini iddia ediyor.
Cameron, mevcut AI metin-video modellerindeki sorunları vurguladı; bu modellerde çıktı üzerinde kontrol veya düzenleme yapma seçeneklerinin eksik olduğunu belirtti. “Bir hikaye anlatıcısı olarak, çevrenizi veya karakterlerinizi yönetme ya da çekiminizin ince detayları üzerinde çalışarak mükemmelleştirme şansınız neredeyse yok. Daha güçlü modellere ihtiyaç var.” dedi.
Çok Katmanlı Yapı: Geometri, Malzemeler, Aydınlatma ve Hareket
Bu sorunu çözmek için, şirket bir bileşik video oluşturacak tek bir katmanı üreten birden fazla AI modeli kullanıyor. Cameron’a göre, dört model bağımsız olarak geometri, malzemeler, aydınlatma ve hareketi üretecek. Bu dört katman, tek bir metin istemine dayalı olarak eşzamanlı olarak üretilecek ve ardından nihai videoyu sunmak için birleştirilecek.
Kullanıcıların Kontrolünü Artıran Özellikler
Şirket, kullanıcıların çıktı üzerinde daha fazla kontrol sahibi olabilmeleri için her bir katmanı ayrı ayrı yapılandırma seçeneğine sahip olacağını iddia ediyor. Odyssey ayrıca video çıktıları, görsel efektler üretmek için kullanılan mevcut Hollywood araçları ve sistemleri ile entegre edecek.
Hollywood Araçları ile Entegrasyon
Odyssey, video çıktılarının Hollywood’da kullanılan mevcut araçlar ve sistemlerle entegrasyonunu sağlayarak, sektördeki profesyonellerin kendi iş akışlarına sorunsuz bir şekilde dahil edebileceği bir çözüm sunmayı hedefliyor.
Ayrıca BKZ: Google Gemini Live: Yeni Özellik Android Kilitli Ekranda Çalışacak
Gelişim Aşaması ve Gelecek Planları
Şu anda, AI video modeli erken gelişim aşamasında. AI modelinin lansman tarihi henüz açıklanmadı. Ancak şirket, ilerlemeleri hakkında düzenli güncellemeler paylaşmaya devam edeceğini belirtti. Özellikle Cameron, daha önce otonom araçlarla çalışan Cruise ve Voyage adlı iki girişimde çalışmıştı. Şirketin diğer Kurucu Ortağı ve CTO’su Jeff Hawke ise daha önce otonom sürüş sistemleri geliştiren bir AI firması olan Wayve’de Teknoloji Başkan Yardımcısı olarak görev yapıyordu.