İlk Genie modelinin halefi olan bu araç, tek bir görsel ve metin açıklamasından gerçek zamanlı, etkileşimli sahneler yaratma özelliği taşıyor. Örneğin, “Ormanda şirin bir insansı robot” gibi bir açıklama ile, ilgili dünya oluşturulabiliyor.
Modelin benzer projeler üzerinde çalışan Fei-Fei Li’nin World Labs şirketi ve İsrailli girişim Decart’a rakip olduğu belirtiliyor.
Gelişmiş simülasyonlar ve kullanıcı etkileşimi
DeepMind, Genie 2’nin zengin detaylara sahip çok çeşitli 3D dünyalar oluşturabileceğini ifade ediyor. Kullanıcılar, klavye ve fare yardımıyla bu dünyalarda yüzme veya zıplama gibi eylemleri gerçekleştirebiliyor.
Model, videolardan eğitilerek nesne etkileşimleri, fiziksel animasyonlar ve ışık yansımaları gibi özellikleri simüle edebiliyor. Dahası, NPC (non-player character) davranışlarını da kapsayarak, bu sahneleri AAA oyunlarına benzer bir deneyim haline getiriyor.
Ancak, bu gelişmiş özelliklerin eğitiminde kullanılan veri kaynakları şeffaf değil. DeepMind’ın, eğitim sürecinde YouTube içeriklerinden faydalanmış olabileceği öne sürülüyor. Bu durum, telif hakkı ihlalleri konusundaki soruları beraberinde getiriyor.
Araştırma ve yaratıcılıkta yeni ufuklar
Genie 2, oyun geliştirme aracı olmaktan ziyade bir araştırma ve yaratıcı prototipleme platformu olarak sunuluyor. Model, genellikle 10-20 saniye süren sahneler oluşturabiliyor ve sahne dışındaki detayları hatırlayarak yeniden oluşturabiliyor. Bu özelliği, benzer modellerdeki tutarsızlık sorunlarını aşarak dikkat çekiyor.
DeepMind, Genie 2’nin sanatsal konseptlerden tamamen etkileşimli ortamlar yaratma yeteneği ile AI ajanlarını test etme gibi yenilikçi alanlarda kullanılabileceğini belirtiyor. Video oyun sektöründeki yaratıcıların ise, AI’ın iş süreçlerini kolaylaştırması karşısında karışık duygular taşıdığı ifade ediliyor.
Google’ın dünya modelleme alanına yaptığı yatırımlar, bu teknolojinin AI’ın bir sonraki büyük atılımı olacağına işaret ediyor. Genie 2’nin potansiyeli, yalnızca AI araştırmalarında değil, yaratıcı projelerde de geniş yankı uyandırabilir.