Google, yapay zeka görüntü modelini güncelledi ve bu aslında oldukça önemli bir adım gibi görünüyor. Şirket, bugün daha akıllı ve daha esnek görüntü üretimi vaat eden büyük bir yenilik olan Gemini 2.5 Flash Image’ı piyasaya sürdü.
Google yapay zeka görüntü modeli için önemli değişiklik
Geliştirilmiş model, kullanıcıların yalnızca görseller oluşturmak için değil, aynı zamanda mevcut fotoğrafları birleştirmek ve tuhaf bozulmalar yaratmadan daha hassas düzenlemeler yapmak için doğal dil komutları vermelerine olanak tanıyor. Ayrıca, Gemini’nin “dünya bilgisinden” yararlanarak ne ürettiğini daha iyi anlıyor.
Bu güncelleme, Google’ın sektör lideri OpenAI ile arasındaki farkı kapatmaya çalıştığı bir dönemde geldi. Geçmişte, görüntü üretimi yapay zeka için önemli bir itici güç olmuştu. ChatGPT kullanımı, şirketin GPT-4o yerel görüntü oluşturucusunu Mart ayında piyasaya sürmesiyle hızla arttı. OpenAI CEO’su Sam Altman’a göre, model tarafından oluşturulan viral Studio Ghibli paylaşımları, şirketin GPU modellerinin erimesine neden oldu. ChatGPT’nin şu anda haftalık 700 milyondan fazla kullanıcısı var. Buna karşılık, Google CEO’su Sundar Pichai, şirketin Temmuz ayındaki kazanç görüşmesinde Gemini’nin aylık 450 milyon kullanıcısı olduğunu ve hala ChatGPT’nin gerisinde kaldığını açıkladı.
Google, son güncellemesiyle yapay zekanın en büyük sorunlarından birini çözdüğünü söylüyor. Şimdiye kadar, karakterleri veya nesneleri birden fazla düzenlemede tutarlı tutmak, yapay zeka görüntü oluşturucuları için büyük bir zorluktu.
Şirket bir blog yazısında: ” Artık aynı karakteri farklı ortamlara yerleştirebilir, tek bir ürünü yeni ortamlarda birden fazla açıdan sergileyebilir veya konuyu korurken tutarlı marka varlıkları üretebilirsiniz” ifadelerini kullandı. Google, kullanıcıların artık yalnızca bir komutla çok özel ayarlamalar yapabileceğini söylüyor. Örneğin, kullanıcılar bir görselin arka planını bulanıklaştırabilir, bir tişörtteki lekeyi çıkarabilir, bir öznenin pozunu değiştirebilir ve hatta siyah beyaz bir fotoğrafa renk ekleyebilir.
Yeni model, resmi lansmanından önce bile, kitle kaynaklı değerlendirme platformu LMArena’da dikkatleri üzerine çekmişti ve burada “nano-banana” adıyla anonim olarak yayınlanmıştı.