Techinside Google News
Techinside Google News

Grok artık görselleri “anlıyor”

Elon Musk'ın şirketi tarafından geliştirilen yapay zeka chatbot'u Grok, bilgi yüklü diyagramlar ve grafikler dahil olmak üzere görselleri artık "anlayabiliyor"
- Advertisement -

Grok-1.5V veya Grok 1.5 Vision olarak adlandırılan bu “ilk nesil çoklu modal model” şirkete göre sadece yüklenen resimlerinize ve ekran görüntülerinize yanıt vermekle kalmayacak, aynı zamanda karmaşık belgeler, bilim diyagramları, grafikler, ekran görüntüleri ve fotoğraflardan da anlam çıkarabiliyor.

Şirket duyurusunda ayrıca, Grok-1.5V’nin kullanıcıları tarafından yüklenen görüntülerde tasvir edilen fiziksel dünyayı daha iyi anlayabilmek için “gerçek dünya uzamsal anlayışı” kazanacağını belirtti. Duyuruda, “Hem çoklu modal anlama hem de üretme yeteneklerimizi geliştirmek, evreni anlayabilen faydalı bir Yapay Genel Zekası (YGZ) oluşturmak için önemli adımlar” deniyor. “Önümüzdeki aylarda, görüntü, ses ve video gibi çeşitli yöntemlerde her iki yetenekte de önemli gelişmeler kaydetmeyi bekliyoruz.”

Örnek kullanım senaryoları arasında bir diyagramı Python koduna çevirmek, bir çocuğun çizimini bir yatak odası hikayesine dönüştürmek, çok sayıdaki nesne arasında en büyüğünü tespit etmek ve sürücüye bir engelin etrafından dolanabilecek kadar yeri olup olmadığını söylemek yer alıyor.

Grok-1.5V, diğer GenAI modellerini Grok’un gerçek dünya akıl yürütmesine karşı test etmek için tasarlanmış bir görüntü ve prompt veri seti olan xAI’ın RealWorldQA ile birlikte yayınlanacak. Grok-1.5V, kısa süre içinde erken test kullanıcıları ve seçili kullanıcılar için kullanılabilir olacak.

Siz bu konu hakkında ne düşünüyorsunuz? Görüşlerinizi yorumlarda paylaşın!

SON VİDEO

TÜMÜ

CEVAP VER

Lütfen yorumunuzu giriniz!
Lütfen isminizi buraya giriniz

İlginizi çekebilir