Google’ın yeni “küçük” yapay zekâ dil modeli Gemma yayında!

Çağdaş Aru

2 yıl önce

Google tarafından dün yayınlanan Gemma iki boyutta geliyor: iki milyar parametre ve yedi milyar parametre. Büyük versiyon GPU ve TPU hızlandırmalı sistemler için tasarlanırken, küçük versiyon CPU tabanlı cihaz içi uygulamalar, hatta dizüstü bilgisayarlar için uygun olarak ölçeklendirildi. Her ikisinin de mimarisi benzer Google’ın en yeni ve en güçlü büyük dil modeli olan Gemini ile aynı “teknik ve altyapı bileşenlerini paylaşıyor”.

Akıl yürütme, matematik ve kodlama becerilerini değerlendiren kıyaslama testlerinde, daha büyük Gemma modeli, 13 milyar parametreli rakibinden daha küçük olmasına rağmen Meta’nın Llama 2’sinden daha iyi performans gösterdi. Gemma modelleri öncelikle, zehirli, uygunsuz dil veya kişisel tanımlanabilir bilgiler gibi hassas verileri en aza indirmek için filtrelenmiş internetten kazınan İngilizce metinler üzerinde eğitildi.

Google, yanıtlarını iyileştirmek için insan geri bildirimi kullanarak talimat ayarlama ve pekiştirmeli öğrenme kullanarak modelleri değiştirdi. Ayrıca, Keras aracılığıyla JAX, PyTorch ve TensorFlow dahil olmak üzere farklı makine öğrenimi çerçevelerinde ince ayar ve çıkarımı destekleyen araç setleri de yayınladı. Gemma bulut yerine yerel bir cihazda çalışacak kadar küçük ve özel sohbet robotları oluşturmak için özetleme veya erişimle artırılmış üretim gibi belirli kullanım durumları için uyarlanabilir.

Açık kaynak olduğu iddia edilse de doğrusunu söylemek gerekirse, Gemma teknik olarak açık kaynaklı bir model değil. Google, geliştiricilerin modeli kendilerinin eğitmesine olanak tanıyacak kaynak kodunu ve verileri yayınlamadı. Yalnızca önceden eğitilmiş modellere ve bunların ağırlıklarına erişilebiliyor.

Yapay zekada açıklık konusunda görüşler bölünmüş durumda. Bir yandan, geliştiricilerin teknolojiyi kurcalamasına ve keşfetmesine olanak tanıyor. Öte yandan, her teknolojide olduğu gibi, kötü niyetli kişiler bunu siber saldırı ve dolandırıcılık yöntemlerinin yanı sıra örneğin web sitelerini hacklemek için kullanabilir. ABD Ticaret Bakanlığı’na bağlı Ulusal Telekomünikasyon ve Bilgi İdaresi (NTIA) konuyla ilgili kamuoyu görüşlerini bekliyor. Ticaret Bakanı Gina Raimondo yaptığı açıklamada, “Yapay zeka bir hızlandırıcıdır – insanların mevcut yeteneklerini daha iyi, daha hızlı ve daha güçlü hale getirme potansiyeline sahiptir” diyor ve ekliyor: “Doğru ellerde inanılmaz fırsatlar taşıyor, ancak yanlış ellerde kamu güvenliği için bir tehdit oluşturabilir.”

NTIA, Gemma gibi “açık ağırlıklı” modellerin toplumu ya da ulusal güvenliği nasıl etkileyebileceğini incelemek istiyor. Uzmanlar, geliştiricilerin bu sistemleri sahte spam üretmek, dezenformasyon kampanyaları başlatmak ya da kötü amaçlı yazılım geliştirmek için kullanabileceğinden korkuyor.