Site icon TechInside

Yapay zeka modeli eğitim maliyeti ne kadar?

yapay zeka modeli eğitim

Çin’in DeepSeek şirketi, başarılı yapay zeka modelinin eğitim maliyetinin sadece 294.000 dolar olduğunu açıkladı. Çinli yapay zeka geliştiricisi DeepSeek, yapay zeka geliştirme yarışında Pekin’in yeri konusundaki tartışmaları yeniden alevlendirmesi muhtemel bir makalede, R1 modelini eğitmek için 294.000 dolar harcadığını, bunun ABD’li rakiplerinin bildirdiği rakamlardan çok daha düşük olduğunu söyledi.

Başarılı bir yapay zeka modeli eğitim maliyeti için fiyat tahminleri

Hangzhou merkezli şirketin nadir güncellemesi, R1’in eğitim maliyetlerine ilişkin yayınladığı ilk tahmin, Nature akademik dergisinde yayınlanan hakemli bir makalede yer aldı.

DeepSeek’in Ocak ayında daha düşük maliyetli yapay zeka sistemleri piyasaya sürmesi, küresel yatırımcıları, yeni modellerin Nvidia da dahil olmak üzere yapay zeka liderlerinin hakimiyetini tehdit edebileceği endişesiyle teknoloji hisselerini satmaya yöneltti. O zamandan beri şirket ve kurucusu Liang Wenfeng, birkaç yeni ürün güncellemesi yayınlamanın dışında, kamuoyunun gözünden büyük ölçüde kayboldu.

Liang’ın ortak yazarlardan biri olarak yer aldığı Nature makalesinde, DeepSeek’in akıl yürütme odaklı R1 modelinin eğitilmesinin 294.000 dolara mal olduğu ve 512 Nvidia H800 çipi kullandığı belirtiliyor. Ocak ayında yayınlanan makalenin önceki bir versiyonunda bu bilgi yer almıyordu.

ABD’li yapay zeka devi OpenAI’nin CEO’su Sam Altman, 2023 yılında “temel model eğitimi” olarak adlandırdığı şeyin 100 milyon dolardan “çok daha fazlasına” mal olduğunu söyledi; ancak şirketi, yayınladığı hiçbir sürüm için ayrıntılı rakam vermedi. Yapay zeka sohbet robotlarını çalıştıran büyük dil modellerinin eğitim maliyetleri, büyük miktarda metin ve kodu işlemek için haftalarca veya aylarca güçlü çiplerden oluşan bir kümeyi çalıştırmaktan kaynaklanan masrafları ifade eder.

Bahsi geçen H800 yongaları, ABD’nin Ekim 2022’de şirketin daha güçlü H100 ve A100 AI yongalarını Çin’e ihraç etmesini yasadışı hale getirmesinin ardından Nvidia tarafından Çin pazarı için tasarlanmıştı. ABD’li yetkililer, Haziran ayında Reuters’a DeepSeek’in, ABD’nin ihracat kontrolleri uygulandıktan sonra satın alınan “büyük miktarda” H100 yongasına erişimi olduğunu söylemişti . Nvidia ise o dönemde Reuters’a DeepSeek’in yasal olarak satın aldığı H100 yongalarını değil, H800 yongalarını kullandığını söylemişti.

Exit mobile version