Site icon TechInside

Robotlar gelecek tahmini yapıyor

Robotlar gelecek tahmini

NVIDIA, fiziksel yapay zeka sistemleri için dünya temel modellerine yönelik daha geniş kapsamlı çabalarına dayanan, robot kontrolüne yönelik yeni bir yaklaşım olan Cosmos Policy’i tanıttı. Bu çerçeve, kontrol ve planlama görevleri için büyük video tahmin modellerini uyarlayarak robotların hangi eylemleri gerçekleştireceğine karar vermesini basitleştirmek üzere tasarlanmış.

Robotlar gelecek tahmini ile süreci ilerletiyor

Robotikte, politika, kamera görüntüleri ve sensör verileri gibi gözlemleri eklem hareketleri veya kavrama hareketleri gibi fiziksel eylemlere dönüştüren karar verme katmanıdır. Geleneksel robot politikaları genellikle ayrı algılama, planlama ve kontrol modülleri gerektiren göreve özgü sinir ağları olarak oluşturulur.

Bu sistemler genellikle büyük miktarda etiketli veri ve her robot veya ortam için özel ayarlama gerektirir. Cosmos Policy farklı bir yaklaşım benimser. NVIDIA, sıfırdan yeni bir kontrol modeli tasarlamak yerine, Cosmos Predict olarak bilinen önceden eğitilmiş bir video dünya modelini robot gösterim verileri üzerinde sonradan eğitir.

Model, büyük ölçekli video verilerinden öğrenerek fiziksel dünyanın zaman içinde nasıl evrimleştiğini zaten anlamaktadır. Eğitim sonrası aşamada, robot eylemleri, fiziksel durumlar ve görev sonuçları, modelin içsel zamansal temsilinin bir parçası olarak ele alınır; bu da robotun bir sonraki adımda ne yapması gerektiğini ve bunun sonucunda ne olacağını tahmin etmesine olanak tanır.

Bu tasarım, Cosmos Policy’nin eylemleri, gelecekteki durumları ve beklenen görev başarısını tek bir mimari içinde birlikte tahmin etmesini sağlar. Tek bir eğitim sonrası aşamaya dayanarak, çerçeve mimari karmaşıklığı azaltır ve algılama ve kontrol için birden fazla özel modeli bir araya getirme ihtiyacını ortadan kaldırır.

Karşılaştırma sonuçları, yaklaşımın etkili olduğunu göstermektedir. Standart robotik manipülasyon karşılaştırmalarında, Cosmos Policy, uzun vadeli akıl yürütme gerektiren çok adımlı görevlerde yüksek başarı oranlarına ulaşmıştır. Bazı durumlarda, önemli ölçüde daha az eğitim gösterimi kullanırken mevcut yöntemlerin performansına ulaşmış veya aşmıştır.

Bu veri verimliliği, gerçek dünya eğitim verilerinin toplanmasının maliyetli ve zaman alıcı olduğu robotikte özellikle önemlidir. Büyük video modellerine zaten yerleştirilmiş bilgileri kullanarak, Cosmos Policy, güvenilir kontrol davranışlarını öğrenmek için gereken robota özgü veri miktarını azaltır.

Exit mobile version