Techinside Google News
Techinside Google News

Stability AI, akıllı telefonlarda çalışabilen bir AI ses üretim aracı yayınlandı!

Yapay zeka girişimi Stability AI, ses üretiminde çığır açacak yeni modeli Stable Audio Open Small’ı duyurdu.
- Advertisement -

Bu yeni stereo ses üretim modeli, yalnızca bulut altyapısında değil, doğrudan akıllı telefonlar üzerinde de çalışabilecek kadar hafif olmasıyla dikkat çekiyor. Stability AI, modelin piyasadaki en hızlı ses üretim aracı olduğunu ve mobil cihazlarda sorunsuz çalışabileceğini iddia ediyor.

Modelin geliştirilmesinde, mobil cihazların işlemcilerini üreten Arm ile birlikte çalışıldı. Günümüzde Suno ve Udio gibi ses üreten uygulamalar genellikle internet bağlantısına ve bulut tabanlı işlemeye ihtiyaç duyuyor. Ancak Stable Audio Open Small, çevrimdışı çalışabilmesiyle bu anlamda rakiplerinden ayrılıyor.

Modelin eğitimi, yalnızca Free Music Archive ve Freesound gibi telifsiz müzik arşivlerinden alınan seslerle gerçekleştirildi. Bu yönüyle, eğitim sürecinde telifli içerik kullandığı iddia edilen bazı rakip modellerin aksine, fikri mülkiyet sorunlarını en aza indiriyor.

Stability AI, aracını mobil için optimize etti fakat sınırları var

Stable Audio Open Small, 341 milyon parametreye sahip ve Arm tabanlı işlemciler için optimize edildi. Model, kısa ses örnekleri ve efektler (örneğin enstrüman rifleri veya davul geçişleri) üretmek üzere tasarlandı. Stability AI, bir akıllı telefonda 11 saniyelik bir sesin 8 saniyeden kısa sürede üretilebildiğini belirtiyor.

Ancak modelin bazı sınırlamaları da bulunuyor. Şimdilik yalnızca İngilizce yazılmış komutları anlayabiliyor ve gerçekçi vokaller ya da yüksek kalitede şarkılar üretemiyor. Ayrıca eğitim verisinin Batı müzik kültürüne dayalı olması nedeniyle, farklı müzik türlerinde eşit performans gösteremiyor.

Kullanım koşulları açısından da bazı kısıtlamalar var. Model; araştırmacılar, amatör kullanıcılar ve yıllık geliri 1 milyon doların altında olan küçük işletmeler tarafından ücretsiz kullanılabiliyor. Ancak bu eşiği aşan geliştiricilerin ve kurumların, Stability AI’nın kurumsal lisansına geçmeleri gerekiyor.

Stability AI, daha önce büyük ilgi gören görsel üretim modeli Stable Diffusion ile adından söz ettirmişti. Ancak şirketin kurucu ortağı ve eski CEO’su Emad Mostaque’ın yanlış yönetimi nedeniyle hem personel kaybı yaşanmış hem de Canva ile yapılan ortaklık iptal olmuştu. Bu durum yatırımcılar arasında ciddi endişelere yol açtı.

Yeniden toparlanma sürecine giren şirket, son dönemde yeni CEO’sunu atadı, yönetim kuruluna ünlü yönetmen James Cameron’ı dahil etti ve yeni görsel üretim modelleri yayınladı. Stable Audio Open Small, bu yeniden yapılanmanın somut adımlarından biri olarak görülüyor.

Stability AI, mobil cihazlarda çalışan bu model ile hem amatör içerik üreticilerine hem de bağımsız geliştiricilere ses tasarımı konusunda daha özgür ve erişilebilir bir araç sunmayı hedefliyor.

Siz bu konu hakkında ne düşünüyorsunuz? Görüşlerinizi yorumlarda paylaşın!

 

 

HABERLER

TÜMÜ

SON VİDEO

TÜMÜ
00:14:59

CEVAP VER

Lütfen yorumunuzu giriniz!
Lütfen isminizi buraya giriniz