Techinside Google News
Techinside Google News

Metin ile görüntü entegrasyonu yapan yapay zeka

DeepFloyd metin ile görüntü entegrasyonu yapan yapay zeka geliştirdi. Üretken yapay zeka, sanatta da kullanılabilir.

DeepFloyd metin ile görüntü entegrasyonu yapan yapay zeka geliştirdi. Üretken yapay zeka, sanatta da kullanılabilir.

Stability AI tarafından desteklenen bir araştırma grubu olan DeepFloyd, metni görüntülere entegre edebilen DeepFloyd IF’yi tanıttı.

- Advertisement -

Bir milyardan fazla görüntü ve metinden oluşan bir veri kümesi üzerinde eğitilen DeepFloyd IF, çalışması için en az 16 GB RAM’e sahip bir GPU gerektiren bir görüntü oluşturabiliyor. DeepFloyd IF, şimdilik ticari kullanımı yasaklayacak şekilde lisanslanmış açık kaynak olarak mevcut. Kısıtlama, büyük olasılıkla üretken yapay zeka sanat modellerinin mevcut zayıf yasal durumundan kaynaklanıyor. Metin ile görüntü entegrasyonu sayesinde yenilikçi çalışmalar yapılabiliyor.

Metinden görüntüye çözüm

Birkaç ticari model satıcısı, satıcıların bu işi izinsiz olarak web’den kazıyarak tazminat ödemeden işlerinden kar elde ettiklerini iddia eden sanatçılar tarafından eleştirildi.

Nightcafe CEO’su Angus Russell, DeepFloyd IF’yi diğer metinden görüntüye modellerden farklı kılan ve üretken yapay zeka için neden önemli bir adımı temsil edebileceği hakkında konuştu. Russell’a göre DeepFloyd IF’nin tasarımı, Google’ın hiçbir zaman halka açıklanmayan Imagen modelinden büyük ölçüde ilham aldı. OpenAI’nin DALL-E 2 ve Stable Diffusion gibi modellerinin aksine DeepFloyd IF, görüntüler oluşturmak için modüler bir mimaride bir araya yığılmış çok sayıda farklı işlem kullanıyor.

Tipik bir difüzyon modeli ile model, neredeyse tamamen gürültüden oluşan bir başlangıç ​​görüntüsünden gürültüyü kademeli olarak çıkarmayı öğreniyor ve onu adım adım hedef komut istemine yaklaştırıyor. DeepFloyd IF, bir kez değil birkaç kez difüzyon gerçekleştirerek 64×64 piksellik bir görüntü oluşturuyor. Ardından görüntüyü 256×256 piksele ve son olarak da 1024×1024 piksele yükseltiyor.

DeepFloyd IF oldukça yetenekli bir şekilde resimlerde metin oluşturabildiği için Russell, logo tasarımı, web tasarımı, posterler, reklam panoları ve hatta memler gibi yeni üretken sanat olasılıkları ortaya çıkarmasını bekliyor.

Siz bu konu hakkında ne düşünüyorsunuz? Görüşlerinizi yorumlarda paylaşın!

SON VİDEO

TÜMÜ
00:07:03

Masterpass 2023’te rekor kırdı!

CEVAP VER

Lütfen yorumunuzu giriniz!
Lütfen isminizi buraya giriniz

İlginizi çekebilir