Hem ÖZETİ| donanımları hem de modelleri ile yapay zekâ alanının en önemli aktörleri arasında yer alan NVIDIA, "ses için İsviçre çakısı" olarak nitelendirdiği yeni deneysel üretken yapay zekâ modeli olan Fugatto'yu (Foundational Generative Audio Transformer Opus 1) tanıttı.
Fugatto, isim olarak dilimizde füg dediğimiz çok sesli ve tekrar eden melodilerden oluşan besteleme modelinin ismi Fugato'ya çok benziyor. Bu da boşuna değil, yapay zekâ modeli de "çok sesli" ve farklı aksanları ve farklı dilleri de algılayabilmesi için dünyanın dört bir yanından araştırmacılar tarafından geliştirildi.
Sesleri insanların anladığı gibi anlayacak
Konuyla ilgili açıklamalarda bulunan NVIDIA Uygulamalı Ses Araştırmaları Yöneticisi Rafael Valle, "İnsanların sesleri anladığı ve ürettiği gibi anlayan bir model oluşturmak istedik." ifadesini kullandı. NVIDIA, Fugatto'nun gerçek dünyadaki olası kullanım senaryolarına da duyurusunda yer verdi. Bu senaryolar arasında bir şarkı fikrinin prototipini oluşturmak, farklı tarzlar, sesler ve enstrümanları denemek yer aldı.
Kullanıcılar ayrıca bu modelle birlikte farklı ses tonlarıyla ve aksanlarla dil öğrenebilecek, oyun geliştiricileri aynı sesin varyasyonlarını üretmek için modelden yardım alabilecekler. Ayrıca bu model, ufak ayarlarla daha önce eğitilmediği alanlarda da kullanılabiliyor.
Fugatto'nun kamunun erişimine açılıp açılmayacağı ise belirtilmedi. Daha önce Meta ve Google da benzer yapay zekâ modelleri geliştirmişti.
Editor : Şerif SENCER