Google'ın ÖZETİ| DeepMind yapay zekâ laboratuvarı, son dönemde popüler olan video oluşturan yapay zekâların en büyük eksiklerinden olan arka plan müziği ve hatta diyalog oluşturma sorununu çözmeye hazırlanıyor. V2A (video ötesi ses) teknolojisi adını verdiği teknoloji üzerindeki ilerlemelerini paylaşan laboratuvar, Google Veo ve OpenAI Sora gibi video oluşturma araçlarıyla da eşleştirilebiliyor.
DeepMind ekibi tarafından paylaşılan blog yazısına göre sistem ham pikselleri anlayabiliyor. ve bu bilgiyi de metin istemleriyle birleştirebildiğini ifade etti. Bu eşleşme üzerinden de ses efektleri oluşturuluyor. Bu araç ayrıca sessiz filmler ya da sesi olmayan diğer videolar için de kullanılabiliyor.
DeepMind ekibi araçlarına güveniyor
Aslında ses oluşturmak için kullanılabilecek ilk yapay zekâ DeepMind'ın geliştirdiği teknoloji değil ve son da olmayacak. ElevenLabs da daha önce bu tür bir araç piyasaya sürmüştü. Öte yandan DeepMind ekibi, kendi araçları için "hem pikselleri anlayabilmesi hem metin istemi eklemenin isteğe bağlı olması nedeniyle mevcut video ötesi ses çözümlerinden farklı" ifadesini kullanıyor.
DeepMind araştırmacıları bu teknolojiyi geliştirmek için yaptıkları çalışmalarda yapay zekâ tarafından üretilmiş, videolar, sesler, ayrıntılı ses açıklamaları ve transkriptlerden oluşan verilerle eğitti. Araştırmacılar ayrıca V2A teknolojisinin, kaynak videoda bozulmalar olduğunda çıktının ses kalitesinde düşüş yaşanması gibi mevcut sorunlar üzerinde de çalıştıklarını belirtiyorlar. DeepMind ekibi, teknolojiyi herkese açık hâle getirmeden önce de "titiz güvenlik değerlendirmeleri ve testlerden geçireceklerini" de taahhüt etti.
Editor : Şerif SENCER