Google'ın ÖZETÄ°| DeepMind yapay zekâ laboratuvarı, son dönemde popüler olan video oluÅŸturan yapay zekâların en büyük eksiklerinden olan arka plan müziÄŸi ve hatta diyalog oluÅŸturma sorununu çözmeye hazırlanıyor. V2A (video ötesi ses) teknolojisi adını verdiÄŸi teknoloji üzerindeki ilerlemelerini paylaÅŸan laboratuvar, Google Veo ve OpenAI Sora gibi video oluÅŸturma araçlarıyla da eÅŸleÅŸtirilebiliyor.Â
DeepMind ekibi tarafından paylaşılan blog yazısına göre sistem ham pikselleri anlayabiliyor. ve bu bilgiyi de metin istemleriyle birleÅŸtirebildiÄŸini ifade etti. Bu eÅŸleÅŸme üzerinden de ses efektleri oluÅŸturuluyor. Bu araç ayrıca sessiz filmler ya da sesi olmayan diÄŸer videolar için de kullanılabiliyor.Â
DeepMind ekibi araçlarına güveniyor
Aslında ses oluÅŸturmak için kullanılabilecek ilk yapay zekâ DeepMind'ın geliÅŸtirdiÄŸi teknoloji deÄŸil ve son da olmayacak. ElevenLabs da daha önce bu tür bir araç piyasaya sürmüştü. Öte yandan DeepMind ekibi, kendi araçları için "hem pikselleri anlayabilmesi hem metin istemi eklemenin isteÄŸe baÄŸlı olması nedeniyle mevcut video ötesi ses çözümlerinden farklı" ifadesini kullanıyor.Â
DeepMind araÅŸtırmacıları bu teknolojiyi geliÅŸtirmek için yaptıkları çalışmalarda yapay zekâ tarafından üretilmiÅŸ, videolar, sesler, ayrıntılı ses açıklamaları ve transkriptlerden oluÅŸan verilerle eÄŸitti. AraÅŸtırmacılar ayrıca V2A teknolojisinin, kaynak videoda bozulmalar olduÄŸunda çıktının ses kalitesinde düşüş yaÅŸanması gibi mevcut sorunlar üzerinde de çalıştıklarını belirtiyorlar. DeepMind ekibi, teknolojiyi herkese açık hâle getirmeden önce de "titiz güvenlik deÄŸerlendirmeleri ve testlerden geçireceklerini" de taahhüt etti.Â
Editor : Åžerif SENCER