Facebook'un ana şirketi Meta Platforms Salı günü, düzinelerce dilde konuşmayı tercüme edebilen ve yazıya dökebilen bir yapay zeka modeli yayınladı; bu, dil ayrımları arasında gerçek zamanlı iletişim sağlayan araçlar için potansiyel bir yapı taşı olarak görülüyor.
Şirket bir blog yazısında, SeamlessM4T modelinin yaklaşık 100 dilde metin ve konuşma arasındaki çevirilerin yanı sıra 35 dil için tam konuşmadan konuşmaya çeviriyi destekleyebileceğini ve daha önce yalnızca ayrı modellerde mevcut olan teknolojiyi birleştirdiğini söyledi.
CEO Mark Zuckerberg, bu tür araçların, şirketin geleceğini bağladığı birbirine bağlı sanal dünyalar kümesi olan metaverse'de dünyanın dört bir yanından kullanıcılar arasındaki etkileşimleri kolaylaştırmasını öngördüğünü söyledi.
ŞİRKETLER ARASINDAKİ YAPAY ZEKA YARIŞI KIZIŞIYOR
Blog yazısında, Meta'nın modeli ticari olmayan kullanım için kamuya açık hale getirdiği belirtildi.
Dünyanın en büyük sosyal medya şirketi bu yıl, Microsoft destekli OpenAI ve Google tarafından satılan tescilli modellere ciddi bir meydan okuma teşkil eden Llama adlı büyük bir dil modeli de dahil olmak üzere, çoğunlukla ücretsiz yapay zeka modelleri yayınladı.
Reuters'in aktardığı bilgilere göre Zuckerberg, açık bir yapay zeka ekosisteminin Meta'nın avantajına olduğunu, çünkü şirketin sosyal platformları için tüketiciye yönelik araçların oluşturulmasında kitle kaynak kullanımını etkin bir şekilde kullanarak, modellere erişim için ücret talep etmekten daha fazla kazanç elde edeceğini söylüyor.
OenAI Verileri İzinsiz Kullanmakla Suçlandı
Bununla birlikte Meta, modellerini oluşturmak için alınan eğitim verileri konusunda sektörün geri kalanıyla benzer yasal sorularla karşı karşıya.
Temmuz ayında komedyen Sarah Silverman ve diğer iki yazar hem Meta hem de OpenAI aleyhine telif hakkı ihlali davası açarak şirketleri kitaplarını izinsiz eğitim verisi olarak kullanmakla suçladı.
META'NIN YAPAY ZEKASI 4 MİLYON SAATLİK VERİDEN YARARLANDI
SeamlessM4T modeli için Meta araştırmacıları bir araştırma makalesinde, hangi havuz olduğunu belirtmeden, 4 milyon saatlik "taranmış web verilerinin kamuya açık bir havuzundan kaynaklanan ham ses" ses eğitim verilerini topladıklarını söyledi.
Bir Meta sözcüsü ses verilerinin kaynağına ilişkin sorulara yanıt vermedi.
Araştırma makalesinde, metin verilerinin geçen yıl oluşturulan ve Wikipedia ile ilişkili web sitelerinden içerik çeken veri kümelerinden geldiği belirtildi.