NVIDIA, ÖZETİ| yapay zekâ sektöründe büyük bir adım atarak GPT-4 ve diğer devlerle rekabet edecek açık kaynaklı yeni yapay zekâ modelini tanıttı.
Şirketin yeni modeli, NVLM 1.0 adlı büyük dil modeli ailesinin bir üyesi olan NVLM-D-72B, 72 milyar parametreye sahip ve hem görsel hem de dil görevlerinde dikkat çekici bir performans sergiliyor. NVIDIA, bu modeli yalnızca kapalı sistemlerde tutmak yerine, model ağırlıklarını ve eğitim kodunu kamuya açarak geniş bir geliştirici ve araştırmacı kitlesine erişim sağlıyor.
NVLM-D-72B neler yapabiliyor?
NVLM-D-72B modeli, görsel dil görevlerinde lider modellere rakip olma kapasitesine sahip. Görselleri analiz etme, metinleri yorumlama ve karmaşık matematik problemlerini çözme yetenekleriyle model, hem görsel hem de metin tabanlı görevlerde üstün başarı gösteriyor.
Ayrıca diğer çok modlu yapay zekâ modellerinden farklı olarak NVLM-D-72B, metin görevlerinde eğitildikten sonra metin performansını artırmayı başarmış ve metin tabanlı ölçütlerde doğruluğunu %4,3 oranında geliştirmiş durumda.
NVLM-D-72B'yi bu kadar önemli kılan ne?
NVIDIA’nın bu adımı aynı zamanda yapay zekâ sektöründe kapalı sistemlerden açık kaynaklı sistemlere doğru önemli bir geçişi işaret ediyor. Araştırmacılar ve daha küçük teknoloji şirketleri, bu güçlü model sayesinde artık büyük firmaların rekabet ettiği seviyelere ulaşabilir ve yenilikçi çalışmalara katkıda bulunabilirler. Ayrıca NVLM projesinin sunduğu hibrit çok modlu işleme teknikleri, yapay zekâ araştırmalarının gelecekteki yönünü etkileyebilir.
Tabii kötü ihtimaller de yok değil. NVIDIA'nın bu açık kaynak adımının bazı riskleri de beraberinde getirmesi mümkün. Üstün yapay zekâ modellerinin daha erişilebilir hâle gelmesiyle birlikte kötüye kullanım ve etik kaygılar da artabilir. NVIDIA’nın bu stratejik hamlesi, sadece teknoloji devlerinin değil, tüm sektörün nasıl bir hızla evrileceğini gözler önüne serecek gibi.
Editor : Şerif SENCER