Yapay ÖZETİ| zekâ modellerine yönelik yeni bir performans testi oluşturuldu. Yapay zekâ sektörünün kâr amacı gütmeyen kuruluşlarından Center for AI Safety (CAIS) ile Scale AI isimli şirket tarafından geliştirilen bu performans testi, en iyi yapay zekâ modellerini bile zorlayan türden.
"Humanity's Last Exam" olarak isimlendirilen yeni performans testi, pek çok kategoride zorlayıcı sorulara ev sahipliği yapıyor. Yapılan açıklamalara göre bu testte matematik, beşeri bilimler ve doğa bilimleri gibi onlarca konuda, 3.000 civarı soru bulunuyor. Geliştiriciler, testin gerçekten belirleyici olması için grafikler, diyagramlar ve görseller kullanmayı da ihmal etmediler.
En iyi yapay zekâ modeli bile tüm soruları çözemiyor
Humanity's Last Exam, gerçekten zorlayıcı bir performans testi olacak gibi görünüyor. Zira yapılan çalışmalara göre piyasadaki amiral gemisi yapay zekâ modelleri, bu performans testinde yüzde 100 başarıya ulaşamadılar. Hatta 2021 yılında yayımlanan matematik odaklı testlerde erken aşamadaki yapay zekâ modelleri, 100 üzerinden 10 puan bile alamamışlardı.
Editor : Åžerif SENCER