Teknoloji

En İyi Yapay Zekâ Modellerinin Bile Tam Not Alamadığı Test

Yapay zekâ modellerinin performansını ölçmeye yarayan yeni bir test geliştirildi. "Humanity's Last Exam" isimli test, en iyi yapay zekâ modellerini bile zorluyor.

En İyi Yapay Zekâ Modellerinin Bile Tam Not Alamadığı Test
24-01-2025 14:38

Yapay ÖZETİ| zekâ modellerine yönelik yeni bir performans testi oluşturuldu. Yapay zekâ sektörünün kâr amacı gütmeyen kuruluşlarından Center for AI Safety (CAIS) ile Scale AI isimli şirket tarafından geliştirilen bu performans testi, en iyi yapay zekâ modellerini bile zorlayan türden.

"Humanity's Last Exam" olarak isimlendirilen yeni performans testi, pek çok kategoride zorlayıcı sorulara ev sahipliği yapıyor. Yapılan açıklamalara göre bu testte matematik, beşeri bilimler ve doğa bilimleri gibi onlarca konuda, 3.000 civarı soru bulunuyor. Geliştiriciler, testin gerçekten belirleyici olması için grafikler, diyagramlar ve görseller kullanmayı da ihmal etmediler.

En iyi yapay zekâ modeli bile tüm soruları çözemiyor

yapay zekâ modelleri için performans testi

Humanity's Last Exam, gerçekten zorlayıcı bir performans testi olacak gibi görünüyor. Zira yapılan çalışmalara göre piyasadaki amiral gemisi yapay zekâ modelleri, bu performans testinde yüzde 100 başarıya ulaşamadılar. Hatta 2021 yılında yayımlanan matematik odaklı testlerde erken aşamadaki yapay zekâ modelleri, 100 üzerinden 10 puan bile alamamışlardı.


Editor : Åžerif SENCER
SİZİN DÜŞÜNCELERİNİZ?
TÃœRKÄ°YE GÃœNDEMÄ°
BUNLAR DA İLGİNİZİ ÇEKEBİLİR
ÇOK OKUNAN HABERLER