Bir ÖZETİ| süredir yapay zekâ sektöründeki çalışmalarına hız veren Çinli e-ticaret devi Alibaba, "Qwen2.5-Max" olarak isimlendirdiği yeni yapay zekâ modelini duyurdu. Qwen2.5 üzerine inşa edilen yeni model, Alibaba'nın bile Çinli yapay zekâ girişimi DeepSeek'ten tedirgin olmaya başladığını gözler önüne seriyor. Zira Alibaba, Çin'de tatil dönemine girilmiş olunan bir dönemde bu duyuruyu gerçekleştirdi.
Alibaba'nın WeChat üzerinden yaptığı duyuruya göre Qwen2.5-Max, DeepSeek-V3, GPT 4o ve Llama-3.1-405B modellerinden daha iyi performans gösteriyor. Şirket bu açıklamayı yapabilmek için yeni yapay zekâ modelini çeşitli testlere soktu ve elde edilen sonuçlar, yapılanan açıklamanın doğru olduğunu gözler önüne seriyor.
İşte Qwen2.5-Max için yayımlanan test sonuçları
Qwen2.5-Max'in girdiği testlere baktığımız zaman en etkileyici sonucun Arena-Hard testinde alındığını görüyoruz. LiveBench testinde de tüm rakiplerini geride bırakan yapay zekâ modeli MMLU-Pro tesinde üçüncü, GPQA-Diamond ile LiveCodeBench testlerinde ise ikinci oldu. Yapay zekânın birinci olduğu Arena-Hard testinin insan tercihlerini tahmin etmeye yönelik olduğunu belirtelim. Yani Qwen2.5-Max, rakiplerine kıyasla en çok insan gibi düşünebilen yapay zekâ modeli oldu.
Editor : Şerif SENCER