Stanford ÖZETİ| Üniversitesi ile Washington Üniversitesi bünyesinde çalışmalarını sürdüren bilim insanları, yapay zekâ sektöründe tüm dengeleri alt üst etme potansiyeline sahip olan yeni bir model geliştirdiler. "S1" olarak isimlendirilen bu model, OpenAI'ın akıl yürütebilen yapay zekâ modeli o1'e rakip olarak tasarlandı. Ancak buradaki en önemli fark, S1'in eğitimi için sadece 20 dolar civarında para harcanmış olması.
İşin daha da ilginç yanı, S1'in performansının beklentileri aşıyor olması. S1, girdiği matematik ve kodlama testlerinde hem OpenAI o1 hem de DeepSeek R1 modellerine yakın performans gösterdi. E madem bu kadar başarılı yapay zekâ modelleri bu kadar uygun fiyatlar karşılığında tasarlabiliyor, OpenAI gibi sektör devleri neden yapay zekâ için çuval çuval para harcıyorlar?
S1, alıştığımız yapay zekâ modellerinden biraz daha farklı bir eğitim sürecinden geçti
Bilim insanları, S1 modelinin temelini Alibaba tarafından desteklenen yapay zekâ giriÅŸimi Qwen'den aldılar. Firmanın geliÅŸtirdiÄŸi ve ücretsiz olarak yayımladığı bir modele eriÅŸen bilim insanları, ikinci aÅŸamada da Google'ın akıl yürütebilen ve kısıtlamalar olsa da ücretsiz olarak kullanılabilen modeli Gemini 2.0 Flash Thinking Experimental'dan yardım aldılar. Bu noktada dikkatlice seçilmiÅŸ 1.000 adet soru ayarlayan uzmanlar, Gemini 2.0 Flash Thinking Experimental'ın düşünme sürecini, kendi modellerine entegre ettiler.Â
AraÅŸtırmalara göre S1 modelinin eÄŸitimi için sadece 16 adet NVIDIA H100 GPU kullanıldı. Ãœstelik eÄŸitim süreci yaklaşık olarak 30 dakika sürdü. Stanford Ãœniversitesi'nden Niklas Muennighoff, tüm bu süreç için 20 dolarlık harcamanın yeterli olabileceÄŸini belirtti.Â
Editor : Åžerif SENCER