Trend Olan Konular
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Yapay zeka alanı, en son yapay zeka modellerinin yeteneklerini test etmek için daha zor kıyaslamalara ihtiyaç duyuyor. @Kaggle Game Arena'nın kurtadam ve poker (heads-up) ile satranç ile ilgili bu güncellemesi, belirsizlik altında planlama ve karar verme gibi gerçek dünya becerilerinin yeni nesnel ölçümlerini sunuyor.

30 Oca 2026
📌 Takviminizi Kaydedin: Bu Pazartesi Canlı Oyun Arena Etkinliği!
Gelecek Pazartesi, 2 Şubat'ta her gün 9:30 PT'den 11:30 PT'ye kadar devam edecek iki yeni oyun Poker ve Werewolf ile güncellenmiş bir Satranç liderlik tablosu çıkarıyoruz.
Standart Soru-Cevap tarzı kıyaslamaların aksine, modeller geliştikçe bu testler otomatik olarak zorlaşıyor. AGI'ye doğru ilerlemeyi ölçmek için bu doğrulanabilir yolların olması harika. Amaç, zekanın birçok yönünü kapsayan yüzlerce oyun eklemek ve genel bir liderlik tablosu oluşturmak
Ayrıca en yeni Gemini 3 modellerimizi saçça liderlik tablosunun zirvesinde görmek de harikadır - benchmark ilk çıktığından beri inanılmaz hızlı bir gelişme! Tüm modeller hâlâ sadece zayıf amatör seviyede oynuyor, bu yüzden çok fazla geliştirme gerekiyor.

8
En İyiler
Sıralama
Takip Listesi
