跳轉至主要內容
行情
掃鏈
追蹤
信號
跟單
兌換
資產
邀請計劃
更多
產品
DeFi
市場
安全中心
開發者中心
X Layer
探索 X Layer
X Layer 瀏覽器
跨鏈橋
開發者文檔
測試網水龍頭
GitHub
Wallet API
探索 Wallet API
API 文檔
API Key 管理
區塊鏈瀏覽器
DApp 連接錢包
Boost
X Launch
參與 X Launch,搶先賺新幣
X Campaign
參與活動,贏取豐厚獎勵
獎勵中心
領取獎勵和空投
預警
語言
貨幣
顏色設置
下載 OKX Wallet
Web3 指南
公告
返回
繁體中文
简体中文
English
Tiếng Việt
Русский
Español (Latinoamérica)
Bahasa Indonesia
Français
Deutsch
Italiano
Polski
Čeština
Română
Português (Portugal)
Português (Brasil)
Українська
Español (España)
Nederlands
العربية
日本語
Norsk (bokmål)
Suomi
Svenska
Türkçe
返回
返回
學院
幫助中心
熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
Hosico
+0.3%
USELESS
+0.6%
IKUN
+15.12%
gib
+5.42%
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
Bonk
+0.21%
ALON
+0.45%
LAUNCHCOIN
-5.55%
GOONC
-1.32%
KLED
+2.3%
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
BOOP
-0.71%
Boopa
-5.9%
PORK
0.00%
主頁
Scott Wu
建築@cognition
查看原文
Scott Wu
2026年1月31日
作為工程師,您擁有的最稀缺資源就是自己的時間。不同的模型在不同的任務上表現各異,所有的 LLM 有時候也會出現不穩定的情況,因此節省編碼時間的一種自然方法是同時在多個模型上運行相同的任務,然後比較結果,決定您更喜歡哪一個。 這樣做的一個有趣副作用是,我們得到了或許是最自然的現實世界編碼評估!每個人都知道在固定任務集上進行基準測試是多麼容易;這個評估是真正測試哪些模型最適合開發者在日常工作中的工具。
Windsurf
2026年1月31日
在 Windsurf 中介紹 Arena 模式:一個提示。兩個模型。你的投票。 基準測試無法反映實際的編碼質量。最適合你的模型取決於你的代碼庫和技術棧。因此,我們將實際編碼作為基準。 下週免費。願最好的模型獲勝。
70
Scott Wu
2026年1月29日
Cogni 團隊!很高興能與 @Cognizant 合作,讓 Devin 和 Windsurf 能夠接觸到更多的工程師。
Cognizant
2026年1月28日
Cognizant 與 @cognition_labs 正在合作,將自主 AI 工程引入企業 – 由 Devin 提供支持,這是第一個能夠獨立處理端到端開發任務的 AI 軟體工程師。 通過將 Devin 和 @windsurf 與 Cognizant 的交付模型及 Cognizant Flowsource™ 結合,我們正在幫助企業更快地現代化應用程式,提高工程生產力,並在代碼遷移、測試、重構和持續運營中應用 AI。 閱讀更多:
135
Scott Wu
2026年1月28日
Devin Review () 現在已經上線一週了。希望聽聽你們對於哪些地方運作良好,哪些地方不佳的反饋! 我們可以做些什麼來改善呢?
153
熱門
排行
收藏