跳轉至主要內容
行情
掃鏈
追蹤
信號
牛人榜
兌換
資產
邀請計劃
更多
產品
DeFi
市場
洞察中心
Eco Hub
安全中心
開發者中心
DEX API
探索 DEX API
DEX API 文檔
API Key 管理
區塊鏈瀏覽器
X Layer
探索 X Layer
X Layer 瀏覽器
跨鏈橋
開發者文檔
測試網水龍頭
GitHub
DApp 連接錢包
Boost
X Launch
參與 X Launch,搶先賺新幣
Giveaway
完成指定任務,領取空投好禮
交易賽
交易熱門代幣,衝榜贏大獎
獎勵中心
領取獎勵和空投
預警
語言
貨幣
下載 OKX Wallet
Web3 指南
公告
返回
繁體中文
简体中文
English
Tiếng Việt
Русский
Español (Latinoamérica)
Bahasa Indonesia
Français
Deutsch
Italiano
Polski
Čeština
Română
Português (Portugal)
Português (Brasil)
Українська
Español (España)
Nederlands
العربية
日本語
Norsk (bokmål)
Suomi
Svenska
返回
返回
使用教程
學院
幫助中心
發現功能使用指南
熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
Hosico
-3.69%
USELESS
+18.75%
IKUN
+16.49%
gib
+8.04%
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
Bonk
+5.66%
ALON
+11.64%
LAUNCHCOIN
+7.13%
GOONC
-3.86%
KLED
+42.61%
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
BOOP
+0.94%
Boopa
+3.05%
PORK
-5.89%
主頁
Jack Morris
研究@cornell // 語言模型、資訊論、人工智慧科學
查看原文
Jack Morris
10月17日 00:35
我一直很好奇 LLMs 在強化學習 (RL) 過程中會 "忘記" 什麼資訊。 最近我花時間查閱研究,尋找模型在強化學習後變得更差的例子。 結果發現,學會推理使模型在幾乎所有方面都變得更好。 說實話,這是一個可怕的認知。
24.93K
369
Jack Morris
10月16日 21:51
首先,AI 來到了 Stack Overflow 而我沒有發聲 因為他們不愉快的版主 然後 AI 來到了 Quora 而我沒有發聲 因為我從不使用 Quora 然後 AI 來到了維基百科 而我沒有發聲 因為我不在乎 然後 AI 來到了 AI 研究 而沒有人再為我發聲
55K
608
Jack Morris
10月16日 11:44
關於 Anthropic 有一件有趣的事是,所有的招聘電子郵件背後其實都是 Claude。所有內容都是從人類招聘者的角度寫的,但實際上你只是在和 Claude 交談。這真的很有趣,我覺得。
sarah 💜
10月15日 04:52
由 WHAT 創建
10
熱門
排行
收藏