跳转至主要内容
行情
扫链
追踪
信号
牛人榜
兑换
资产
邀请计划
更多
产品
DeFi
市场
洞察中心
Eco Hub
安全中心
开发者中心
DEX API
探索 DEX API
DEX API 文档
API Key 管理
区块链浏览器
X Layer
探索 X Layer
X Layer 浏览器
跨链桥
开发者文档
测试网水龙头
GitHub
DApp 连接钱包
Boost
X Launch
参与 X Launch,抢先赚新币
Giveaway
完成指定任务,领取空投好礼
交易赛
交易热门代币,冲榜赢大奖
奖励中心
领取奖励和空投
预警
语言
货币
下载 OKX Wallet
Web3 指南
公告
返回
简体中文
繁體中文
English
Tiếng Việt
Русский
Español (Latinoamérica)
Bahasa Indonesia
Français
Deutsch
Italiano
Polski
Čeština
Română
Português (Portugal)
Português (Brasil)
Українська
Español (España)
Nederlands
العربية
日本語
Norsk (bokmål)
Suomi
Svenska
返回
返回
使用教程
学院
帮助中心
发现功能使用指南
热门话题
#
Bonk 生态迷因币展现强韧势头
Hosico
+6.84%
USELESS
+19.17%
IKUN
-1.42%
gib
-7.48%
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
Bonk
+4.8%
ALON
-0.86%
LAUNCHCOIN
+17.33%
GOONC
-7.3%
KLED
+15.31%
#
Solana 新代币发射平台 Boop.Fun 风头正劲
BOOP
-0.09%
Boopa
+8.36%
PORK
-3.75%
主页
Teknium (e/λ)
Teknium (e/λ)
2 小时前
在我看来,rl 只是一个更可接受的说法,用来描述合成数据,而两年前我开始进行拒绝采样以制作 Hermes 1 时,大家并不喜欢这种数据。 合成数据(包括半合成数据)自从 ChatGPT 发布以来就一直存在。
aurelium /ɔˈreːliəm/
3 小时前
那些模糊且没有解释地说“RL 不是未来”的人总是让我感到困惑。 这就像把“无监督学习”视为不是未来一样。
3.29K
23
Teknium (e/λ)
2 小时前
从我的角度来看,rl 只是一个更可接受的说法,用来描述两年前我开始进行拒绝采样以制作 Hermes 1 时大家并不喜欢的合成数据。 合成数据(包括半合成数据)自 ChatGPT 发布以来就一直存在。
aurelium /ɔˈreːliəm/
3 小时前
那些模糊且没有解释地说“RL 不是未来”的人总是让我感到困惑。 这就像把“无监督学习”视为不是未来一样。
908
Teknium (e/λ)
3 小时前
openai 是否对每个项目的每位领导进行培训,教他们如何模糊发帖和炒作
4.46K
96
热门
排行
收藏