跳转至主要内容
行情
扫链
追踪
信号
牛人榜
兑换
资产
邀请计划
更多
产品
DeFi
市场
洞察中心
Eco Hub
安全中心
开发者中心
Wallet API
探索 Wallet API
API 文档
API Key 管理
区块链浏览器
X Layer
探索 X Layer
X Layer 浏览器
跨链桥
开发者文档
测试网水龙头
GitHub
DApp 连接钱包
Boost
X Launch
参与 X Launch,抢先赚新币
Giveaway
完成指定任务,领取空投好礼
交易赛
交易热门代币,冲榜赢大奖
奖励中心
领取奖励和空投
预警
语言
货币
下载 OKX Wallet
Web3 指南
公告
返回
简体中文
繁體中文
English
Tiếng Việt
Русский
Español (Latinoamérica)
Bahasa Indonesia
Français
Deutsch
Italiano
Polski
Čeština
Română
Português (Portugal)
Português (Brasil)
Українська
Español (España)
Nederlands
العربية
日本語
Norsk (bokmål)
Suomi
Svenska
返回
返回
使用教程
学院
帮助中心
发现功能使用指南
热门话题
#
Bonk 生态迷因币展现强韧势头
Hosico
-9.95%
USELESS
-20.62%
IKUN
-18.06%
gib
-4.48%
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
Bonk
-11.43%
ALON
-13.8%
LAUNCHCOIN
+49.76%
GOONC
-20.98%
KLED
-19.26%
#
Solana 新代币发射平台 Boop.Fun 风头正劲
BOOP
-2.01%
Boopa
-2.63%
PORK
-8.02%
主页
mike64_t
渐坡下降
查看原文
mike64_t
8 小时前
看起来 tinygrads 的抽象正在成型? 我不想当那个家伙,但 Blackwell 是唯一真正的实力测试。即使他们没有专注于 Blackwell,他们也应该证明他们的抽象适合它,以避免 Triton 的困境。这是唯一的办法。
the tiny corp
9 小时前
这个 float32 N=4096 的矩阵乘法在 7900XTX 上的表现优于 rocBLAS(类似于 seb-v 博客文章中的 kernel5)。请查看 extra/gemm/amd_uop_matmul.py 中的 UOps。
21.18K
101
mike64_t
10月18日 12:53
虽然我并不是说这种自我提升的循环最终无法奏效,但我认为我们还没有达到“逃逸速度”。目前的LLM并不够“诚实”,尤其是在施加优化压力时,无法避免崩溃。 在此之前,我们只有一个N=1的样本量,能够可靠地赋予一系列新兴能力:预训练。 人们应该少花时间考虑后训练,而应该多花时间考虑那些看起来像预训练但可能承载不同承诺的事物。
6.42K
64
mike64_t
10月18日 12:33
我认为,关于大型语言模型(LLMs)是“糟糕的导师”,因为它们无法准确探测理解能力的观察是准确的。"整体提升"的做法是愚蠢的这一事实也是如此。然而,我并不明显认为解决这个问题的方法是让LLM反思“做得好的地方”。我认为这会遇到非常相似的崩溃风险或监督错误分配的问题。因为虽然我们可能是通过吸管吸取监督,但唯一更糟糕的事情就是通过吸管吸取被污染的监督。
37.73K
160
热门
排行
收藏