一站式 Web3 探索中心 | 去中心化应用商店 & Web3 线下活动 | OKX Wallet

发现功能使用指南

background background

discoveryBanners

热门话题

#

Bonk 生态迷因币展现强韧势头

#

有消息称 Pump.fun 计划 40 亿估值发币，引发市场猜测

LAUNCHCOIN+49.76%

#

Solana 新代币发射平台 Boop.Fun 风头正劲

header

mike64_t

渐坡下降

mike64_t

mike64_t8 小时前

看起来 tinygrads 的抽象正在成型？我不想当那个家伙，但 Blackwell 是唯一真正的实力测试。即使他们没有专注于 Blackwell，他们也应该证明他们的抽象适合它，以避免 Triton 的困境。这是唯一的办法。

the tiny corp

the tiny corp9 小时前

这个 float32 N=4096 的矩阵乘法在 7900XTX 上的表现优于 rocBLAS（类似于 seb-v 博客文章中的 kernel5）。请查看 extra/gemm/amd_uop_matmul.py 中的 UOps。

21.18K

mike64_t

mike64_t10月18日 12:53

虽然我并不是说这种自我提升的循环最终无法奏效，但我认为我们还没有达到“逃逸速度”。目前的LLM并不够“诚实”，尤其是在施加优化压力时，无法避免崩溃。在此之前，我们只有一个N=1的样本量，能够可靠地赋予一系列新兴能力：预训练。人们应该少花时间考虑后训练，而应该多花时间考虑那些看起来像预训练但可能承载不同承诺的事物。

6.42K

mike64_t

mike64_t10月18日 12:33

我认为，关于大型语言模型（LLMs）是“糟糕的导师”，因为它们无法准确探测理解能力的观察是准确的。"整体提升"的做法是愚蠢的这一事实也是如此。然而，我并不明显认为解决这个问题的方法是让LLM反思“做得好的地方”。我认为这会遇到非常相似的崩溃风险或监督错误分配的问题。因为虽然我们可能是通过吸管吸取监督，但唯一更糟糕的事情就是通过吸管吸取被污染的监督。

37.73K

热门

排行

收藏

©2017 - 2025 WEB3.OKX.COM

简体中文繁體中文 English Tiếng Việt Русский Español (Latinoamérica)Bahasa Indonesia Français Deutsch Italiano Polski Čeština Română Português (Portugal)Português (Brasil)Українська Español (España)Nederlands العربية 日本語 Norsk (bokmål)Suomi Svenska

关于 OKX Wallet

下载学院关于我们就业机会联系我们服务条款隐私政策 X (原推特)

产品

行情币币兑换市场赚币发现开发者中心浏览器安全

用户支持

帮助中心官方渠道验证公告 DEX 费率标准加入社群比特币钱包以太坊钱包 Solana 钱包