跳转至主要内容
行情
扫链
追踪
信号
跟单
兑换
资产
邀请计划
更多
产品
DeFi
市场
安全中心
开发者中心
X Layer
探索 X Layer
X Layer 浏览器
跨链桥
开发者文档
测试网水龙头
GitHub
Wallet API
探索 Wallet API
API 文档
API Key 管理
区块链浏览器
DApp 连接钱包
Boost
X Launch
参与 X Launch,抢先赚新币
X Campaign
参与活动,赢取丰厚奖励
奖励中心
领取奖励和空投
预警
语言
货币
颜色设置
下载 OKX Wallet
Web3 指南
公告
返回
简体中文
繁體中文
English
Tiếng Việt
Русский
Español (Latinoamérica)
Bahasa Indonesia
Français
Deutsch
Italiano
Polski
Čeština
Română
Português (Portugal)
Português (Brasil)
Українська
Español (España)
Nederlands
العربية
日本語
Norsk (bokmål)
Suomi
Svenska
Türkçe
返回
返回
学院
帮助中心
热门话题
#
Bonk 生态迷因币展现强韧势头
Hosico
-5.22%
USELESS
-7.8%
IKUN
-4.7%
gib
-4.38%
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
Bonk
-3.72%
ALON
-9.93%
LAUNCHCOIN
+0.39%
GOONC
-2.05%
KLED
-11.48%
#
Solana 新代币发射平台 Boop.Fun 风头正劲
BOOP
+0.87%
Boopa
+7.09%
PORK
0.00%
主页
Igor Kotenkov
Igor Kotenkov
1月28日 09:21
我不是在开玩笑,当我看到原始的Anthropic计划、DC的建设规模和盈利预测时,我心想:"好吧,如果这是他们的策略,那么他们的野心不够,无法与Sama竞争。" 对某些人来说,这似乎是个愚蠢的看法。好吧,让我们看看 :) "但是,包括训练和运行其AI模型的费用也在快速增长,超出了收入。因此,Anthropic推迟了预计实现现金流正的时间到2028年," 如果两家公司都要到2030-31年,我也不会感到惊讶 :) 感谢@theinformation @srimuppidi @amir的报道。
Igor Kotenkov
1月13日 08:12
我想我得写一篇关于DeepSeek的Engram的长篇解释。 如果你想要一个解释,给这条帖子点赞 - 关于梯度如何通过哈希函数流向嵌入 - 或者它们如何融合成一个单一的FP8 MMA - 或者为什么他们在变换器中使用卷积
Premium
1月13日 06:37
所有高级订阅者现在都可以发布文章。 长篇写作在𝕏上有效。 试试看,建立你的粉丝群。
80
Igor Kotenkov
1月13日 01:06
当RETRO发布时,我认为检索对于LLMs来说是一个大问题,可以减少参数数量,同时增加模型的知识深度。令我惊讶的是,许多公司避免了这个想法。 Whale将检索带到了桌面: > 最显著的是,虽然内存模块预计将有助于知识检索(例如,MMLU +3.4;CMMLU +4.0),但我们观察到在一般推理(例如,BBH +5.0;ARC-Challenge +3.7)和代码/数学领域(HumanEval +3.0;MATH +2.4)中甚至有更大的提升。机制分析表明,Engram减轻了主干早期层的静态重建,有效地加深了网络以进行复杂推理。
Igor Kotenkov
1月13日 00:57
Ok there's new Whale drop cc @teortaxesTex
132
热门
排行
收藏