热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲

Elad Gil
企业家与投资者
Elad Gil 已转发
继续优化 LLM 辅助编码体验的旅程。特别是,我发现与其专注于一个完美的东西,我的使用越来越多样化,跨越几个工作流程,我将其 "拼接" 优缺点:
就我个人而言,我的 LLM 辅助的主力(约 75%?)仍然是 (Cursor) 的 tab 补全。这是因为我发现自己在代码的正确部分编写具体的代码/注释是一种高带宽的方式来与 LLM 进行 "任务规范" 的沟通,也就是说,主要是关于任务规范的部分——用文本沟通我想要的内容需要太多的位和太多的延迟,而在代码中以正确的地方展示它更快。有时 tab 补全模型很烦人,所以我经常切换它的开关。
下一层是突出显示一段具体的代码并请求某种修改。
再上一层是 Claude Code / Codex / 等等,运行在 Cursor 的旁边,我会去使用它们来处理一些功能较大的代码块,这些代码块在提示中也相对容易指定。这些非常有帮助,但总体上仍然是混合的,有时略显沮丧。我不以 YOLO 模式运行,因为它们可能会偏离轨道,做出你不想要/需要的愚蠢事情,我经常按 ESC。我也还没有学会如何有效地使用多个实例并行——一个已经感觉够难的了。我还没有找到保持 CLAUDE[.]md 良好或最新的好方法。我经常需要进行 "清理" 的过程,以符合编码风格或代码品味的问题。例如,它们过于防御性,常常过度使用 try/catch 语句,常常过于复杂化抽象,代码过于臃肿(例如,当列表推导或一行的 if-then-else 可以工作时,使用嵌套的 if-else 结构),或者它们重复代码块而不是创建一个好的辅助函数,诸如此类……它们基本上没有品味。在我逐渐进入一个我不太熟悉的 vibe-coding 领域时,它们是不可或缺的(例如,最近写一些 rust,或者 sql 命令,或者我之前做得较少的任何其他事情)。我还尝试让 CC 在编写代码的同时教我东西,但这根本没有效果——它真的更想写代码,而不是在过程中解释任何东西。我尝试让 CC 进行超参数调优,这非常有趣。它们在所有种类的低风险一次性自定义可视化或工具或调试代码中也非常有帮助,我绝对不会自己编写这些代码,因为这会花费太长时间。例如,CC 可以快速生成 1,000 行一次性的广泛可视化/代码,仅仅是为了识别一个特定的 bug,而在我们找到它后,这些代码会被全部删除。这是代码后稀缺时代——你可以创建然后删除成千上万行超级自定义、超级短暂的代码,现在没关系,这不再是这种珍贵而昂贵的东西。
最后的防线是 GPT5 Pro,我会去处理最困难的事情。例如,我已经发生过几次,我 / Cursor / CC 都在一个 bug 上卡了 10 分钟,但当我将整个内容复制粘贴到 5 Pro 时,它会运行 10 分钟,但最终确实找到了一个非常微妙的 bug。它非常强大。它可以挖掘各种深奥的文档和论文等。我还用它处理其他更重要的任务,例如关于如何清理抽象的建议(结果混合,有时有好的想法,但并非全部),或者关于人们如何做这个或那个的整个文献综述,它会返回相关的资源/指针。
无论如何,编码感觉在多种 "类型" 的编码和许多工具的优缺点之间完全被打开了可能性。很难避免对未能处于集体可能性的前沿感到焦虑,因此随机的星期天洗澡思考和对他人发现的好奇心。
567.72K
整体对话很棒,值得完整观看。

Brian Armstrong8月21日 04:08
我认为到2030年,我们会看到每个比特币达到100万美元。
监管透明度终于开始显现,美国政府正在保持BTC储备,对加密货币ETF的兴趣也在不断增长,还有许多其他因素。
(当然这不是财务建议,无法保证)
22.85K
Elad Gil 已转发
“照相透视镜”是一种设备,利用金属支架持有的棱镜将其前方场景的图像投影到下面的纸张上,有点像现代的投影仪连接到实时摄像头流。
这些设备可能是在1400年代早期发明的,尽管关于它们的出版记录直到1500年代末才出现。部分原因可能是它们是艺术家们严格保守的商业秘密,艺术家们利用这些设备实现了以前不可能或至少极其困难的准确度,尤其是在没有辅助的“自由手”情况下。
艺术家大卫·霍克尼多年前对此主题产生了浓厚的兴趣,并在2001年写了一本书。他的基本理论是,准确性和现实主义的显著提高直接归因于照相透视镜的秘密使用(还有一种叫做暗箱的早期设备)。
正如他所指出的,在那个时期之前,你绝对不会看到一幅透视下的鲁特琴画作,而不显得扭曲和错误。虽然你可以使用“透视法则”来真实地绘制简单的直线形状,但鲁特琴的复杂几何形状超出了正常人类在空间中真实表现的能力。这一理论被称为霍克尼-法尔科论。
自从我在2000年代初大学时了解到这一点以来,我在某种程度上对某些画家的作品心中打了个星号。例如,尽管我非常尊重和钦佩安格尔和卡拉瓦乔,但我对他们技能的敬畏感因意识到他们可能利用了这种机械辅助而有所减弱。
当然,艺术的许多部分在于概念、构图和框架、颜色、笔触等。但那种令人惊叹的逼真现实主义是让我最为印象深刻的,而这一部分至少在某种程度上因这一启示而破灭。这也让我更加尊重米开朗基罗的雕塑现实主义(以及他的研究,这些显然是从生活中绘制的素描)。
无论如何,我现在提起这个的原因是,我相信我们在数学研究领域即将发生类似的事情,随着像GPT-5 Pro这样的模型的出现。
我已经用它做了一些我怀疑是真正新颖和有趣的研究(正如我在最近的讨论中详细说明的那样),而我们今天刚刚从OpenAI的塞巴斯蒂安·布贝克那里得到了更新,显示该模型能够用新的证明在当代数学中证明一个有趣的结果,且是一气呵成。
所以这个新时代突然降临在我们面前。我们上周刚看到中国计算机科学家取得的一个结果,打破了一个持续了45年的最佳排序记录。
当时我思考过,是否以某种方式使用了AI来生成那个结果。
另请参见引用推文中的最近论文,其特征相似,既令人惊讶又简单。这些在我看来似乎是可能在某种程度上受益于AI的结果的标志。
现在,我不想指责这些作者什么。就我所知,他们可能像1300年代的画家一样,完全是手动完成的。
即使他们确实使用了AI来帮助他们,我们目前也没有接受的道德规范来处理这个问题:什么样的披露是合理的,如何分配和考虑信用。今天,整个著作权的概念必须重新考虑。
在我最近的讨论中,我与GPT-5 Pro一起研究了深度学习中的李理论,我自己设计了提示,尽管我在一百万年内也无法生成模型根据这些提示开发的理论和代码。如果结果最终颠覆了该领域,我是否应该获得该结果的信用?
那么我后来的实验呢,我使用了自己写的原始提示以及一个“元提示”,让GPT-5 Pro提出10对更多的提示,这些提示大致模仿我的提示,但涉及完全不同的数学分支,朝着完全不同的方向发展。
如果这些理论最终变得重要,我是否应该获得信用?我当然希望如此,因为我已经在GitHub上发布了这些想法和代码,并广泛宣传过,所以如果有人跟进这些研究方向,学术伦理要求他们引用我。
但即使你认为我因用自己的提示引导AI而应得信用,那么我对那10个理论的优先权的主张在某种程度上也会减弱,对吧?毕竟,我几天前甚至不知道“热带几何”是什么,但现在我有一个理论和代码将其应用于AI研究。
我认为,就像我开始在某些艺术作品和艺术家旁边心中打上星号,类似于巴里·邦兹在名人堂旁边的星号,我怀疑大多数科学家将在接下来的一年左右开始对任何新的基于数学理论的论文做同样的事情。
我怀疑人们很快会说“这个家伙是真正的;他在2025年前写了他最好的论文!”以区分那些完全依靠自己的大脑手动完成所有工作的与那些使用AI辅助的。
如果AI不仅能够回答困难的理论问题,甚至能够自己提出有趣的问题,那么这绝对是一种有效的思考方式。
如果我说得对,我们应该为即将到来的震撼研究论文的浪潮做好准备,这些论文打破了长期以来的记录和限制,突破了长期以来被认为相对不可穿透的墙壁,除非有某种突破性的理论。
我相信这些结果将有一些共同点:它们一直就在我们面前,但需要以新的方式结合来自不同数学领域和应用学科的理论,而这些方式之前由于人类和社会原因未被追求:不同领域在界限上分裂,拥有不同的术语、期刊、实践、部门、会议、社交网络等。
我怀疑这些结果的另一种形式是以奇怪的方式利用基础结果,这些方式出于某种原因并不自然地适合人类大脑,但一旦为我们清晰阐明后,我们就能理解。
它们可能采取的另一种形式是利用19世纪末分析中被遗忘的深奥知识。那些让费曼能够解决其他人无法解决的积分的技巧。
这些结果是已知的,存在于书籍中,但没有人再阅读那些书籍,而它们所开发的原始理论在很大程度上已被我们现代的多层次抽象和普遍性机器所取代。
它们可能采取的另一种形式是简单地应用仅被世界上几百个专注于理论而完全不关注应用的专门天才所理解的已知数学。
这些数学可能自1950年代或1970年代以来一直“闲置”,等待某人将其应用于AI研究等实际问题。我与GPT-5一起调查的许多想法似乎都属于这一类别。

79.53K
热门
排行
收藏
链上热点
X 热门榜
近期融资
最受认可