热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲
关于GPT-5和OpenAI在推理链方面的一些快速吐槽:
GPT-5(尤其是Thinking High)是一个令人难以置信的模型。
但OpenAI决定隐藏真实的思维链,使得从中获得最佳结果变得非常困难。
使用其他推理模型时,我可以告诉它们我希望它们如何思考和推理,并且我可以通过查看推理链来判断它们是否这样做。然后我可以迭代和调整,直到它们完全按照我的要求进行。
不幸的是,使用OpenAI的模型,这几乎是不可能的。你实际上无法看到它在做什么,因此你基本上是在盲目操作,希望模型能做到你想要的。
我明白他们这样做是出于竞争原因。但这确实使得API产品对我来说远不如它本该有的效果。
随着竞争对手在GPT-5上不断取得进展,当我可以从其他模型中获得更多收益,因为我可以更好地引导它们时,继续使用OpenAI的API将变得困难。
我明白这对大多数API客户群体来说并不是问题(至少目前如此,因为大多数人还没有真正掌握如何提示推理模型),但对于像我这样生活在这个领域并知道如何最大化模型效用的人来说,这是一大障碍。
我希望他们能在这里提出一个更好的解决方案。我完全理解其中的竞争动态,因此不一定需要展示完整的真实思维链。但目前的推理“摘要”糟糕透顶,几乎没有任何信号。即使在这方面有一点小的改进,也会使得在API上使用GPT-5变得容易得多。
29.08K
热门
排行
收藏