第一印象是,给Codex 5.3和Opus 4.6同样的问题,我这一周一直在思考,并使用相同的前几条消息,然后跟随它们的引导。 Codex在使用工具和主动性方面表现得非常好,但最终没有看到大局。太急于同意我的观点,以便开始构建某些东西。你可以感觉到,如果有编码工具可用,它真的不想聊天。似乎仍然在用户的规则下感到不适,只是遵循法律的字面意思,没有更多。 Opus与我探索了相同的途径,但在正确的时刻进行了反击,并且在保持全球一致性方面远胜于Codex。它比之前少了些活泼,这我个人更喜欢。但它也更能舒适地保持对话中的紧张感,尝试与之共处或解开它,这使它在寻找线索和理解不同系统如何相互影响方面具有优势。 这只是第一印象,但考虑到我昨天与它们的前身讨论这个问题,看到变化很有趣。模型仍然相似。Opus的改进感觉更大,但我还没有放开它们,这仍然是研究和规格设计工作。Codex在我有计划后,实际上完全实施计划的可能性很大,Opus 4.5有懒惰的天才孩子的能量,如果这个也这样我也不会感到惊讶。