热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲
垂直AI挑战
垂直AI创始人们:你们已经花了2年以上的时间来构建你们的代理,基于客户数据训练模型,嵌入工作流程,创建强大的市场推广策略,遵循所有最佳实践。你们击退了竞争者,成为你们垂直领域的第一或第二名玩家。
抱歉,你们不能放松。实际上,你们需要大幅提升自己的能力。
事实证明,你们面临着一个生存挑战:长时间运行的代理(例如:Claude Code)。这些代理并不是在特定领域训练的,但可以在追求目标的过程中可靠地工作数小时或数天,自我纠正,并实际执行任务。
我相信许多垂直AI创始人会说:“哦,我们不担心。我们是决策痕迹的记录系统。我们在企业特定的上下文中进行训练。这就是为什么这些横向代理永远无法赶上我们的原因。”
你们可能是对的。
但是,但是,但是……你们不能把头埋在沙子里。这些长时间运行的代理会非常非常快地变得更好。你们需要准确了解它们在你们构建的代理所专注的具体工作上的表现有多好。你们不能等着别人来做这件事。例如,如果你们是一家法律AI公司,拥有一个自动化合同审查的代理,你们必须比较你们的专业代理与一个通用的长时间运行代理的表现,后者只是被给定合同并被要求执行相同的审查。
我对你们的挑战是:在你们的团队中指派一位强大的工程师,100%专注于使用长时间运行的代理(除了上述示例中的合同外,几乎没有上下文)来与你们定制训练的代理竞争。基准测试长时间运行的代理与你们的代理的表现。每隔几个月重复一次。
就像大多数值得衡量的事物一样,重要的是改进的速度(“斜率”与Y轴截距)。如果长时间运行的代理在第一天的表现是你们垂直代理的30%,但在第60天是50%,在第120天是70%,你们需要重新评估你们的产品战略。
AGI正在向每个人袭来。长时间运行的代理是我们最接近AGI的存在,作为一家垂直AI公司,你们需要弄清楚如何竞争和生存。
游戏开始。
热门
排行
收藏
