工作流代理 无需编码或构建工作流即可创建 API。 只需展示需要完成的任务。 使用 @browserbase 录制自己搜索航班、查看股票价格或填写表单... 并获得一个可以处理不同输入的 x402 端点。
您设定一个目标和一个起始 URL,然后演示一次任务。系统捕捉您的意图,检测变量,并创建一个 x402 端点(一个付费 API) 要调用该端点,用户/代理需要支付创作者和他们自己的 Browserbase 会话费用。所有这些通过 x402 通过 HTTP 进行(按使用付费,无需 API 密钥) 当有人调用该端点时,您的工作流程会在 @browserbase 上再次运行,使用他们的输入 以下是它的工作原理👇
语义捕获 人工智能分析您的录音以理解您所做的事情 - 基于浏览器的实时会话 - 通过CDP监控浏览器 - 捕获语义意义,而不仅仅是点击 - 理解自动完成字段、日期选择器、下拉菜单 - 将按键组合成有意义的动作
AI 变量检测 系统识别哪些值应该是变量 - GPT-4o 将输入的值映射到变量 - "JFK 机场" → %origin%, "LAX 机场" → %destination% - 它为 API 创建一个增强的 '目标' 提示,以便处理不同的输入
三重回退策略 AI 创建备份方式,以便在网站更改时重放您的工作流程(所有操作在 Browserbase 会话中运行) 1. 使用精确选择器的 Playwright 2. 使用自然语言指令的 Stagehand act() 3. 代理模式:从目标进行自主导航,使用计算机
模式生成 人工智能确定返回哪些数据(价格、结果等) - 人工智能推断要提取的数据 - 针对常见模式的模板 - 针对自定义任务的上下文感知 - 在保存之前测试提取
验证 在测试技能正常工作后,这将成为一个按使用付费的 API 端点 - 在新会话中重放工作流 - 验证一切正常 - 将指标保存到 MongoDB - 使其 x402 受保护,动态 payTo 指向创作者的地址
229