ワークフローエージェント コーディングやワークフロー構築なしでAPIを作る。 必要なことを示せばいい。 @browserbaseと一緒にフライトを検索したり、株価を確認したり、書類を記入したりする自分を録画してください...そして、異なる入力に対応したx402エンドポイントを手に入れてください
目標と開始URLを設定し、そのタスクを一度だけ実演します。システムはあなたの意図をキャプチャし、変数を検出し、x402エンドポイント(ペイゲートAPI)を作成します エンドポイントを呼び出すには、ユーザーやエージェントがクリエイターと自分のBrowserbaseセッションの料金を支払う必要があります。これらすべてはHTTP経由のx402(利用課金型でAPIキーなし)を通じて行われます。 誰かがエンドポイントを呼び出しると、その入力を@browserbaseでワークフローが再実行されます 仕組👇みはこうです
意味捕捉 AIはあなたの録音を分析し、何をしたのか理解します - ライブビューを用いたブラウザベースセッション - CDP経由でブラウザをモニター - クリックだけでなく意味的な意味を捉える - オートコンプリートフィールド、日付ピッカー、ドロップダウンを理解する - キーストロークを意味のある行動にまとめる
AI変数検出 システムはどの値を変数にすべきかを見極めます - GPT-4oは型付けされた値を変数にマッピングします - 「JFK空港」→%出発地%、「LAX空港」→%目的地% - APIが異なる入力に対応して動作するための強化「目標」プロンプトを作成する
トリプルフォールバック戦略 AIはウェブサイトが変更された場合に備えてワークフローを再生するバックアップ方法を作成します(すべてBrowserbaseセッションで実行されます) 1. 正確な選択器を持つ劇作家 2. 自然言語の指示を伴う舞台監督の演技() 3. エージェントモード:コンピュータ利用による目標からの自律ナビゲーション
スキーマ生成 AIはどのデータ(価格、結果など)を返すべきかを計算します。 - AIはどのデータを抽出すべきかを推論します - 一般的なパターンのためのテンプレートベース - カスタムタスクのためのコンテキスト認識機能 - 保存前の抽出テスト
検証 スキルが動作することをテストした後、これは利用者課金型のAPIエンドポイントとなります - 新しいセッションでのリプレイワークフロー - すべてが正常に動作することを確認する - 指標を使ったMongoDBへの保存 - x402で動的なpayToが作成者のアドレスを指し示して保護される
229