Wir freuen uns sehr, unsere neuesten Arbeiten zu AgentSynth zu teilen: Ein neues Paradigma für die Generierung realistischer, skalierbarer und langfristiger Aufgaben und Benchmarks für die Computernutzung! Unsere automatisierte Pipeline generiert einen Datensatz von 6.000+ Aufgaben mit zwei bahnbrechenden Vorteilen: Drastische Kosteneinsparungen 💰: AgentSynth produziert Aufgaben zu nur 0,60 US-Dollar pro Trajektorie – um Größenordnungen günstiger als herkömmliche menschliche Annotationen. High-Fidelity-Komplexität 🧗: Diese Aufgaben spiegeln reale langfristige Herausforderungen wider und erfordern oft, dass sich die Agenten über mehrere Anwendungen wie Chrome, VS Code und LibreOffice hinweg koordinieren, um erfolgreich zu sein.
Xuandong Zhao
Xuandong Zhao18. Juni 2025
🚀 Excited to share our latest work: AgentSynth A powerful and cost-effective pipeline for generating diverse, high-quality, and realistic computer-use tasks Details below 🧵(1/n)
Ein großes Dankeschön an die Mitarbeiter @Jingxu97, Dylan Xu und @xuandongzhao. 📷 📷
6,38K