Veldig glad for å dele vårt siste arbeid på AgentSynth: Et nytt paradigme for å generere realistiske, skalerbare og langsiktige databruksoppgaver og benchmarks! Vår automatiserte pipeline genererer et datasett med 6,000+ oppgaver med to revolusjonerende fordeler: Dramatiske kostnadsbesparelser 💰 : AgentSynth produserer oppgaver til bare $0.60 per bane – størrelsesordener billigere enn tradisjonell menneskelig kommentar. High-Fidelity-kompleksitet 🧗 : Disse oppgavene gjenspeiler langsiktige utfordringer i den virkelige verden, og krever ofte at agenter koordinerer på tvers av flere applikasjoner som Chrome, VS Code og LibreOffice for å lykkes.
Xuandong Zhao
Xuandong Zhao18. juni 2025
🚀 Excited to share our latest work: AgentSynth A powerful and cost-effective pipeline for generating diverse, high-quality, and realistic computer-use tasks Details below 🧵(1/n)
Stor takk til samarbeidspartnerne @Jingxu97, Dylan Xu og @xuandongzhao. 📷 📷
6,4K