Veldig glad for å dele vårt siste arbeid på AgentSynth: Et nytt paradigme for å generere realistiske, skalerbare og langsiktige databruksoppgaver og benchmarks! Vår automatiserte pipeline genererer et datasett med 6,000+ oppgaver med to revolusjonerende fordeler: Dramatiske kostnadsbesparelser 💰 : AgentSynth produserer oppgaver til bare $0.60 per bane – størrelsesordener billigere enn tradisjonell menneskelig kommentar. High-Fidelity-kompleksitet 🧗 : Disse oppgavene gjenspeiler langsiktige utfordringer i den virkelige verden, og krever ofte at agenter koordinerer på tvers av flere applikasjoner som Chrome, VS Code og LibreOffice for å lykkes.
Xuandong Zhao
Xuandong Zhao18. juni 2025
🚀 Gleder meg til å dele vårt siste arbeid: AgentSynth En kraftig og kostnadseffektiv pipeline for å generere varierte, høykvalitets og realistiske databruksoppgaver Detaljer nedenfor 🧵 (1/n)
Stor takk til samarbeidspartnerne @Jingxu97, Dylan Xu og @xuandongzhao. 📷 📷
6,3K