Opravdu nadšeni, že se můžeme podělit o naši nejnovější práci na AgentSynth: Nové paradigma pro generování realistických, škálovatelných a dlouhodobých úloh a benchmarků pro použití počítačů! Náš automatizovaný kanál generuje datovou sadu 6 000+ úkolů se dvěma výhodami, které mění hru: Dramatická úspora 💰 nákladů: AgentSynth vytváří úkoly za pouhých 0.60 $ za trajektorii – řádově levnější než tradiční lidská anotace. Vysoká věrnost složitosti 🧗 : Tyto úkoly odrážejí skutečné výzvy v dlouhodobém horizontu, které často vyžadují, aby agenti koordinovali více aplikací, jako je Chrome, VS Code a LibreOffice, aby uspěli.
Xuandong Zhao
Xuandong Zhao18. 6. 2025
🚀 Excited to share our latest work: AgentSynth A powerful and cost-effective pipeline for generating diverse, high-quality, and realistic computer-use tasks Details below 🧵(1/n)
Obrovské poděkování patří spolupracovníkům @Jingxu97, Dylanu Xu a @xuandongzhao. 📷 📷
6,38K