Nykyiset AI Agent -arkkitehtuurit (ReAct, Plan-then-Act jne.) tuottavat liikaa virheellisiä vastauksia. Uusi vertailuarvomme vahvistaa tämän ja arvioi 5 suosittua agenttiarkkitehtuuria usean hypyn kysymyksiin vastaamisessa. Lisäsimme sitten jokaiseen reaaliaikaisen luottamuspisteytyksen, mikä vähensi virheellisiä vastauksia kaikissa agenttityypeissä: Actista 56 %, ReActista (nollalaukaus) 56 %, ReActista (muutama laukaus) 16 %, PlanActista 25 % ja PlanReActista 10 %. Jos et siedä tekoälyvirheitä, luottamuspisteytys toimii mille tahansa tekoälyagentille ja on vain pari riviä koodia. Katso koko vertailuarvo täältä:
5,53K