Populaire onderwerpen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Introductie van `:exacto`, Precisietool-aanroepend eindpunten
OpenRouter biedt nu een zorgvuldig geselecteerde subset van providers bovenop open source modellen met meetbaar hogere nauwkeurigheid bij het aanroepen van tools, wat zorgt voor betrouwbaarder gebruik van tools.

Lees de volledige details in onze blogpost: of ga verder met het lezen van de thread voor de samenvatting.

Waarom dit belangrijk is:
Zelfs wanneer aanbieders *dezelfde modelgewichten* hosten, kan de kwaliteit van de inferentie in de echte wereld verschillen.
Het uitvoeren van miljarden verzoeken per maand geeft OpenRouter een unieke positie om deze variaties te detecteren en automatisch de meest nauwkeurige aanbieders naar voren te brengen.
Hoe we de kwaliteit van het gebruik van tools meten:
• JSON-validiteit
• Toolnaam en schema komen overeen
• Neiging tot toolgebruik (tendens om tools aan te roepen)
• Voorkeuren voor negeren/blacklist van gebruikers
• Externe benchmarks (τ²-Bench, LiveMCPBench via @GroqInc OpenBench)

Deze gegevens onthullen dat de nauwkeurigheid van het oproepen van tools veel meer varieert tussen aanbieders dan conventionele benchmarks suggereren, zelfs voor hetzelfde open-gewichtmodel.
Dus hebben we eindpunten gebouwd die *alleen* naar de meest betrouwbare leiden.

Lancering modellen omvatten:
`moonshotai/kimi-k2-0905:exacto`
`deepseek/deepseek-v3.1-terminus:exacto`
`z-ai/glm-4.6:exacto`
`openai/gpt-oss-120b:exacto`
`qwen/qwen3-coder:exacto`
Bekijk ze allemaal hier .

Exacto-modellen + provider-combinaties:
Kimi K2: @GroqInc en @Kimi_Moonshot
GLM-4.6: @novita_labs, @DeepInfra, en @Zai_org
gpt-oss-120b: Groq, DeepInfra, Novita
Qwen3 Coder: @basetenco, @cerebras, en @GoogleAI
DeepSeek Terminus: @AtlasCloud_AI, DeepInfra, en Novita
Gebruik ze zoals elk ander model, voeg gewoon `:exacto` toe:
```bash
curl \
-H "Authorization: Bearer $OPENROUTER_API_KEY" \
-d '{"model": "moonshotai/kimi-k2-0905:exacto", "messages":[{"role":"user","content":"Wat is de hoofdstad van Frankrijk?"}]}'
```
Benchmarks en interne evaluaties tonen een aanzienlijke stijging in de succespercentages van tool-aanroepen over alle `:exacto` modellen, minder ongeldige JSON's, minder schema-inconsistenties en hogere betrouwbaarheid in de echte wereld. Shoutout naar @GroqInc's OpenBench voor de evaluatie-harnas en de nieuw toegevoegde LiveMCPBench.

De `:exacto` variant is puur gericht op de precisie van het aanroepen van tools, niet op een algemene ranking van de kwaliteit van de aanbieders.
We zullen deze eindpunten blijven uitbreiden en later dit jaar meer geaggregeerde gegevens delen.
139,22K
Boven
Positie
Favorieten

