🚀 Abbiamo testato in anteprima il nuovo gpt-realtime di @openai – ecco le nostre prime impressioni: Nel complesso, un grande passo avanti in termini di seguire le istruzioni - il principale punto dolente dei modelli Open AI in tempo reale fino ad oggi. Cosa altro ci colpisce: --> Maggiore precisione nella chiamata delle funzioni --> Comprensione migliorata con rilevamento di segnali non verbali --> Passaggio fluido tra le lingue durante la conversazione: IMO il più grande successo – molte architetture vocali faticano di più con questo a causa della maggiore latenza sul lato TTS – la latenza end-to-end sotto i 500 ms è impressionante qui. --> E: supporto SIP (telefonia)! E lo abbiamo aggiunto ai nostri benchmark! 𝗯𝗲𝗻𝗰𝗵𝗺𝗮𝗿𝗸𝘀 . 𝗰𝗼𝘃𝗮𝗹 . 𝗮𝗶 Benchmark per il seguire le istruzioni in arrivo! Suggerimento: Open AI realtime può essere utilizzato per TTS, STT o turn taking, e puoi abbinarlo ad altri modelli. Non vedo l'ora di vedere come questo trasformerà gli agenti vocali negli ambienti di produzione!
14,38K