🚀 Probamos el nuevo gpt-realtime de @openai temprano, nuestras conclusiones iniciales: En general, un gran salto adelante en términos de seguimiento de instrucciones, el mayor punto débil de los modelos en tiempo real de Open AI hasta la fecha. Qué más nos llama la atención: --> Mejor precisión de llamada de funciones --> Comprensión mejorada con detección de señales no verbales --> Cambio de idioma sin interrupciones en medio de la conversación: en mi opinión, la mayor victoria: muchas arquitecturas de voz luchan con esto, la mayor parte de la latencia en el lado TTS, la latencia de extremo a extremo inferior a 500 ms es impresionante aquí. --> Y: ¡Soporte SIP (telefonía)! ¡Y lo hemos agregado a nuestros puntos de referencia! Referencia. coval . IA ¡Pronto habrá instrucciones siguiendo los puntos de referencia! Consejo: Open AI realtime se puede usar para TTS, STT o toma de turnos, y puede emparejarlo con otros modelos. ¡No puedo esperar a ver cómo esto transforma a los agentes de voz en entornos de producción!
14.39K