Quien logre clavar la voz en tiempo real tiene la oportunidad de ganar la capa de interfaz para la IA. No pantallas. No burbujas de chat. Una de las startups que está haciendo un gran trabajo en esta área es @Cartesia (divulgación: soy un inversor independiente en la empresa). Sus modelos Sonic-3 de baja latencia ya están riendo, expresando emociones y cambiando de idioma en vivo.
Me refería a @cartesia_ai. Lo siento por eso. #idea: X/twitter debería ser lo suficientemente inteligente como para advertirme "Creo que podrías haber querido X (no Y)."
48,5K