Den som spikrer sanntidsstemme vil vinne grensesnittlaget til AI. Ikke skjermer. Ikke chattebobler. En av startupene som gjør et godt arbeid på dette området er @Cartesia (avsløring: Jeg er en indie-investor i selskapet). Deres Sonic-3-modeller med lav latens ler allerede, uttrykker følelser og bytter språk live.
Jeg mente @cartesia_ai. Beklager det. #idea: X/twitter burde være smart nok til å advare meg "Jeg tror du kan ha ment X (ikke Y)."
34,25K