La suposición que todos parecen tener hoy es que en este momento los costos de inferencia están fuertemente subsidiados y en un futuro cercano aumentarán drásticamente. Creo que ese es posiblemente un modelo mental roto al observar negocios subsidiados en el pasado con costos marginales extremadamente altos.
Muchos de estos modelos no están operando con pérdidas en base a la unidad del modelo incluso hoy en día (especialmente si consideras el costo de entrenamiento como CapEx, que argumentablemente lo son). Creo que el resultado probable es que se vuelvan mucho más baratos por token y que el número de tokens consumidos crezca exponencialmente.
23