¿Alguna recomendación sobre textos que introduzcan cómo los enfoques de la memoria en los modelos de transformadores? Debe ser de nivel introductorio sin sacrificar la especificidad técnica. ¿Vale la pena escribir uno?