Ada rekomendasi tentang teks yang memperkenalkan bagaimana pendekatan memori dalam model transformator? Ini harus tingkat pengantar tanpa mengorbankan kekhususan teknis. Apakah layak menulisnya?