Gibt es Empfehlungen für Texte, die einführen, wie Ansätze zur Speicherung in Transformermodellen funktionieren? Es sollte auf einem einführenden Niveau sein, ohne technische Spezifität zu opfern. Lohnt es sich, einen zu schreiben?