Rubriques tendance
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
désolé, mais je continue à voir des publications de ce type, donc je dois clarifier. Nous savons que les LMs sont inversibles depuis DEUX ANS. Je l'ai montré pendant mon doctorat.
L'article cité ajoute quelques extensions sophistiquées, mais "Language Model Inversion" (Morris et al., ICLR 2024) l'a fait en premier :)


29 oct., 10:59
Putain de merde. Ce document est fou.
Vous pouvez récupérer le texte d'entrée d'un LLM par inversion. D'énormes implications pour notre compréhension de ces modèles, ainsi que pour des choses comme la vie privée.
- vous pouvez récupérer des invites à partir des sorties seules, donné suffisamment de temps d'échantillonnage
- vous pouvez les récupérer plus rapidement en effectuant une recherche binaire dans l'API si elle permet le paramètre 'logit bias'
- il y a une super extension dans (Finlayson et al., 2024) : vous pouvez récupérer la *dernière couche du modèle lui-même*
Inversion du modèle linguistique

Les logits des LLM protégés par API divulguent des informations propriétaires

368
Meilleurs
Classement
Favoris

