Desculpe, mas continuo vendo postagens dessa natureza, então preciso esclarecer. sabemos que os LMs são invertíveis por DOIS ANOS. Eu mostrei isso durante meu doutorado. o artigo citado adiciona algumas extensões sofisticadas, mas "Language Model Inversion" (Morris et al., ICLR 2024) fez isso primeiro :)
Alex Imas
Alex Imas29 de out. de 2025
. Este artigo é insano. Você pode recuperar o texto de entrada de um LLM por meio da inversão. Enormes implicações para a forma como entendemos esses modelos, bem como para coisas como privacidade.
- você pode recuperar prompts apenas das saídas, com tempo de amostragem suficiente - você pode recuperá-los mais rapidamente pesquisando binariamente a API se ela permitir o parâmetro 'logit bias' - há uma extensão legal em (Finlayson et al., 2024): você pode recuperar a *última camada do próprio modelo*
Inversão do modelo de linguagem
Logits de LLMs protegidos por API vazam informações proprietárias
377