desculpe, mas continuo a ver publicações desta natureza, por isso preciso de esclarecer. sabemos que os LMs são invertíveis há DOIS ANOS. eu mostrei isso durante o meu doutoramento. o artigo citado adiciona algumas extensões sofisticadas, mas "Inversão de Modelos de Linguagem" (Morris et al., ICLR 2024) foi o primeiro a fazê-lo :)
Alex Imas
Alex Imas29/10/2025
Santo s*&t. Este artigo é insano. Você pode recuperar o texto de entrada de um LLM através da inversão. Implicações enormes para como entendemos esses modelos, assim como para coisas como privacidade.
- você pode recuperar prompts apenas a partir das saídas, dado tempo de amostragem suficiente - você pode recuperá-los mais rapidamente fazendo uma busca binária na API se ela permitir o parâmetro 'logit bias' - há uma extensão interessante em (Finlayson et al., 2024): você pode recuperar a *última camada do próprio modelo*
Inversão do Modelo de Linguagem
Os Logits de LLMs Protegidos por API Vazam Informações Proprietárias
375