DApp Store | Sede de Web3 para eventos y juegos

Tendencias del momento

lo siento, pero sigo viendo publicaciones de esta naturaleza, así que necesito aclarar. Sabemos que los LMs son invertibles desde HACE DOS AÑOS. Lo demostré durante mi doctorado. el artículo citado añade algunas extensiones sofisticadas, pero "Inversión de Modelos de Lenguaje" (Morris et al., ICLR 2024) lo hizo primero :)

- puedes recuperar los prompts solo a partir de las salidas, dado el tiempo de muestreo suficiente - puedes recuperarlos más rápido buscando de manera binaria en la API si permite el parámetro 'logit bias' - hay una extensión interesante en (Finlayson et al., 2024): puedes recuperar la *última capa del modelo en sí*

Inversión del Modelo de Lenguaje

Los logits de los LLMs protegidos por API filtran información propietaria

374

Parte superior

Clasificación

Favoritos