Beklager, men jeg ser stadig innlegg av denne typen, så jeg må avklare. vi har visst at LM-er er inverterbare i TO ÅR. Jeg viste dette under doktorgraden min. sitert artikkel legger til noen sofistikerte utvidelser, men «Language Model Inversion» (Morris et al., ICLR 2024) gjorde det først :)
Alex Imas
Alex Imas29. okt., 10:59
Hellig s*&t. Denne artikkelen er sinnssyk. Du kan gjenopprette inndatatekst fra en LLM gjennom inversjon. Store implikasjoner for hvordan vi forstår disse modellene, så vel som for ting som personvern.
- Du kan gjenopprette ledetekster fra utganger alene, gitt nok samplingstid - du kan gjenopprette dem raskere ved å søke binært i API-en hvis den tillater 'logit bias'-parameteren - det er en kul utvidelse i (Finlayson et al., 2024): du kan gjenopprette det *siste laget av selve modellen*
Inversjon av språkmodell
Logger av API-beskyttede LLM-er lekker proprietær informasjon
364