Вибачте, але я постійно бачу дописи такого характеру, тому мені потрібно уточнити. ми знаємо, що LM є інвертованими протягом ДВОХ РОКІВ. Я показав це під час захисту кандидатської дисертації. цитована стаття додає деякі складні розширення, але «Інверсія мовної моделі» (Morris et al., ICLR 2024) зробила це першим :)
Alex Imas
Alex Imas29 жовт., 10:59
Святий с*&т. Цей папір божевільний. Ви можете відновити введений текст з LLM за допомогою інверсії. Це має величезні наслідки для того, як ми розуміємо ці моделі, а також для таких речей, як конфіденційність.
- Ви можете відновити запити лише з виходів, маючи достатній час для дискретизації - ви можете відновити їх швидше, виконавши бінарний пошук в API, якщо він дозволяє параметр 'logit bias' - є круте розширення (Finlayson et al., 2024): ви можете відновити *останній шар самої моделі*
Інверсія мовної моделі
Логіти API-захищених LLM призводять до витоку конфіденційної інформації
364