Chủ đề thịnh hành
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
xin lỗi, nhưng tôi cứ thấy những bài đăng như thế này nên tôi cần làm rõ. chúng tôi đã biết rằng LMs có thể đảo ngược trong HAI NĂM. tôi đã chỉ ra điều này trong luận án tiến sĩ của mình.
bài báo được trích dẫn thêm một số mở rộng tinh vi, nhưng "Language Model Inversion" (Morris et al., ICLR 2024) đã làm điều đó trước :)


10:59 29 thg 10
Chúa ơi. Tài liệu này thật điên rồ.
Bạn có thể khôi phục văn bản đầu vào từ một LLM thông qua phép đảo ngược. Điều này có ý nghĩa lớn đối với cách chúng ta hiểu những mô hình này, cũng như đối với những vấn đề như quyền riêng tư.
- bạn có thể khôi phục các prompt chỉ từ các output, nếu có đủ thời gian lấy mẫu
- bạn có thể khôi phục chúng nhanh hơn bằng cách tìm kiếm nhị phân API nếu nó cho phép tham số 'logit bias'
- có một tiện ích mở rộng thú vị trong (Finlayson et al., 2024): bạn có thể khôi phục *lớp cuối cùng của chính mô hình*
Mô hình ngôn ngữ đảo ngược

Logits của LLMs được bảo vệ bằng API rò rỉ thông tin sở hữu.

358
Hàng đầu
Thứ hạng
Yêu thích

