Cửa hàng DApp | Trung tâm Web3 với các sự kiện và trò chơi

Chủ đề thịnh hành

xin lỗi, nhưng tôi cứ thấy những bài đăng như thế này nên tôi cần làm rõ. chúng tôi đã biết rằng LMs có thể đảo ngược trong HAI NĂM. tôi đã chỉ ra điều này trong luận án tiến sĩ của mình. bài báo được trích dẫn thêm một số mở rộng tinh vi, nhưng "Language Model Inversion" (Morris et al., ICLR 2024) đã làm điều đó trước :)

- bạn có thể khôi phục các prompt chỉ từ các output, nếu có đủ thời gian lấy mẫu - bạn có thể khôi phục chúng nhanh hơn bằng cách tìm kiếm nhị phân API nếu nó cho phép tham số 'logit bias' - có một tiện ích mở rộng thú vị trong (Finlayson et al., 2024): bạn có thể khôi phục *lớp cuối cùng của chính mô hình*

Mô hình ngôn ngữ đảo ngược

Logits của LLMs được bảo vệ bằng API rò rỉ thông tin sở hữu.

358

Hàng đầu

Thứ hạng

Yêu thích