anh ấy lắp ráp 10 RTX 4090, chạy các mô phỏng gập protein, tải các LLM cục bộ để bảo mật, nói về quantization, multi-GPU sharding, RAG, cách mà SLMs bị đánh giá thấp, VÀ nói rằng anh ấy đang tinh chỉnh mô hình của riêng mình. thằng bạn biết về AI hơn hầu hết các influencer AI ở đây.