Tôi nghĩ rằng tôi đã quá coi thường LLM lập trình Composer-1 mới của Cursor. Chắc chắn, nó kém hơn hẳn GPT-5 High Effort và GPT-5-Codex, và theo nghĩa đó, khi tôi thiết kế và triển khai các dự án mã quan trọng, tôi thực sự không thấy nó có chỗ đứng trong quy trình làm việc của mình. Mặt khác, nó cực kỳ nhanh (tôi tự hỏi họ đã làm điều này như thế nào; họ có đang sử dụng phần cứng Groq hay Cerebras không? hay là vì mô hình này quá nhỏ và hiệu quả? không chắc lắm), và điều này một mình mở ra rất nhiều quy trình làm việc và kỹ thuật làm việc mới cho khi mã không quá quan trọng, hoặc khi bạn đang bắt đầu một dự án mới và không phải lo lắng về việc làm hỏng mã hiện có. Nó cũng rẻ hơn rất nhiều so với bất kỳ phiên bản nào của GPT-5. Sự kết hợp giữa tốc độ nhanh hơn và giá cả rẻ hơn tạo ra một sự khác biệt chất lượng trong cách bạn có thể sử dụng mô hình mà tôi chưa hoàn toàn đánh giá cao trước đây. Khi chi phí lặp lại thấp như vậy cả về thời gian và tiền bạc, bạn có thể lặp lại nhiều lần hơn. Điều đó làm giảm giá trị của "độ chính xác một lần"; tức là, khả năng của một mô hình như GPT-5 Pro có thể thực hiện đúng một nhiệm vụ lập trình phức tạp ngay lần đầu tiên mà không có lỗi (mặc dù ngay cả mô hình đó cũng thường thất bại trong bài kiểm tra rất nghiêm ngặt này). Nhưng nếu bạn có thể khép lại vòng lặp gỡ lỗi và nhanh chóng đưa các lỗi/cảnh báo trở lại mô hình, và mỗi vòng lặp mất từ 20 giây đến một phút (thay vì ít nhất 5 đến 10 lần lâu hơn khi sử dụng GPT-5 với nỗ lực cao), thì bạn có thể nhanh chóng giải quyết tất cả những sai sót mà nó mắc phải ngay lần đầu tiên (hoặc thậm chí lần thứ hai, thứ ba, hoặc thứ tư) và vẫn hoàn thành với mã hoạt động sớm hơn bạn có thể với GPT-5. Nếu bạn đang phát triển một cái gì đó trong trình duyệt, bạn có thể thực sự khép lại vòng lặp hoàn toàn bằng cách sử dụng Tab Trình duyệt mới của Cursor, đây là cách triển khai tốt nhất mà tôi từng thấy trong bất kỳ công cụ lập trình nào (nó vượt xa việc sử dụng Playwright MCP từ Codex hoặc Claude Code!). Hôm nay tôi đã sử dụng prompt này với hiệu quả lớn: "Sử dụng tab trình duyệt để khám phá hệ thống này một cách có hệ thống và sử dụng giao diện một cách tự nhiên; trong khi điều đó đang diễn ra, hãy theo dõi bất kỳ cảnh báo hoặc lỗi nào trong bảng điều khiển phát triển. Khi bạn thấy một cái, hãy bắt đầu chẩn đoán và sửa lỗi một cách tương tác và lặp đi lặp lại và sau đó làm mới ứng dụng và xác minh rằng lỗi hoặc cảnh báo đã được giải quyết hoàn toàn. Khi sửa chữa, hãy tập trung vào việc xác định nguyên nhân gốc rễ thực sự của lỗi và không áp dụng các sửa chữa "băng dính" giả!" Nơi mà cách tiếp cận này thực sự gặp khó khăn là trong các giai đoạn khái niệm và lập kế hoạch, nơi bạn đang tìm ra những gì để tạo ra và cách tốt nhất để triển khai nó ở mức cao. Ở đó, sự thiếu suy nghĩ sâu sắc và khám phá có thể bắt đầu dẫn bạn vào một con đường xấu mà rất khó để phục hồi. Điều này rõ ràng hơn nhiều khi nhiệm vụ bạn đang làm lệch xa khỏi "manifold dữ liệu" của các nhiệm vụ lập trình thông thường. Nếu bạn đang tạo ra một trang web CRUD đơn giản khác, thì có lẽ bạn sẽ không nhận thấy nhiều. Nếu bạn đang cố gắng khám phá một lĩnh vực mới trong mô phỏng cuộc sống nhân tạo hoặc một cái gì đó kỳ lạ như vậy, bạn sẽ nhận thấy điều đó rất nhiều. Nhưng có một cách tiếp cận lai rất hay hoạt động: kết hợp mô hình thông minh nhất cho việc lập kế hoạch với những mô hình nhanh và rẻ này để tạo ra các lặp lại. Vì vậy, hãy sử dụng GPT-5 Pro trong ứng dụng trình duyệt để đưa ra kế hoạch của bạn và một triển khai ban đầu, sau đó dán nó vào Cursor và bắt đầu lặp lại, sửa chữa và cải thiện. Nó tốt hơn nhiều trong việc sửa đổi một nền tảng mạnh mẽ hiện có hơn là trong việc thiết lập nền tảng đó. Nơi mà tất cả điều này thực sự tỏa sáng là khi bạn đang chơi và khám phá với một cái gì đó thú vị, trong một dự án mới mà không có thời hạn hoặc kỳ vọng. Trong bối cảnh này, tốc độ thực sự là một yếu tố thay đổi cuộc chơi. Nó làm tôi nhớ đến nghiên cứu cũ của IBM vào đầu những năm 80 mà đã xem xét độ trễ với các hệ thống máy tính, phát hiện rằng khi độ trễ giảm xuống dưới một mức kỳ diệu nào đó, như 50ms, bạn sẽ thấy sự thay đổi lớn trong hành vi vì bộ não con người cảm nhận rằng nó đang xử lý một "hệ thống trực tiếp." Và, ngược lại, khi độ trễ vượt quá ngay cả một mức độ khiêm tốn, như 500ms, bạn sẽ nhận được sự tham gia ít hơn nhiều, và nó trở nên căng thẳng và khó chịu về mặt tinh thần. Khi độ trễ tăng lên vài giây hoặc hơn, mọi người có xu hướng không còn chú ý và việc giữ cho họ tham gia trở thành một cuộc chiến. Thấy mô hình lập trình phản hồi trong vòng vài giây và thực hiện một loạt 10 chỉnh sửa trong chưa đầy 15 giây là một trải nghiệm hoàn toàn khác so với việc chờ đợi 5 phút cho GPT-5 nỗ lực cao để từ từ xử lý một cái gì đó. ...