Bán chạy nhất
Bán chạy nhất
Bán chạy nhất
Bán chạy nhất
Bán chạy nhất
Bán chạy nhất
Bán chạy nhất
Ngày 30/6/2026, Anthropic ra mắt Claude Sonnet 5, mô tả đây là bản Sonnet mang tính agentic nhất từ trước đến nay. Trước đó một tháng, Opus 4.8 đã lên kệ với vị trí model mạnh nhất dòng Claude tại thời điểm đó. Điều đáng chú ý là khoảng cách hiệu năng giữa hai model giờ đây thu hẹp còn vài điểm phần trăm trên phần lớn benchmark, trong khi giá của Sonnet 5 thấp hơn Opus 4.8 khoảng 40 đến 60%. Câu hỏi đặt ra không còn là model nào mạnh hơn, mà là khi nào phần chênh lệch hiệu năng còn lại đáng để trả thêm tiền.
Hai model chia sẻ cùng cửa sổ ngữ cảnh 1 triệu token, cùng giới hạn output 128K token mỗi lượt phản hồi, và cùng mốc dữ liệu huấn luyện tháng 1/2026. Điểm khác biệt chính nằm ở hiệu năng đỉnh trên các tác vụ khó và mức giá theo token.

Về nền tảng hạ tầng, cả hai đều chạy trên claude.ai, Claude Code, Messages API, Amazon Bedrock và Google Vertex AI, nên việc chuyển đổi qua lại giữa hai model không đòi hỏi thay đổi hạ tầng.
Trên các tác vụ đòi hỏi độ chính xác cao và suy luận nhiều bước, Opus 4.8 vẫn giữ khoảng cách rõ rệt. Ở SWE-bench Pro, bài test coding trên nhiều file trong repository thực tế, Opus 4.8 đạt 69,2% so với 63,2% của Sonnet 5. Ở USAMO, bài toán olympiad, chênh lệch còn lớn hơn: 96,7% so với 79,5%. Trên OSWorld-Verified, bài test thao tác máy tính qua trình duyệt, Opus 4.8 đạt 83,4% so với 81,2%, mức chênh 2,2 điểm nhưng lại có ý nghĩa với các tác vụ browser agent cần độ tin cậy cao.

Ở chiều ngược lại, Sonnet 5 vượt Opus 4.8 trên Terminal-Bench 2.1 với 80,4% so với 74,6%, cho thấy lợi thế rõ ở các tác vụ thao tác dòng lệnh. Trên GDPval-AA v2, benchmark đo năng lực xử lý công việc tri thức thực tế, hai model gần như hòa nhau, dao động quanh mốc 1.618 so với 1.603 đến 1.615 Elo tùy nguồn công bố. Với Humanity's Last Exam khi có hỗ trợ công cụ, Sonnet 5 đạt 57,4% so với 57,9% của Opus 4.8, mức chênh dưới 1 điểm.

Với một workload agent chạy output nhiều, tốn khoảng 1.000 USD mỗi ngày trên Opus 4.8, con số tương đương trên Sonnet 5 rơi vào khoảng 400 USD mỗi ngày ở mức giá chuẩn, và cũng gần 400 USD trong giai đoạn giá giới thiệu. Với các đội đang chạy hàng trăm agent song song, khoảng cách này quyết định việc mô hình vận hành có khả thi về ngân sách hay không.
Cả hai model đều hỗ trợ prompt caching giúp giảm chi phí đến 90% cho phần nội dung lặp lại, và batch processing giúp giảm thêm 50% cho các tác vụ không yêu cầu phản hồi tức thời. Kết hợp hai cơ chế này, chi phí vận hành thực tế có thể thấp hơn đáng kể so với mức giá niêm yết.
Sonnet 5 phù hợp với các agent chạy khối lượng lớn trong môi trường production, chatbot phục vụ khách hàng, tạo nội dung quy mô lớn, nghiên cứu thời gian thực, và các tác vụ coding nhiều bước thông thường. Đây cũng là lựa chọn hợp lý khi độ trễ và chi phí trên mỗi token là yếu tố ràng buộc chính, vì Sonnet 5 hiện xử lý được nhiều việc ở mức chất lượng mà một tháng trước còn cần đến Opus.
![]()
Với các tác vụ coding phức tạp trên nhiều file, đòi hỏi suy luận dài hơi và độ chính xác gần như tuyệt đối, Opus 4.8 vẫn là lựa chọn an toàn hơn. Tương tự với suy luận toán học sâu, hoặc browser agent thao tác máy tính nơi chênh lệch 83% so với 81% có ý nghĩa thực tế trong việc giảm số lần agent thao tác sai.

Một cách tiếp cận thực tế là định tuyến theo độ khó của tác vụ: các việc thường ngày chạy Sonnet 5 ở effort thấp hoặc trung bình, các việc khó chuyển sang Opus 4.8 ở effort cao, sau đó điều chỉnh tỷ lệ phân bổ dựa trên ngân sách và yêu cầu chất lượng thực tế. Cách làm này giúp tổng chi phí giảm đáng kể mà không phải đánh đổi độ chính xác ở những phần việc quan trọng nhất.
[Products:28248,26162,25930,28571,27730,22690]
Sonnet 5 và Opus 4.8 có cùng context window không?
- Có. Cả hai đều hỗ trợ cửa sổ ngữ cảnh 1 triệu token ở mức giá chuẩn, không tính phụ phí cho ngữ cảnh dài, và cùng giới hạn output 128K token mỗi phản hồi.
Sonnet 5 rẻ hơn Opus 4.8 bao nhiêu phần trăm?
- Ở mức giá chuẩn, Sonnet 5 rẻ hơn khoảng 40%, với giá 3 USD input và 15 USD output mỗi triệu token so với 5 USD và 25 USD của Opus 4.8. Trong giai đoạn giá giới thiệu đến 31/8/2026, mức chênh lệch lên đến khoảng 60%.
Model nào phù hợp làm mặc định trong Claude Code?
- Sonnet 5 phù hợp làm mặc định với phần lớn lập trình viên vì đạt hiệu năng gần Opus 4.8 trên nhiều tác vụ với chi phí thấp hơn đáng kể. Opus 4.8 nên dành riêng cho các tác vụ coding đòi hỏi độ chính xác cao và suy luận phức tạp nhất.
Sonnet 5 có trên gói Free không, Opus 4.8 thì sao?
- Sonnet 5 là model mặc định trên gói Free và Pro của claude.ai. Opus 4.8 chỉ khả dụng từ gói Pro trở lên, không có mặt trên gói Free.
Giá giới thiệu của Sonnet 5 áp dụng đến khi nào?
- Mức giá 2 USD input và 10 USD output mỗi triệu token áp dụng đến hết ngày 31/8/2026, sau đó tăng lên mức chuẩn 3 USD và 15 USD.
Sonnet 5 có phù hợp với các tác vụ đòi hỏi độ an toàn cao không?
- Anthropic ghi nhận Sonnet 5 có tỷ lệ hành vi lệch chuẩn cao hơn so với Opus 4.8, nên với các tác vụ nhạy cảm hoặc đòi hỏi độ tin cậy cao, Opus 4.8 vẫn là lựa chọn thận trọng hơn.
Khoảng cách hiệu năng giữa Sonnet 5 và Opus 4.8 đã thu hẹp đáng kể so với các thế hệ model trước, đặc biệt trên các tác vụ thao tác dòng lệnh và công việc tri thức. Opus 4.8 vẫn giữ lợi thế rõ ràng ở coding phức tạp, toán học và các tác vụ đòi hỏi độ chính xác gần tuyệt đối. Với phần lớn khối lượng công việc còn lại, mức chênh lệch giá từ 40 đến 60% khiến Sonnet 5 trở thành lựa chọn hợp lý hơn về mặt chi phí, trong khi Opus 4.8 phù hợp khi được dành riêng cho những phần việc mà sai số nhỏ cũng gây hậu quả lớn.
Bài viết liên quan
Hôm nay, 10:26 am
Anthropic ra mắt Claude Sonnet 5 với hiệu năng agentic áp sát Opus 4.8 nhưng giá thấp hơn nhiều, trở thành model mặc định cho người dùng Free và Pro trên Claude.ai.
01-07-2026, 9:16 am
OLED vượt trội về độ tương phản và tốc độ phản hồi, phù hợp gaming và giải trí. IPS bền, giá hợp lý, thích hợp làm việc lâu dài. Chọn loại nào tùy nhu cầu sử dụng.
26-06-2026, 1:53 pm
Ryzen 7 5800X3D 10th Anniversary Edition tái xuất với quy trình xếp chồng 3D V-Cache thế hệ mới, giữ nguyên 96MB cache và hiệu năng gaming vượt trội trên nền tảng AM4, giá $349, ra mắt tháng 6/2026.
20-06-2026, 10:25 am
Hướng dẫn chọn PC chơi Minecraft phù hợp, từ vanilla nhẹ nhàng đến shader và RTX Path Tracing nặng đô, chia theo từng mức ngân sách cụ thể.
16-06-2026, 2:17 pm
Tổng hợp bộ PC 32GB RAM phân theo ngân sách từ 12 đến 30 triệu, phù hợp game AAA, đa nhiệm và sáng tạo. Đang có ưu đãi mua PC tặng màn hình.
16-06-2026, 11:43 am
Tổng hợp các bộ PC 16GB RAM phù hợp văn phòng và game eSports, phân theo ngân sách từ 8 đến 18 triệu. Đang có ưu đãi mua PC tặng màn hình.
Khách cá nhân
0828.333.363
Mr Ngọc0989.336.366
Mr Hùng0707.08.6666
Mr Hoàng089.9999.191
Mr Lộc0812.666.665
Mr Tuấn Anh09.8888.2838
Mr. Minh08.66666.166
098.33333.88
Showroom TP. Hồ Chí Minh097.9999.191
Showroom TP. Hà Nội0865.264.818
Showroom TP. Hà Nội0705.666.668
17 Hà Kế Tấn, Phường Phương Liệt, Hà Nội0765.666.668
Số 10 ngõ 93 Trần Thái Tông, Phường Cầu Giấy, Hà Nội079.9999.191
249 Lý Thường Kiệt, phường Phú Thọ, TP. Hồ Chí Minh0332.101.130
0968.929.992
Khách doanh nghiệp
097.9999.191
Mr Lực0828.333.363
Mr Ngọc0707.08.6666
Mr Hoàng