Vượt trội khoản coding so với o1, o3 mini-high, DeepSeek R1, và không thèm so với Gemini 2.0 của Google, Claude 3.7 Sonnet đang “tạm” vươn mình trở thành con hàng “Coder Agent” hot nhất ngành bấy giờ.
Có rất nhiều điểm mới mẻ và dưới đây là tất tần tật những gì bạn cần biết về mô hình AI “mạnh mẽ nhất” mà Anthropic vừa công bố.
Các “siêu năng lực” được Anthropic quản bá:
Bảng 1: Anthropic gọi Claude 3.7 Sonnet là “mô hình thông minh nhất cho đến nay” và là mô hình lai (hybrid reasoning) đầu tiên trên thị trường
Hiện Claude 3.7 Sonnet đã có trên tất cả gói Claude—Free, Pro, Team, Enterprise—và trên Anthropic API, Amazon Bedrock, cũng như Google Cloud’s Vertex AI. Tuy nhiên, chế độ extended thinking không hỗ trợ cho gói Free. Giá vẫn giữ nguyên: 3 USD/triệu token đầu vào và 15 USD/triệu token đầu ra (đã gồm thinking tokens). Nói chung là ĐẮT!
Trên các bài thử nghiệm ban đầu, Claude 3.7 Sonnet đã chứng tỏ vị thế dẫn đầu trong khả năng hỗ trợ lập trình, đặc biệt là:
Biểu đồ 1: điểm benchmark SWE thật sự khủng, và vượt xa ngưỡng 50% (hên xui)
Biểu đồ 2: điểm benchmark TAU “như người”, đã vượt xa một số trình độ lập trình viên junior
Ngoài các benchmark truyền thống, Anthropic còn thử nghiệm Claude 3.7 Sonnet trên “Pokémon gameplay tests” và ghi nhận kết quả vượt xa những phiên bản trước.
Claude Code: Trợ lý coding “agentic” ngay trên terminal
Bên cạnh sự ra mắt của Claude 3.7 Sonnet, Anthropic giới thiệu Claude Code—công cụ dòng lệnh (CLI) giúp:
Mục tiêu của Claude Code là giúp lập trình viên “giao phó” phần lớn nhiệm vụ lặp đi lặp lại, từ việc kiểm tra code, gỡ lỗi, đến refactoring quy mô lớn, chỉ trong một lần chạy của AI. Theo Anthropic, Claude Code đã tiết kiệm 45+ phút công sức manual trong nội bộ team khi triển khai những tác vụ phức tạp, trở thành trợ lý “không thể thiếu” ở giai đoạn research preview.
Không chỉ dừng ở mức “gợi ý” như một số công cụ AI coding khác, Claude Code hoạt động “agentic” – tự động hóa quy trình, ghi lại tiến trình và giữ người dùng trong vòng phản hồi. Nhiều người hài hước gọi đây là “Cursor killer”, thể hiện tiềm năng soán ngôi các đối thủ AI-code trước đó.
Nếu muốn trải nghiệm sớm, bạn có thể đăng ký bản preview, đóng góp ý kiến để Anthropic tiếp tục cải tiến Claude Code trong những bản cập nhật sắp tới. Họ dự định nâng cao tính ổn định của việc gọi tool, hỗ trợ lệnh dài hơn, cải thiện giao diện đầu ra, và cho Claude hiểu sâu hơn về năng lực của chính nó. Liệu ae có nghĩ đây là Cursor "Killer"
Ngoài Claude Code, Anthropic còn cải thiện khả năng coding ngay trên Claude.ai. Mọi gói dịch vụ đều cho phép kết nối repository GitHub trực tiếp, giúp Claude:
Tận dụng sức mạnh của Claude 3.7 Sonnet làm nền tảng, giờ đây việc hợp tác với AI cho dự án phần mềm trở nên mượt mà và hiệu quả hơn nhiều.
Anthropic cho biết họ đã kiểm tra rất kỹ các khía cạnh bảo mật, an toàn và độ tin cậy của Claude 3.7 Sonnet, phối hợp cùng chuyên gia bên ngoài. So với phiên bản trước, Claude 3.7 Sonnet:
Việc hiển thị quá trình suy luận (extended thinking) cũng là một phương thức giúp người dùng theo dõi, kiểm chứng mô hình, gia tăng độ tin cậy. Anthropic tin rằng, về lâu dài, mô hình reasoning “trong suốt” (transparent reasoning) sẽ giúp AI an toàn và dễ kiểm soát hơn.
Anthropic đã khéo léo “giấu” một biểu đồ rất thú vị ở phần cuối, minh họa hành trình phát triển của Claude từ năm 2024 đến 2027. Theo đó:
Những mốc thời gian này cho thấy tầm nhìn dài hạn của Anthropic về AI agent. Không chỉ dừng lại ở việc hỗ trợ từng tác vụ nhỏ, Claude đang được hướng tới khả năng tự vận hành, đóng vai trò như một nhà nghiên cứu độc lập, thậm chí đưa ra giải pháp cho các vấn đề mà nếu làm thủ công, một đội ngũ nhà khoa học sẽ phải tốn hàng năm trời. Đây chính là viễn cảnh “nâng tầm năng lực con người” mà Anthropic khao khát thực hiện.
Claude 3.7 Sonnet và Claude Code mở ra một chương mới trong việc ứng dụng AI vào lập trình, giải quyết tác vụ doanh nghiệp lẫn nghiên cứu học thuật. Với các tính năng như extended thinking, tuỳ biến “thinking tokens”, tích hợp GitHub, cùng bộ công cụ agentic coding đa năng:
So với các mô hình AI đầu ngành, Claude 3.7 Sonnet cho thấy sự vượt trội trên nhiều chỉ số, đặc biệt ở SWE-bench Verified, TAU-bench, cũng như các bài test coding thực tế từ Cursor, Cognition, Vercel, Replit,... Và nếu bạn đang tìm một trợ lý “có thể làm thay bạn” phần lớn quy trình dev, hãy thử Claude Code – biết đâu sẽ “diệt” luôn công cụ coding mà bạn vẫn dùng bấy lâu nay.
Cảm ơn bạn đã tin tưởng và lựa chọn chúng tôi. Đội ngũ của chúng tôi sẽ sớm liên hệ lại để hỗ trợ bạn nhanh chóng nhất