Một thay đổi nhỏ trên Claude vừa khiến Google và OpenAI phải đau đầu

2 hours ago 1

Quảng Cáo
0943778078

Anthropic chính thức đưa cửa sổ ngữ cảnh (context window) 1 triệu token ra phiên bản chính thức trên cả Opus 4.6 và Sonnet 4.6, đồng thời xóa hoàn toàn khoản phụ phí mà lập trình viên từng phải trả khi xử lý các prompt dài.

Ngày 13/3, Anthropic công bố cửa sổ ngữ cảnh (context window) 1 triệu token trên Claude Opus 4.6 và Claude Sonnet 4.6 đã chuyển từ giai đoạn beta sang phiên bản chính thức (GA - Generally Available). Thay đổi lớn nhất nằm ở chính sách giá: toàn bộ phụ phí cho ngữ cảnh dài bị loại bỏ hoàn toàn.

Trước đó, trong giai đoạn beta, bất kỳ request nào vượt quá 200.000 token đầu vào đều bị tính giá cao hơn đáng kể - cụ thể là gấp đôi cho token đầu vào và gấp 1,5 lần cho token đầu ra. Điều này đồng nghĩa với việc một request 500.000 token trên Opus 4.6 từng tốn gấp đôi chi phí so với mức chuẩn. Giờ đây, mức giá hoàn toàn đồng nhất bất kể độ dài: Opus 4.6 giữ nguyên 5 USD/25 USD mỗi triệu token (khoảng 130.000 đồng/650.000 đồng) cho input/output, trong khi Sonnet 4.6 ở mức 3 USD/15 USD mỗi triệu token (khoảng 78.000 đồng/390.000 đồng). Một request 900.000 token được tính giá mỗi token y hệt như request 9.000 token.

Ngoài việc bỏ phụ phí, Anthropic còn nâng giới hạn media lên gấp 6 lần. Mỗi request giờ có thể chứa tới 600 ảnh hoặc trang PDF, tăng từ con số 100 trước đó. Đây là thay đổi có ý nghĩa thực tế lớn với các đội ngũ pháp lý cần xử lý hàng trăm trang hợp đồng, hoặc nhà nghiên cứu muốn phân tích cả tập tài liệu trong một lần gọi API duy nhất.

Về mặt kỹ thuật, lập trình viên không cần thay đổi bất kỳ dòng code nào. Trước đây, muốn sử dụng ngữ cảnh trên 200.000 token, developer phải gửi kèm một beta header trong API call. Giờ đây, request vượt 200.000 token sẽ tự động hoạt động mà không cần header đặc biệt. Nếu code hiện tại vẫn gửi kèm header cũ, hệ thống sẽ đơn giản bỏ qua mà không gây lỗi. Giới hạn throughput cũng được áp dụng đầy đủ ở mọi độ dài ngữ cảnh, thay vì bị giới hạn riêng cho request dài như trước.

Với Claude Code - công cụ lập trình dòng lệnh của Anthropic - ngữ cảnh 1 triệu token giờ được tích hợp mặc định cho người dùng gói Max, Team và Enterprise khi sử dụng Opus 4.6. Trước đây, các phiên làm việc dài trên Claude Code thường phải "compaction" - tức nén và tóm tắt phần hội thoại cũ để nhường chỗ, dẫn đến mất thông tin quan trọng. Với 1 triệu token, toàn bộ cuộc hội thoại được giữ nguyên, giúp giảm thiểu tình trạng AI "quên" ngữ cảnh giữa chừng.

Về hiệu năng, Anthropic dẫn kết quả benchmark để chứng minh rằng context dài không đồng nghĩa với suy giảm chất lượng. Opus 4.6 đạt 78,3% trên MRCR v2 - bài đo khả năng tìm lại thông tin ẩn trong lượng văn bản khổng lồ - cao nhất trong số các mô hình tiên tiến hiện nay ở cùng độ dài ngữ cảnh. Sonnet 4.6 cũng duy trì độ chính xác ổn định xuyên suốt cửa sổ 1 triệu token.

Đặt trong bối cảnh cạnh tranh, động thái này giúp Claude trở thành dòng mô hình duy nhất mà cả hai phiên bản mạnh nhất (Opus và Sonnet) đều hỗ trợ 1 triệu token ở mức giá không phụ phí. Gemini 2.5 Pro của Google cũng có cửa sổ 1 triệu token nhưng vẫn tính thêm phí khi vượt 200.000 token. GPT-5.4 của OpenAI - mô hình mạnh nhất của họ - chỉ hỗ trợ tối đa 256.000 token. GPT-4.1 tuy có 1 triệu token ở giá cố định, nhưng không phải mô hình flagship.

Tính năng này khả dụng ngay trên Claude Platform, Microsoft Azure Foundry và Google Cloud Vertex AI.

Read Entire Article