Home / AI / Anthropic ra mắt Opus 4.5: Đối thủ đáng gờm của GPT-5.1 và Gemini 3, tích hợp Chrome và Excel

Anthropic ra mắt Opus 4.5: Đối thủ đáng gờm của GPT-5.1 và Gemini 3, tích hợp Chrome và Excel

Anthropic, công ty khởi nghiệp AI nổi tiếng, đã chính thức trình làng Opus 4.5, phiên bản mới nhất của mô hình AI tiên tiến Claude. Động thái này diễn ra sau khi tung ra các phiên bản Sonnet 4.5 vào tháng 9 và Haiku 4.5 vào tháng 10, hoàn thiện bộ sản phẩm 4.5 của công ty. Opus 4.5 hứa hẹn mang đến những cải tiến vượt bậc, đặc biệt trong lĩnh vực lập trình và sử dụng công cụ, đồng thời giới thiệu các tích hợp mới mẻ với Chrome và Excel, hứa hẹn thay đổi cách người dùng tương tác với các ứng dụng văn phòng.

Theo thông tin được công bố, Opus 4.5 đã chứng minh được khả năng vượt trội của mình trên nhiều tiêu chí đánh giá khác nhau. Đáng chú ý nhất là điểm số ấn tượng trên các bài kiểm tra về lập trình, bao gồm SWE-Bench và Terminal-bench. Opus 4.5 trở thành mô hình đầu tiên đạt trên 80% trên SWE-Bench verified, một tiêu chuẩn đánh giá uy tín trong giới lập trình. Bên cạnh đó, mô hình này còn thể hiện sự vượt trội trong việc sử dụng các công cụ (tau2-bench và MCP Atlas) và giải quyết các vấn đề chung (ARC-AGI 2, GPQA Diamond). Những kết quả này một lần nữa khẳng định vị thế của Anthropic trong cuộc đua phát triển AI.

Không chỉ tập trung vào hiệu suất kỹ thuật, Anthropic còn đặc biệt nhấn mạnh vào khả năng sử dụng máy tính và làm việc với bảng tính của Opus 4.5. Để minh họa cho những khả năng này, công ty đã cho ra mắt một số sản phẩm song song. Đáng chú ý, Anthropic đã quyết định mở rộng phạm vi sử dụng của các sản phẩm Claude for Chrome và Claude for Excel, vốn trước đây chỉ được thử nghiệm nội bộ. Tiện ích mở rộng Chrome sẽ được cung cấp cho tất cả người dùng Max, trong khi phiên bản dành cho Excel sẽ có sẵn cho người dùng Max, Team và Enterprise. Sự tích hợp sâu rộng này cho thấy tham vọng của Anthropic trong việc đưa AI trở thành một phần không thể thiếu trong quy trình làm việc hàng ngày của người dùng.

Một điểm nhấn khác của Opus 4.5 là những cải tiến về bộ nhớ cho các tác vụ xử lý ngữ cảnh dài. Dianne Na Penn, Giám đốc Quản lý Sản phẩm Nghiên cứu của Anthropic, cho biết những thay đổi này đòi hỏi sự điều chỉnh đáng kể trong cách mô hình quản lý bộ nhớ. “Chúng tôi đã thực hiện những cải tiến về chất lượng ngữ cảnh dài trong quá trình huấn luyện với Opus 4.5, nhưng bản thân các cửa sổ ngữ cảnh sẽ không đủ”, bà Penn nói. “Việc biết những chi tiết quan trọng cần ghi nhớ là rất quan trọng để bổ sung cho việc chỉ có một cửa sổ ngữ cảnh dài hơn.” Những thay đổi này cũng cho phép người dùng Claude trả phí có thể sử dụng tính năng “trò chuyện vô tận”, cho phép các cuộc trò chuyện diễn ra liên tục mà không bị gián đoạn khi mô hình đạt đến giới hạn ngữ cảnh. Thay vào đó, mô hình sẽ nén bộ nhớ ngữ cảnh mà không cảnh báo người dùng. Đây là một cải tiến đáng kể về trải nghiệm người dùng.

Sự ra mắt của Opus 4.5 diễn ra trong bối cảnh thị trường AI đang chứng kiến sự cạnh tranh khốc liệt. Các đối thủ đáng gờm như GPT-5.1 của OpenAI (ra mắt vào ngày 12 tháng 11) và Gemini 3 của Google (ra mắt vào ngày 18 tháng 11) đều đã được tung ra thị trường. Điều này tạo nên một cuộc đua khốc liệt để giành vị trí dẫn đầu trong lĩnh vực trí tuệ nhân tạo. Với những cải tiến vượt trội về hiệu suất và khả năng tích hợp, Opus 4.5 được kỳ vọng sẽ là một đối thủ nặng ký, thu hút sự chú ý của các nhà phát triển và người dùng trên toàn cầu.

Bên cạnh những cải tiến về mặt kỹ thuật, Anthropic cũng đang tập trung vào việc phát triển các ứng dụng agentic, trong đó Opus đóng vai trò là tác nhân chính, chỉ huy một nhóm các tác nhân phụ do Haiku cung cấp. Để quản lý các tác vụ này, một khả năng quản lý bộ nhớ làm việc mạnh mẽ là rất quan trọng, và đây là nơi những cải tiến về bộ nhớ mà Penn mô tả thực sự phát huy tác dụng. “Đây là nơi các yếu tố cơ bản như bộ nhớ trở nên thực sự quan trọng,” Penn nói, “bởi vì Claude cần có khả năng khám phá các cơ sở mã và các tài liệu lớn, đồng thời biết khi nào cần quay lại và kiểm tra lại điều gì đó.”

Với những tính năng ưu việt và khả năng tích hợp linh hoạt, Opus 4.5 được kỳ vọng sẽ là một công cụ hữu ích cho cả nhà phát triển và người dùng cuối. Việc ra mắt các tiện ích mở rộng cho Chrome và Excel cũng cho thấy Anthropic đang nỗ lực để đưa AI trở nên gần gũi và dễ sử dụng hơn trong cuộc sống hàng ngày. Tuy nhiên, để đạt được thành công trên thị trường đầy cạnh tranh, Anthropic sẽ cần phải đối mặt với nhiều thách thức, bao gồm việc cải thiện độ an toàn, bảo mật và khả năng thích ứng với các nhu cầu đa dạng của người dùng.