ChatGPT Images 2.0 không chỉ là một cải tiến kỹ thuật mà còn là bước tiến quan trọng trong việc tạo ra hình ảnh hữu ích từ AI (trí tuệ nhân tạo) nhằm cạnh tranh với các đối thủ trên thị trường, đặc biệt là Nano Banana 2 của Gemini.

ChatGPT Images 2.0 cải thiện khả năng tạo ảnh và hiển thị văn bản
ẢNH: OPENAI
ChatGPT Images 2.0 không chỉ đơn thuần tạo ra hình ảnh mà còn tập trung vào khả năng thấu hiểu và suy luận. Thay vì chuyển đổi yêu cầu một cách ngẫu nhiên, mô hình này "suy nghĩ" kỹ lưỡng về những gì người dùng yêu cầu trước khi tạo ra hình ảnh. Điều này giúp nó xử lý các yêu cầu phức tạp tốt hơn, duy trì tính nhất quán trong nhiều đầu ra và đáng tin cậy hơn khi tích hợp văn bản vào hình ảnh - một điểm mà các công cụ AI trước đây thường gặp khó khăn.
ChatGPT Images 2.0 có thể khiến nhiều công cụ AI khác lép vế
Hệ thống mới cũng có khả năng tạo ra nhiều biến thể từ gợi ý duy nhất mà vẫn giữ nguyên ý tưởng cốt lõi, làm cho nó trở thành công cụ hữu ích cho các công việc lặp đi lặp lại. ChatGPT Images 2.0 không chỉ là một trình tạo nghệ thuật AI mà thực sự hiểu những gì người dùng muốn tạo ra, đánh dấu bước chuyển mình quan trọng trong việc tạo hình ảnh hữu ích.
Điều đáng chú ý là OpenAI đang hướng tới việc làm cho việc tạo hình ảnh trở nên thực tiễn hơn thay vì chỉ chạy theo trào lưu nghệ thuật AI. Với khả năng hiển thị văn bản được cải thiện, cấu trúc tốt hơn và đầu ra dễ dự đoán hơn, ChatGPT Images 2.0 có thể hỗ trợ cho các bài thuyết trình, nội dung sáng tạo trên mạng xã hội và các bản phác thảo thiết kế nhanh. Mặc dù chưa thể thay thế hoàn toàn các công cụ chuyên nghiệp, nhưng nó đã tiến gần đến khả năng xử lý một lượng lớn công việc sáng tạo hằng ngày.
Tuy nhiên, ChatGPT Images 2.0 vẫn còn một số điểm không nhất quán, đặc biệt là với các bố cục phức tạp hơn hoặc văn bản không phải tiếng Anh. Dẫu vậy, sản phẩm đã có sự tiến bộ là rất đáng kể so với một năm trước. Nếu xu hướng này tiếp tục, ranh giới giữa hình ảnh "do AI tạo ra" và hình ảnh thực tế sẽ ngày càng mờ nhạt.
Hiện tại, ChatGPT Images 2.0 đã có sẵn cho tất cả người dùng ChatGPT và Codex, với các tính năng đầu ra nâng cao dành cho người dùng Plus, Pro, Business và Enterprise. Mô hình cơ bản, gpt-image-2, cũng đã được tích hợp vào API.

1 hour ago
1







