OpenAI vừa công bố mô hình trí tuệ nhân tạo (AI) mới, được quảng bá là có khả năng “tư duy với hình ảnh”, hay nói cách khác có thể hiểu, phân tích những hình vẽ, sơ đồ do người dùng đưa cho, bất kể chất lượng cao hay thấp.

Sam Altman, đồng sáng lập kiêm CEO hiện tại của OpenAI, tham gia Tuần lễ Công nghệ 2024 và phát biểu tại OGR Officine Grandi Riparazioni, Turin, Ý, vào ngày 25/9/2024 - Ảnh: Stefano Guidi / Getty Images
Mô hình lý luận mới của OpenAI - o3 - ra mắt cùng lúc với mô hình tinh gọn hơn - o4-mini. Cả hai đều chào hàng sau mô hình lý luận đầu tiên - o1 - được OpenAI công bố vào tháng 9/2024. Trong khi o1 tập trung giải các bài toán phức tạp và suy xét đáp án qua nhiều bước, mô hình o3 cho phép người dùng tải lên hình vẽ trên bảng trắng, trên giấy, hay bất kỳ hình ảnh nào và nhờ AI phân tích, thảo luận về những gì nó “thấy” được, ngoài ra còn cho phép xoay, phóng to nhỏ, và chỉnh sửa hình ảnh.
Từ khi ra mắt ứng dụng ChatGPT nổi tiếng cuối năm 2022, OpenAI nhanh chóng cải tiến các mô hình của hãng để có thể xử lý, tạo lập hình ảnh, âm thanh, video bên cạnh văn bản đơn thuần. Hiện công ty chuyên AI tạo sinh này phải đối đầu với những đối thủ nặng ký khác như Anthropic, Google, hay xAI của Elon Musk.
OpenAI cho biết: “Đây là lần đầu tiên những mô hình lý luận của chúng tôi có tích hợp tất cả các công cụ ChatGPT - từ trình duyệt web, Python, đến hiểu và tạo lập hình ảnh. Nhờ vậy mà chúng có thể giải các câu hỏi phức tạp, đa tác vụ một cách hiệu quả, hướng tới hoạt động độc lập hoàn toàn.”
Được định giá 300 tỷ USD trong vòng gọi vốn vào tháng 3/2025, OpenAI khẳng định o3 và o4-mini là hai mô hình đầu tiên có thể “tư duy với hình ảnh”, hay: “Chúng không chỉ “thấy” hình ảnh mà còn tích hợp các dữ kiện thị giác vào chuỗi lập luận.”
Cũng theo OpenAI, mô hình o3 chuyên về các câu hỏi toán học, code, khoa học, và hiểu biết hình ảnh, còn o4-mini vận hành tinh gọn với chi phí thấp hơn. Cả hai mô hình chính thức đi vào hoạt động ngày 16/4, dành riêng cho các khách hàng có tài khoản ChatGPT Plus, Pro, và Team. Công ty AI nói rằng hai mô hình đều được “kiểm tra cường độ cao qua các bài test an toàn nghiêm ngặt nhất hiện nay” và được liên kết với “Khung quy chuẩn phòng bị” được cập nhật trước đó vài ngày.
Gần đây, OpenAI hứng chịu nhiều chỉ trích do thay đổi chính sách về quy tắc và biện pháp an toàn. Giữa tháng 4, công ty cho biết sẽ bảo lưu “quyền được thay đổi quy tắc an toàn nếu ‘có bất cứ nhà phát triển AI tiên phong nào công bố một hệ thống rủi ro cao mà không có quy tắc an toàn tương đương với họ’”. Qua thay đổi chính sách về quy tắc an toàn, OpenAI cho biết hãng sẽ không còn tiến hành kiểm tra an toàn với một số mô hình đã tinh chỉnh nữa.
Công ty AI tạo sinh này cũng không muốn tiết lộ “card mô hình” - bản tập hợp các thông tin về những bài test an toàn được thực hiện trước khi mô hình được công bố - của GPT-4.1. Được biết vào tháng 2 năm nay, OpenAI cho ra mắt công cụ Deep Research chỉ vài tuần trước khi công bố card mô hình của nó.
Huỳnh Trọng Nhân
(Lược dịch)