OpenAI giới thiệu mô hình GPT-4o mới: chatbot AI toàn năng xử lý được cả giọng nói và hình ảnh, người dùng miễn phí cũng được sử dụng

Theo OpenAI, mô hình AI mới có thể xử lý xuyên suốt cả giọng nói, hình ảnh và văn bản theo thời gian thực.

Dù GPT-4 đang là mô hình AI vận hành cho ChatGPT Plus – phiên bản trả phí cao cấp hơn của ChatGPT – nhưng chính Sam Altman, CEO OpenAI vẫn thường cho biết mình "xấu hổ" về trình độ của mô hình này và gọi đây là "mô hình ngốc nghếch nhất … mà mọi người vẫn đang phải sử dụng rất nhiều."

Và trong sự kiện giới thiệu sản phẩm của mình tối qua, OpenAI đã cho thấy quyết tâm sửa chữa lại điều này khi ra mắt một mô hình AI tạo sinh cao cấp mới có tên GPT-4o, với "o" viết tắt cho "omni" (toàn năng) cho thấy các khả năng xử lý mới của mô hình này bao gồm cả văn bản, hội thoại và video.

GPT-4o sẽ được triển khai dần dần trên các sản phẩm dành cho nhà phát triển và người dùng của công ty trong vài tuần tới. Trong khi đó, người dùng ChatGPT Plus sẽ được tiếp cận với mô hình mới này ngay hôm nay.

OpenAI giới thiệu mô hình GPT-4o mới: chatbot AI toàn năng xử lý được cả giọng nói và hình ảnh, người dùng miễn phí cũng được sử dụng- Ảnh 1.

Kỹ sư trưởng Mira Murati của OpenAI cho biết GPT-4o cung cấp trí thông minh "tương đương GPT-4" nhưng nâng cao khả năng của GPT-4 trên nhiều phương thức và phương tiện truyền thông.

"GPT-4o suy luận xuyên suốt giọng nói, văn bản và hình ảnh," CTO Murati cho biết trong một buổi trình chiếu trực tuyến tại văn phòng OpenAI ở San Francisco. "Và điều này vô cùng quan trọng, bởi vì chúng ta đang nhìn về tương lai của sự tương tác giữa chúng ta và máy móc."

Trong khi GPT-4 Turbo, mô hình "tiên tiến nhất" trước đây của OpenAI, được đào tạo để có thể phân tích hình ảnh, văn bản để hoàn thành các nhiệm vụ như trích xuất văn bản từ hình ảnh hoặc thậm chí mô tả nội dung của những hình ảnh đó, GPT-4o còn có thể thêm cả giọng nói.

Điều này cho phép ChatGPT làm gì?

GPT-4o nâng cao đáng kể trải nghiệm trên trợ lý trò chuyện ChatGPT của OpenAI. Nền tảng này đã lâu nay có chế độ giọng nói chuyển văn bản thành giọng nói, nhưng GPT-4o tăng cường khả năng này, cho phép người dùng tương tác với ChatGPT giống như với một trợ lý thực sự.

Ví dụ, người dùng có thể hỏi ChatGPT được tăng cường bởi GPT-4o một câu hỏi và gián đoạn ChatGPT trong khi nó đang trả lời. OpenAI cho biết, GPT-4o cung cấp khả năng phản hồi "thời gian thực", và thậm chí có thể nhận ra những khác biệt nhỏ trong giọng nói của người dùng, để tạo ra các giọng nói khác nhau với "nhiều phong cách biểu cảm khác nhau" (bao gồm cả hát).

OpenAI giới thiệu mô hình GPT-4o mới: chatbot AI toàn năng xử lý được cả giọng nói và hình ảnh, người dùng miễn phí cũng được sử dụng- Ảnh 2.

GPT-4o cũng nâng cấp khả năng xử lý hình ảnh của ChatGPT. Với một bức ảnh - hoặc màn hình máy tính - ChatGPT hiện có thể nhanh chóng trả lời các câu hỏi liên quan, từ các chủ đề như "Có gì đang diễn ra trong đoạn mã này?" đến "Nhãn hiệu áo sơ mi này là gì?".

Các tính năng này sẽ tiếp tục phát triển trong tương lai, Murati nói. Trong khi hiện tại GPT-4o có thể nhìn vào một bức ảnh menu bằng một ngôn ngữ khác và dịch nó, trong tương lai, mô hình có thể cho phép ChatGPT "xem" một trận đấu thể thao trực tiếp và giải thích luật chơi cho bạn.

OpenAI cũng khẳng định, GPT-4o sẽ hỗ trợ đa ngôn ngữ với hiệu suất nâng cao cho khoảng 50 ngôn ngữ. Và trên API của OpenAI và Azure OpenAI Service của Microsoft, GPT-4o nhanh gấp đôi, giá rẻ hơn một nửa và có giới hạn tỷ lệ cao hơn so với GPT-4 Turbo, công ty cho biết.

Hiện tại, giọng nói chưa phải là một phần của GPT-4o API cho tất cả khách hàng. OpenAI, với lý do rủi ro lạm dụng, cho biết họ dự định sẽ ra mắt hỗ trợ cho khả năng xử lý âm thanh mới của GPT-4o cho "một nhóm đối tác đáng tin cậy nhỏ" trong vài tuần tới. Nhưng nếu khả năng giao tiếp đa phương tiện mới thực sự hiệu quả như tuyên bố của OpenAI, có lẽ đã đến lúc người dùng không cần đến bàn phím để giao tiếp với máy móc nữa.

Xuất hiện trên cả phiên bản miễn phí

GPT-4o có sẵn trên gói miễn phí của ChatGPT từ hôm nay và cho người đăng ký gói ChatGPT Plus và Đội ngũ trả phí của OpenAI với giới hạn tin nhắn "cao gấp 5 lần". (OpenAI lưu ý rằng ChatGPT sẽ tự động chuyển sang GPT-3.5, một mô hình cũ hơn và kém năng lực hơn, khi người dùng chạm đến giới hạn tỷ lệ.) Trải nghiệm ChatGPT giọng nói được nâng cấp nhờ GPT-4o sẽ ra mắt phiên bản alpha cho người dùng Plus trong tháng tới, cùng với các tùy chọn dành cho doanh nghiệp.

OpenAI giới thiệu mô hình GPT-4o mới: chatbot AI toàn năng xử lý được cả giọng nói và hình ảnh, người dùng miễn phí cũng được sử dụng- Ảnh 3.

Ngoài ra người dùng ChatGPT phiên bản miễn phí cũng được tiếp cận cửa hàng GPT Store, cửa hàng các công cụ và chatbot bên thứ ba được xây dựng trên mô hình AI của OpenAI – một tính năng trước đây chỉ dành cho người dùng trả phí.

OpenAI giới thiệu mô hình GPT-4o mới: chatbot AI toàn năng xử lý được cả giọng nói và hình ảnh, người dùng miễn phí cũng được sử dụng- Ảnh 4.

Trong một tin liên quan, OpenAI thông báo rằng họ đang làm mới giao diện web của ChatGPT với màn hình chính "hơi hướng đối thoại" và bố cục tin nhắn mới, cùng với phiên bản desktop của ChatGPT cho MacOS giúp người dùng đặt câu hỏi qua phím tắt hoặc chụp và thảo luận về ảnh chụp màn hình. Phiên bản cho Windows sẽ ra mắt trong năm nay.

Trước khi ra mắt GPT-4o ngày hôm nay, nhiều báo cáo dự đoán rằng OpenAI sẽ công bố một công cụ tìm kiếm AI để cạnh tranh với Google và Perplexity, nhưng rõ ràng OpenAI còn đang làm được nhiều hơn thế. Điều thú vị hơn nữa là việc OpenAI ra mắt mô hình mới được diễn ra ngay trước sự kiện nhà phát triển của Google I/O một ngày, nơi nhiều khả năng Google sẽ công bố các sản phẩm AI mới của mình.

Bình luận

Mới cập nhật

MetaHub tăng cường sức mạnh AI với ông Val Bercovici nhậm chức cố vấn công nghệ

MetaHub, một trong những dự án Blockchain hàng đầu tại Việt Nam, vừa công bố bổ nhiệm ông Val Bercovici vào vị trí Cố vấn Công nghệ. Việc gia nhập của ông Val không chỉ củng cố chiến lược AI mà MetaHub đang theo đuổi, mà còn giúp tăng cường khả năng phát triển các ứng dụng Blockchain, đặc biệt trong lĩnh vực tài chính phi tập trung (DeFi) và Web3.

2 ngày trước Công nghệ số

Ca sĩ Mai Nguyễn Anh lọt vào vòng Chung kết Giọng hát hay Hà Nội 2024

Ngày 23/11/2024, theo kết quả công bố của của BTC Giọng hát hay Hà Nội 2024, thí sinh Mai Nguyễn Anh đến từ Đoàn Văn công Quân khu 2 đã xuất sắc vượt qua hàng trăm thí sinh để góp mặt trong TOP 12 Vòng Chung kết Giọng hát hay Hà Nội 2024.

10:29 24/11/2024 Theo dòng sự kiện

Cần Tăng Thuế Thuốc Lá Để Giảm Người Hút Thuốc

Thuốc lá đang gây ra nhiều hệ lụy về sức khỏe, kinh tế cho người dân và đất nước. TS. Nguyễn Anh Dương – Viện Nghiên cứu Quản lý Kinh tế Trung ương cho rằng cần thiết tăng thuế với mặt hàng này.

10:15 22/11/2024 Thị trường

Sự Thật Về Loại Tôm Hùm 39.000 Đồng/Con Bán Tràn Ngập Chợ

Trên chợ online có hàng trăm nghìn thành viên tham gia mua bán, một số đầu mối đang rao tôm hùm với giá chỉ 39.000 đồng/con khiến nhiều người giật mình vì quá rẻ.

09:33 21/11/2024 Thị trường

Thu giữ số lượng lớn sản phẩm của công ty Tiến Hạnh bị làm giả ở Tây Ninh

Mới đây, Đội Quản lý thị trường số 4 thuộc Cục Quản lý thị trường tỉnh Tây Ninh cùng với Phòng Cảnh sát điều tra tội phạm về tham nhũng, kinh tế, buôn lậu, môi trường (Công an tỉnh Tây Ninh) đã tiến hành kiểm tra đột xuất nơi cất giấu tang vật, phương tiện vi phạm hành chính tại điểm tập kết hàng hóa ở huyện Tân Châu phát hiện số lượng lớn hàng hóa bị làm giả.

14:42 20/11/2024 Thị trường

Dự Báo Giá Xăng Ngày Mai Về Dưới 20.000 Đồng/lít?

Giá xăng trong nước ngày mai (21/11) được dự báo giảm lần thứ hai liên tiếp, với mức giảm từ 200-250 đồng/lít; giá dầu diesel có thể giảm nhiều hơn nếu không tác động đến Quỹ bình ổn giá xăng dầu.

11:21 20/11/2024 Thị trường

Nhà Đầu Tư Muốn Môi Trường Kinh Doanh Minh Bạch, Chính Sách Ổn Định

Cải thiện môi trường kinh doanh cần nhiều yếu tố. Trong đó, cải cách thủ tục hành chính chỉ là một phần, mà quan trọng hơn là nhà đầu tư cần chính sách ổn định, tổng thể và thống nhất…

09:46 19/11/2024 Thị trường

Giá Vàng Hôm Nay 18/11 Nhẫn Trơn Và Miếng SJC Tăng “Bốc Đầu” Cả Triệu Đồng

Giá vàng hôm nay 18/11/2024 trên thị trường thế giới tăng bốc đầu trở lại, sát ngưỡng 2.600 USD/ounce, kéo giá vàng trong nước bùng nổ. Vàng miếng SJC tăng 1 triệu đồng (mua vào) còn nhẫn trơn tăng 700.000 đồng cả hai chiều.

10:12 18/11/2024 Thị trường

Xuất Khẩu Cần Bắt Kịp Xu Hướng Chính Sách Thương Mại Của EU

Nông sản, thực phẩm Việt Nam phải không ngừng đổi mới sản xuất, đảm bảo tiêu chí về môi trường và xã hội, xây dựng chuỗi cung ứng bền vững và tăng cường khả năng truy xuất nguồn gốc…

11:18 16/11/2024 Thị trường

CEO Lê Hồng Ân - Nhà Lãnh Đạo Tầm Cỡ Trong Lĩnh Vực Marketing Và Chuyển Đổi Số

Lê Hồng Ân là một trong những CEO nổi bật trong ngành tiếp thị kỹ thuật số và chuyển đổi số, với hơn 15 năm kinh nghiệm quốc tế. Anh là một trong những nhà lãnh đạo trẻ có tầm nhìn chiến lược, đã và đang tạo ra ảnh hưởng lớn trong nhiều lĩnh vực, từ bất động sản đến truyền thông và đào tạo.

17:38 14/11/2024 Thương hiệu

OpenAI giới thiệu mô hình GPT-4o mới: chatbot AI toàn năng xử lý được cả giọng nói và hình ảnh, người dùng miễn phí cũng được sử dụng

Theo OpenAI, mô hình AI mới có thể xử lý xuyên suốt cả giọng nói, hình ảnh và văn bản theo thời gian thực.

Cùng chủ đề

Mới cập nhật