ChatGPT hiện có thể nói, nghe và xem hình ảnh
OpenAI hợp tác với các diễn viên lồng tiếng chuyên nghiệp để đào tạo người mẫu nói.
Không gian trí tuệ nhân tạo (AI) tổng quát tiếp tục nóng lên khi OpenAI công bố GPT-4V, một mô hình có khả năng nhìn và các chế độ đàm thoại đa phương thức cho hệ thống ChatGPT của mình.
Với các bản nâng cấp mới được công bố vào ngày 25 tháng 9, người dùng ChatGPT sẽ có thể tương tác với chatbot trong các cuộc trò chuyện. Các mô hình hỗ trợ ChatGPT, GPT-3.5 và GPT-4 giờ đây có thể hiểu các truy vấn bằng giọng nói bằng ngôn ngữ đơn giản và trả lời bằng một trong năm giọng nói khác nhau.
ChatGPT can now see, hear, and speak. Rolling out over next two weeks, Plus users will be able to have voice conversations with ChatGPT (iOS & Android) and to include images in conversations (all platforms). https://t.co/uNZjgbR5Bm pic.twitter.com/paG0hMshXb
— OpenAI (@OpenAI) September 25, 2023
Theo một bài đăng trên blog từ OpenAI, giao diện đa phương thức mới này sẽ cho phép người dùng tương tác với ChatGPT theo những cách mới:
“Chụp ảnh một địa danh khi đi du lịch và trò chuyện trực tiếp về những điều thú vị về địa danh đó. Khi bạn ở nhà, hãy chụp ảnh tủ lạnh và tủ đựng thức ăn của bạn để tìm xem bữa tối sẽ có món gì (và đặt các câu hỏi tiếp theo để biết công thức từng bước). Sau bữa tối, hãy giúp con bạn giải một bài toán bằng cách chụp ảnh, khoanh tròn bộ bài tập và để bộ bài đó chia sẻ gợi ý với cả hai bạn.”
Phiên bản nâng cấp của ChatGPT sẽ được tung ra cho người dùng Plus và Enterprise trên nền tảng di động trong hai tuần tới, với quyền truy cập tiếp theo dành cho nhà phát triển và những người dùng khác “ngay sau đó”.
Bản nâng cấp đa phương thức của ChatGPT trở nên mới mẻ sau khi ra mắt DALL-E 3, hệ thống tạo hình ảnh tiên tiến nhất của OpenAI.
Theo OpenAI, DALL-E 3 còn tích hợp xử lý ngôn ngữ tự nhiên. Điều này cho phép người dùng nói chuyện với mô hình để tinh chỉnh kết quả và tích hợp ChatGPT để được trợ giúp trong việc tạo lời nhắc bằng hình ảnh.
Trong một tin tức AI khác, đối thủ cạnh tranh của OpenAI là Anthropic đã công bố hợp tác với Amazon vào ngày 25 tháng 9. Như đã đưa tin, Amazon sẽ đầu tư tới 4 tỷ USD để bao gồm các dịch vụ đám mây và quyền truy cập phần cứng. Đổi lại, Anthropic cho biết họ sẽ cung cấp hỗ trợ nâng cao cho mô hình AI nền tảng Bedrock của Amazon cùng với “tùy chỉnh và tinh chỉnh mô hình an toàn cho doanh nghiệp”.