ChatGPT: Mở rộng khả năng trò chuyện và xử lý hình ảnh

Logo ChatGPT hiển thị trên một mẫu smartphone.
OpenAI vừa cho ra mắt một bản cập nhật quan trọng của ChatGPT, cho phép người dùng tương tác với trí tuệ nhân tạo (AI) thông qua giọng nói và xử lý hình ảnh. ChatGPT có khả năng trò chuyện theo giọng nói và đọc nội dung văn bản, vượt trội hơn so với Google Assistant và Siri. Tính năng xử lý hình ảnh cũng được tích hợp, cho phép người dùng phân tích và xử lý ảnh. Bản cập nhật này dự kiến sẽ được phát hành trong hai tuần tới cho các gói dịch vụ Plus và Enterprise của ChatGPT.

ChatGPT – Cập nhật tính năng trò chuyện và xử lý hình ảnh

OpenAI vừa giới thiệu bản cập nhật mới nhất cho ChatGPT, một trí tuệ nhân tạo (AI) nhằm tương tác tự nhiên với người dùng thông qua giọng nói và xử lý hình ảnh.

Logo ChatGPT hiển thị trên một mẫu smartphone. Logo ChatGPT hiển thị trên một mẫu smartphone.

Tính năng trò chuyện tự nhiên

Theo OpenAI, ChatGPT giờ đây có thể tương tác bằng giọng nói theo phong cách của năm nhân vật mặc định khác nhau. Đồng thời, AI này cũng có khả năng xử lý hình ảnh mà người dùng cung cấp. Tính năng trò chuyện được thêm vào nhằm thu hút sự quan tâm và sử dụng rộng rãi hơn từ phía người dùng.

Peter Deng, Phó Chủ tịch phụ trách Sản phẩm Tiêu dùng của OpenAI, đã nhận định về thách thức lớn trong việc phát triển tính năng này, nói rằng: “Một trong những nhiệm vụ khó khăn nhất là tận dụng công nghệ của chúng tôi để làm cho việc tiếp cận ChatGPT trở nên dễ dàng hơn cho 300-400 triệu người dùng tiếp theo.”

Gợi ý  3 Phương pháp chỉnh sửa ảnh siêu nhanh trên máy tính

Tính năng xử lý hình ảnh

ChatGPT hiện đã tích hợp tính năng xử lý hình ảnh, cho phép người dùng chụp ảnh bất cứ vật thể nào và yêu cầu AI phân tích ảnh để giải quyết các vấn đề. Ví dụ, người dùng có thể yêu cầu ChatGPT kiểm tra lò nướng không hoạt động, kiểm tra thực phẩm trong tủ lạnh và lập kế hoạch ăn uống, hoặc phân tích biểu đồ liên quan đến công việc. Tính năng này tương tự với Google Lens của Alphabet.

Phạm vi áp dụng

Bản cập nhật mới trên ChatGPT dự kiến sẽ được phát hành trong hai tuần tới, tuy nhiên, chỉ dành cho người dùng đăng ký gói Plus và Enterprise.

Trước đây, OpenAI đã ra mắt ChatGPT vào cuối năm ngoái và nhanh chóng thu hút sự chú ý với khả năng trả lời câu hỏi một cách tự nhiên. Bản cập nhật mới này được hy vọng sẽ nâng cao sức mạnh của ChatGPT, biến nó thành một đối thủ đáng gờm cho các trợ lý ảo truyền thống.

Theo Washington Post, việc bổ sung các khả năng thoại và xử lý hình ảnh giúp ChatGPT tiến xa hơn trên con đường trở thành một mô hình đa phương thức thực sự, kết hợp giọng nói, hình ảnh và văn bản trong quá trình tương tác.

Thỏa thuận đầu tư vào công ty khởi nghiệp AI Anthropic

Ngày 25/9, Amazon đã thông báo đầu tư 4 tỷ USD vào công ty khởi nghiệp AI có tên Anthropic. Đây được coi là thỏa thuận đầu tư lớn nhất trong lĩnh vực Trí tuệ Nhân tạo từ khi Microsoft đầu tư hơn 10 tỷ USD vào OpenAI. Cùng với việc mở rộng tính năng trò chuyện của loa thông minh Alexa thông qua chatbot, Amazon đang tăng cường nỗ lực phát triển trí tuệ nhân tạo sáng tạo.

Gợi ý  Digital Wellbeing: Tối ưu hóa và nâng cao hiệu suất lối sống

Các nhà nghiên cứu Trí tuệ Nhân tạo cho rằng mô hình đa phương thức đang trở thành xu hướng cạnh tranh tiếp theo, có thể được áp dụng vào nhiều lĩnh vực như smartphone, TV, xe hơi và loa thông minh.

Với việc OpenAI đẩy mạnh tính năng trò chuyện và xử lý hình ảnh trên ChatGPT và sự đầu tư khổng lồ của Amazon vào Anthropic, trí tuệ nhân tạo đang tiến thêm một bước giới hạn mới trong việc tương tác tự nhiên và ứng dụng đa dạng trong cuộc sống hàng ngày.