Alibaba ra mắt mô hình AI có thể đọc hiểu hình ảnh và tham gia hội thoại

Alibaba mới công bố một mô hình trí tuệ nhân tạo mới có thể đọc hiểu hình ảnh và thực hiện các cuộc hội thoại phức tạp. Đây là bước cải tiến rõ rệt so với sản phẩm trước đây của Alibaba như Tongyi Qianwen, khi cuộc đua toàn cầu giành vị trí dẫn đầu về công nghệ diễn ra cao trào hơn bao giờ hết.

Gã khổng lồ công nghệ Trung Quốc cho biết hai mô hình AI mới là Qwen-VL và Qwen-VL-Chat sẽ là mã nguồn mở, đồng nghĩa với việc các nhà nghiên cứu, học giả và công ty trên toàn thế giới đều có thể sử dụng chúng để tạo ra một ứng dụng AI của riêng họ mà không cần phải đào tạo hệ thống qua đó, tiết kiệm rất nhiều thời gian và chi phí.

Alibaba còn cho biết tính năng mới của Qwen-VL có thể đọc hiểu và thậm chí trả lời các truy vấn mở liên quan đến nhiều hình ảnh khác nhau và cả bình luận, cũng như tạo chú thích cho các ảnh.

mô hình AI

Trong khi đó, Qwen-VL-Chat, đúng như tên gọi, AI này chuyên phục vụ cho những tương tác phức tạp, chẳng hạn như so sánh, tìm điểm khác biệt với một lúc nhiều hình ảnh hay trả lời một danh sách các câu hỏi. Một số  tính năng mà Alibaba cho biết Qwen-VL-Chat có thể thực hiện bao gồm viết truyện và tạo hình ảnh minh họa dựa trên những hình ảnh mà người dùng nhập vào, cũng như giải các phương trình toán học hiển thị trong đó.

Một ví dụ mà Alibaba đưa ra là nhập một hình ảnh có ký hiệu của một bệnh viện bằng tiếng Trung Quốc, Qwen-VL-Chat có thể trả lời các câu hỏi liên quan tới vị trí và cả những thông tin của chính bệnh viện ấy bằng cách diễn giải hình ảnh của biển báo. Phiên bản mới nhất của ChatGPT, OpenAI cũng có tính năng này.

Nhưng cho đến nay, phần lớn AI đang đơn giản chỉ là nơi công nghệ tạo ra phản hồi dựa trên những câu hỏi của con người dưới dạng văn bản. Do đó việc bổ sung thêm tính năng nhận dạng, đọc hiểu hình ảnh sẽ thực sự là một bước tiến đáng kể trong công cuộc phát triển trí thông minh nhân tạo của con người.

Hai mô hình AI mới nhất của Alibaba được xây dựng dựa trên mô hình ngôn ngữ lớn của công ty có tên Tongyi Qianwen, được phát hành vào đầu năm nay, một mô hình AI được đào tạo dựa trên lượng dữ liệu khổng lồ và cũng là nền tảng cho các ứng dụng chatbot khác.

Alibaba trong tháng này đã mở nguồn cho hai mô hình AI mới trên. Mặc dù không thu được bất kỳ khoản phí cấp phép nào cho Alibaba, nhưng việc phân phối nguồn mở sẽ giúp công ty có được nhiều người dùng hơn cho Qwen-VL và Qwen-VL-Chat - vào thời điểm mà bộ phận đám mây của công ty đang tìm cách kích thích lại sự tăng trưởng khi công ty chuẩn bị ra mắt công chúng.  

Hoàng Nguyên (theo CNBC)