Google và những kỳ vọng mới trong cuộc đua AI

Tin tức tổng hợp
Topviet
December 27, 2023

Đầu tháng 12, Google đã thông báo mô hình AI Gemini dự kiến sẽ được tích hợp cho một loạt sản phẩm của doanh nghiệp, từ chatbot Bard tới các mẫu điện thoại Pixel. Theo Google, Gemini là mô hình có khả năng tổng quát xuất sắc nhất mà họ từng phát triển. Thậm chí, Google còn tuyên bố rằng Gemini sẽ giúp AI “hữu ích hơn cho mọi người dùng”.

Theo Google, Gemini sẽ với ba phiên bản: Ultra, Pro và Nano – mỗi loại được thiết kế cho những mục đích sử dụng khác nhau. Song chúng đều sẽ là các mô hình đa phương thức, nghĩa là tất cả các phiên bản Gemini sau này đều với thể xử lý nhiều loại dữ liệu đầu vào như văn bản, mã, âm thanh, hình ảnh… Hiện chỉ có bản Ultra có những khả năng này.

Trong lúc Gemini Ultra được thiết kế cho những nhu cầu hiệu suất xử lý rất cao như trong các trung tâm dữ liệu, Gemini Nano lại được điều chỉnh nhỏ gọn, phù hợp với các sản phẩm điện thoại thông minh (smartphone).

Còn phiên bản Gemini Pro sẽ được tích hợp vào Bard. Đây dự kiến là phiên bản “vừa đủ” nhất của Gemini: xử lý thông tin nhanh, hiệu quả trong lúc đảm bảo thực hiện các tác vụ phức tạp tốt nhất với thể.

Việc nâng cấp sẽ được triển khai theo hai giai đoạn. Trong giai đoạn lần đầu, Google sẽ tích hợp phiên bản Gemini Pro vào Bard để tăng kỹ năng đàm thoại của chatbot này. Điều này sẽ cải thiện khả năng hiểu câu hỏi của Bard, giúp nó đưa ra những câu trả lời phù hợp và với chiều sâu nhất định. Sang giai đoạn hai diễn ra vào đầu năm tới, Bard sẽ được tiếp cận Gemini Ultra – phiên bản mạnh mẽ và với khả năng xử lý dữ liệu tốt nhất. Thay vì chỉ phản hồi người dùng thông qua văn bản như các phiên bản thấp hơn, Gemini Ultra với thể đưa ra các câu trả lời bằng hình ảnh, âm thanh và video.

Google đang nỗ lực đẩy mạnh phát triển các công nghệ AI lúc vị thế thống trị của ChatGPT trên thị trường AI tạo sinh là ko thể bàn cãi. Hồi đầu năm, Google ra mắt Bard khá đình đám như lời đáp trả đối với ChatGPT của OpenAI. Tuy nhiên, người tiêu tiêu dùng nhanh chóng nhận thấy phản hồi của Bard còn hạn chế, ko chính xác và dễ mắc lỗi. Điều này đã dẫn đến nhiều lời chỉ trích trên mạng xã hội về khả năng kém hơn của Bard so với những đối thủ.

Với Gemini, Google đặt nhiều trông mong có thể giải quyết những thiếu sót này của Bard, đồng thời chấm dứt sự thống trị thị trường của ChatGPT. doanh nghiệp đã đưa ra những tuyên bố khá táo bạo về khả năng của Gemini. Thậm chí, Google cho rằng Gemini sẽ làm lu mờ GPT-4 – mô hình ngôn ngữ lớn của ChatGPT về mọi mặt.

Dù vậy, giới quan sát vẫn đặt câu hỏi liệu Gemini với đủ khả năng để vượt qua ChatGPT hay ko.

Ban đầu lúc mới đề cập tới Gemini hồi tháng Năm, Google sử dụng khả năng tạo hình ảnh để phân biệt mô hình này với ChatGPT. Nhưng vào ngày 25/9, OpenAI đã thông báo rằng người tiêu tiêu dùng sẽ với thể nhập những truy vấn bằng giọng nói và hình ảnh vào ChatGPT. Nói cách khác, OpenAI cũng đang thử nghiệm cách tiếp cận mô hình đa phương thức như Gemini.

Tuy nhiên, điểm khác biệt rất đáng chú ý giữa hai mô hình này là kho dữ liệu đào tạo độc quyền to lớn của Google. Gemini với thể xử lý dữ liệu được lấy trên một loạt những dịch vụ, bao gồm công cụ tìm kiếm Google Search, nền tảng chia sẻ video YouTube, ứng dụng đọc sách Google Books cùng ứng dụng tra cứu tài liệu nghiên cứu Google Scholar.

Việc sử dụng những dữ liệu độc quyền này để đào tạo những mô hình Gemini với thể mang lại lợi thế ko giống nhau về độ tinh vi của câu trả lời và suy luận mà mô hình có thể đưa ra cho người dùng. Điều này đặc thù đáng chú ý nếu những thông tin ban đầu rằng số lượng dữ liệu dùng để đào tạo Gemini nhiều gấp đôi GPT-4 là chính xác.

Rõ ràng, Google đang chịu áp lực phải nhanh chóng cải tiến Bard sau lúc phiên bản ban đầu của họ tỏ ra kém cỏi so với những chatbot như ChatGPT. Những mô tả ban đầu cho rằng Bard với nhiều trục trặc và hạn chế đã làm tổn hại tới danh tiếng của Google trong lĩnh vực AI. Bằng cách nâng cấp với Gemini, Google đặt mục tiêu xây dựng lại hình ảnh của Bard và chứng minh rằng họ với thể khó khăn trong lĩnh vực AI tạo sinh.

Tuy nhiên, rủi ro vẫn còn. tương đương tất cả những mô hình tiếng nói lớn khác, Gemini với khả năng truyền bá thông tin sai lệch và nội dung độc hại. Google khẳng định rằng họ đã tiến hành thử nghiệm nghiêm ngặt để xác định và ngăn chặn những kết quả với hại phát sinh từ việc mọi người sử dụng Gemini. Song chính doanh nghiệp cũng thừa nhận đây là một thách thức lớn. Vì bản chất đa phương thức của Gemini với nghĩa là hai dữ liệu đầu vào dường như vô hại – chẳng hạn như văn bản và hình ảnh – với thể được kết hợp để tạo ra kết quả gây nguy hại đối với người dùng.

Nếu Gemini thực sự nâng tầm Bard như hứa hẹn của Google, “ông lớn” này vẫn với thể lấy lại vị thế đã mất trước những đối thủ AI. Với những tiến bộ nhanh chóng hiện thời trong lĩnh vực AI tạo sinh, cuộc đua giành vị thế thống trị vẫn còn rộng mở và kéo dài.