Trí tuệ nhân tạo (AI) đã trở thành tâm điểm chú ý tại hội nghị dành cho các nhà phát triển thường niên của Alphabet (GOOGL), Google I/O, khi công ty công bố một loạt sáng kiến AI mới. Dưới đây là những điểm chính cần lưu ý.
1. Trợ lý AI do Gemini cung cấp với khả năng thoại và video sắp ra mắt
Google giới thiệu Gemini Live, một trợ lý AI giọng nói, và Project Astra, một nguyên mẫu trợ lý AI có thể phản hồi đầu vào video. Gemini Live, dự kiến ra mắt vào mùa hè, mở rộng khả năng đa phương thức của Gemini để cho phép người dùng “trò chuyện hai chiều chuyên sâu bằng giọng nói”. Google cũng trình chiếu một video trình diễn khả năng của AI Project Astra, trong đó AI có thể xác định các vật thể hiển thị trên camera và hiểu mã hiển thị trên màn hình máy tính, cùng nhiều tác vụ khác. Tin tức từ Google xuất hiện một ngày sau khi OpenAI được Microsoft hậu thuẫn công bố khả năng giọng nói được cải thiện trên ChatGPT nhờ mô hình GPT-4o mới.
2. Hình ảnh, Video và Âm nhạc được tạo ra bởi AI
Google đã công bố các công cụ tạo hình ảnh, video và âm nhạc sử dụng công nghệ AI, lần lượt là Imagen 3, Veo và Music AI Sandbox. Imagen 3 là mô hình tạo văn bản thành hình ảnh, được Google cho là trình tạo hình ảnh tốt nhất hiện tại. Người dùng có thể đăng ký dùng thử Imagen 3 trên Labs.Google. Veo là công cụ tạo video từ văn bản và lời nhắc video, với một số tính năng khả dụng cho một số nhà sáng tạo trên Labs.Google. Music AI Sandbox, được phát triển hợp tác với YouTube, là công cụ tạo nhạc được thiết kế và thử nghiệm với các nghệ sĩ.
3. Tổng quan về AI trong Google Search sắp ra mắt tại Hoa Kỳ
AI Overview do Gemini cung cấp, mang lại khả năng lý luận nhiều bước cho Google Search, sẽ bắt đầu triển khai tại Hoa Kỳ vào thứ Ba. Công cụ này tóm tắt nội dung từ Tìm kiếm ở đầu trang và có thể sử dụng dữ liệu từ các dịch vụ khác của Google như Bản đồ để trả lời các câu hỏi từ người dùng cũng như phản hồi đầu vào video. AI Overview sẽ sớm có mặt ở các quốc gia khác.
4. Tích hợp Google AI vào thiết bị Android
Google thông báo rằng công nghệ AI của hãng sẽ được tích hợp vào các thiết bị Android thông qua Gemini Nano, mẫu Gemini nhỏ nhất, để chạy AI cục bộ. Vào cuối năm nay, điện thoại Pixel sẽ có khả năng AI đa phương thức thông qua Gemini Nano, cho phép thiết bị phản hồi đầu vào văn bản, hình ảnh và âm thanh. Công nghệ AI chạy cục bộ giúp giảm thiểu độ trễ và có thể hoạt động mà không cần kết nối internet.
5. Gemini 1.5, cập nhật Gemma và phần cứng thế hệ tiếp theo
Google công bố những cải tiến cho mô hình AI của mình, Gemini 1.5 Pro, và ra mắt mô hình Gemini 1.5 Flash mới. Những thay đổi trong Gemini 1.5 Pro bao gồm cải tiến về dịch thuật, mã hóa và lý luận. Gemini 1.5 Flash là mẫu nhỏ hơn, tối ưu hóa cho các tác vụ cụ thể. Google cũng ra mắt hai mô hình mới, PaliGemma và Gemma 2, cho gia đình “mô hình mở nhẹ” của mình. Google cũng công bố thế hệ thứ sáu của bộ xử lý tensor (TPU), Trillium, cung cấp hiệu suất tính toán cải thiện 4,7 lần trên mỗi chip so với thế hệ trước.
Những điểm nổi bật trên cho thấy Google đang không ngừng nỗ lực phát triển và ứng dụng AI vào nhiều lĩnh vực, từ trợ lý ảo đến tạo nội dung và tích hợp vào thiết bị di động, mang lại nhiều tiện ích và cải tiến cho người dùng và nhà phát triển.
(Nguồn: Tổng hợp)