RIEM News LogoRIEM News

Trí tuệ nhân tạo mới của Google DeepMind cho phép robot học hỏi bằng cách tự nói chuyện với chính mình

Trí tuệ nhân tạo mới của Google DeepMind cho phép robot học hỏi bằng cách tự nói chuyện với chính mình
Nguồn: interestingengineering
Tác giả: @IntEngineering
Ngày đăng: 4/7/2025

Để đọc nội dung đầy đủ, vui lòng truy cập vào bài viết gốc.

Đọc bài viết gốc
Google DeepMind đang phát triển một hệ thống AI sáng tạo giúp robot có "giọng nói nội tâm" hoặc lời tự thuật bên trong, cho phép chúng mô tả các quan sát hình ảnh bằng ngôn ngữ tự nhiên khi thực hiện nhiệm vụ. Phương pháp này, được trình bày chi tiết trong một hồ sơ bằng sáng chế gần đây, cho phép robot liên kết những gì chúng nhìn thấy với các hành động tương ứng, tạo điều kiện cho việc học "zero-shot" — nơi robot có thể hiểu và tương tác với các vật thể chưa từng gặp mà không cần đào tạo trước. Phương pháp này không chỉ cải thiện hiệu quả học tập nhiệm vụ mà còn giảm yêu cầu về bộ nhớ và tính toán, nâng cao khả năng thích ứng của robot trong môi trường động. Dựa trên khái niệm này, DeepMind đã giới thiệu Gemini Robotics On-Device, một mô hình thị giác-ngôn ngữ nhỏ gọn được thiết kế để chạy hoàn toàn trên robot mà không cần kết nối đám mây. Mô hình trên thiết bị này hỗ trợ hiệu suất nhanh chóng, đáng tin cậy trong các bối cảnh nhạy cảm về độ trễ hoặc hoạt động ngoại tuyến, chẳng hạn như chăm sóc sức khỏe, đồng thời duy trì tính riêng tư. Mặc dù kích thước nhỏ hơn, Gemini Robotics On-Device có thể thực hiện các nhiệm vụ phức tạp như gấp quần áo hoặc mở khóa túi với độ trễ thấp và có thể thích nghi với các nhiệm vụ mới chỉ với vài lần trình diễn tối thiểu. Mặc dù không có các tính năng an toàn ngữ nghĩa tích hợp như...

Thẻ

roboticsartificial-intelligencemachine-learningzero-shot-learningDeepMindautonomous-robotson-device-AI