Ai2 cho biết mô hình MolmoAct 7B mới đưa AI vào thế giới vật lý - The Robot Report

Nguồn: roboticsbusinessreview
Tác giả: @therobotreport
Ngày đăng: 13/8/2025
Để đọc nội dung đầy đủ, vui lòng truy cập vào bài viết gốc.
Đọc bài viết gốcViện Allen về Trí tuệ Nhân tạo (Ai2) đã giới thiệu MolmoAct 7B, một mô hình AI thể hiện nhằm đưa trí tuệ nhân tạo tiên tiến vào thế giới vật lý bằng cách giúp robot nhận thức và tương tác với môi trường xung quanh một cách thông minh hơn. Khác với các mô hình truyền thống chuyển đổi trực tiếp các chỉ dẫn ngôn ngữ thành các chuyển động, MolmoAct xử lý các đầu vào hình ảnh 2D để tạo ra các kế hoạch không gian 3D, cho phép robot hiểu các mối quan hệ không gian và lên kế hoạch hành động phù hợp. Mô hình này nhấn mạnh tính minh bạch, an toàn và khả năng thích ứng, cung cấp lập luận hình ảnh từng bước giúp người dùng giám sát và điều chỉnh hành vi của robot theo thời gian thực. Ai2 mô tả MolmoAct như một “mô hình lập luận hành động” (ARM) có khả năng giải thích các lệnh ngôn ngữ tự nhiên cấp cao và phân tách chúng thành một chuỗi các quyết định dựa trên không gian, cho phép thực hiện các nhiệm vụ phức tạp như phân loại vật thể dưới dạng các nhiệm vụ phụ có cấu trúc.
MolmoAct 7B được đào tạo trên một bộ dữ liệu mở gồm khoảng 12.000 tập phim robot được ghi lại trong các môi trường gia đình thực tế, như nhà bếp và phòng ngủ, thể hiện đa dạng các nhiệm vụ.
Thẻ
robotembodied-AIMolmoAct-7Bspatial-reasoningaction-reasoning-modelAI-roboticsvisual-waypoint-planning