Trí tuệ nhân tạo mới của Meta giúp robot học logic thế giới thực từ video thô

Nguồn: interestingengineering

Tác giả: @IntEngineering

Ngày đăng: 11/6/2025

Để đọc nội dung đầy đủ, vui lòng truy cập vào bài viết gốc.

Meta đã giới thiệu V-JEPA 2, một mô hình AI tiên tiến được đào tạo hoàn toàn trên dữ liệu video thô nhằm giúp robot và các tác nhân AI hiểu và dự đoán tốt hơn các tương tác vật lý trong thế giới thực. Khác với các hệ thống AI truyền thống dựa vào các bộ dữ liệu lớn có nhãn, V-JEPA 2 hoạt động trong không gian tiềm ẩn đơn giản hóa, cho phép mô phỏng thực tế vật lý nhanh hơn và linh hoạt hơn. Mô hình học các mối quan hệ nhân quả như trọng lực, chuyển động và tính bền vững của vật thể thông qua việc phân tích cách con người và vật thể tương tác trong video, giúp nó tổng quát hóa trong nhiều bối cảnh đa dạng mà không cần nhiều chú thích. Meta coi đây là một bước tiến quan trọng hướng tới trí tuệ nhân tạo tổng quát (AGI), với mục tiêu tạo ra các hệ thống AI có khả năng suy nghĩ trước khi hành động. Trong các ứng dụng thực tiễn, Meta đã thử nghiệm V-JEPA 2 trên các robot trong phòng thí nghiệm, và các robot này đã thực hiện thành công các nhiệm vụ như nhặt các vật thể lạ và điều hướng trong môi trường mới, thể hiện khả năng thích ứng cải thiện trong các tình huống thực tế không thể đoán trước. Công ty hình dung nhiều trường hợp sử dụng rộng rãi cho các máy móc tự động—bao gồm robot giao hàng và xe tự lái—những thiết bị đòi hỏi khả năng nhanh chóng nhận diện và hiểu môi trường vật lý xung quanh.

Thẻ

roboticsartificial-intelligencemachine-learningautonomous-robotsvideo-based-learningphysical-world-simulationAI-models