RIEM News LogoRIEM News

DeepMind giới thiệu Genie 3, một mô hình thế giới có thể là chìa khóa để đạt được Trí tuệ Nhân tạo Tổng quát (AGI)

DeepMind giới thiệu Genie 3, một mô hình thế giới có thể là chìa khóa để đạt được Trí tuệ Nhân tạo Tổng quát (AGI)
Nguồn: techcrunch
Tác giả: Rebecca Bellan
Ngày đăng: 5/8/2025

Để đọc nội dung đầy đủ, vui lòng truy cập vào bài viết gốc.

Đọc bài viết gốc
Google DeepMind đã giới thiệu Genie 3, một mô hình thế giới nền tảng được thiết kế như một bước tiến quan trọng hướng tới trí tuệ nhân tạo tổng quát (AGI). Khác với các mô hình hẹp trước đây, Genie 3 là một mô hình thế giới đa năng, tương tác theo thời gian thực, có khả năng tạo ra các môi trường 3D đa dạng từ các lệnh văn bản đơn giản. Nó có thể tạo ra các mô phỏng chân thực hoặc tưởng tượng kéo dài vài phút với tốc độ 24 khung hình mỗi giây và độ phân giải 720p, vượt xa giới hạn 10-20 giây của phiên bản trước. Một đổi mới then chốt là khả năng duy trì tính nhất quán vật lý theo thời gian bằng cách ghi nhớ nội dung đã tạo trước đó, cho phép nó mô phỏng các thế giới mạch lạc, hợp lý về mặt vật lý, phản ánh sự hiểu biết trực quan về vật lý mà không cần dựa vào các động cơ vật lý được mã hóa cứng. Kiến trúc của Genie 3 là tự hồi quy, tạo các khung hình theo trình tự trong khi tham chiếu các khung hình trước đó để duy trì sự liên tục và chân thực. Phương pháp dựa trên bộ nhớ này cho phép mô hình mô phỏng các kịch bản động nơi các đối tượng tương tác một cách tự nhiên, làm cho nó trở thành môi trường huấn luyện lý tưởng cho các tác nhân AI có thân thể. Những tác nhân này có thể khám phá, lập kế hoạch và học hỏi thông qua thử nghiệm và...

Thẻ

robotartificial-intelligenceworld-modelsimulationembodied-agentsphysics-simulationDeepMind