Tin thế giới
Các nhà khoa học phát triển AI mới mô phỏng não người, vượt trội ChatGPT ở khả năng suy luận
Chia sẻ:NTC
Tóm tắt
Các nhà khoa học tại công ty Sapient, Singapore đã phát triển một mô hình AI mới mang tên HRM (Hierarchical Reasoning Model), lấy cảm hứng từ cách não người xử lý thông tin theo nhiều cấp độ và thời gian khác nhau. HRM chỉ sử dụng 27 triệu tham số và 1.000 mẫu huấn luyện, ít hơn rất nhiều so với các mô hình ngôn ngữ lớn (LLM) như ChatGPT vốn có hàng tỷ đến hàng nghìn tỷ tham số. Khi thử nghiệm trên bộ đánh giá ARC-AGI nổi tiếng khó, HRM đạt 40,3% ở ARC-AGI-1 và 5% ở ARC-AGI-2, vượt xa các mô hình hàng đầu hiện nay như o3-mini-high, Claude 3.7 và Deepseek R1.

Khác với phương pháp chain-of-thought (CoT) truyền thống vốn chia nhỏ vấn đề thành nhiều bước trung gian, HRM thực hiện các nhiệm vụ suy luận tuần tự chỉ trong một lần xử lý mà không cần giám sát từng bước trung gian. Mô hình này gồm hai module: một module cấp cao chịu trách nhiệm lên kế hoạch trừu tượng, chậm rãi và một module cấp thấp xử lý các phép tính nhanh, chi tiết. Quá trình suy nghĩ của HRM được lặp lại nhiều lần, mỗi lần đều đánh giá xem có nên tiếp tục hay đưa ra đáp án cuối cùng.

HRM thể hiện khả năng vượt trội khi giải các bài toán khó như Sudoku phức tạp và tìm đường tối ưu trong mê cung, những nhiệm vụ mà các LLM thông thường không thể hoàn thành. Tuy nhiên, khi các nhà tổ chức ARC-AGI thử tái tạo kết quả, họ nhận thấy thành công của HRM chủ yếu đến từ quy trình tinh chỉnh trong huấn luyện chứ không hoàn toàn nhờ kiến trúc phân cấp. Dù vậy, HRM vẫn mở ra hướng phát triển mới cho AI, lấy cảm hứng từ cơ chế hoạt động của não người để nâng cao hiệu quả và khả năng suy luận.
DNnet sử dụng AI để tóm tắt tin tức được thành viên chia sẻ. Nội dung và bản quyền của tin ảnh thuộc về trang tin gốc. Bạn có thể xem cụ thể tại link của trang tin gốc hay trao đổi, phản ảnh tại đây.
Tin thế giới
Xem tiếp
logo
Liên hệ:
Email: dnnet.eu@gmail.com
Kết nối với chúng tôi: