又是王冠:27M小模型超越o3-mini!拒绝马斯克的00后果然不同
清华00后校友王冠团队推出仅2700万参数的推理模型HRM,在极端数独、迷宫及ARC-AGI测试中超越Claude 3.7等大模型。该模型采用仿脑双层循环架构,具备分层推理能力,仅用1000个样本训练,无需思维链即可完成复杂任务,展现出高效能与低内存需求。尽管存在泛化性争议,其创新设计仍被视为对Transformer架构的潜在挑战。来源:https://tech.ifeng.com/c/8lhdScKcs3j
页:
[1]