分享好友 资讯首页 频道列表

三星AI研究院发布开源TRM模型:小参数大作为,结构化推理领域挑战顶尖大模型

2025-10-11 01:1324770

三星高级人工智能研究院近日公布了一项突破性成果——一款名为微型递归模型(TRM)的开源AI系统,其参数规模仅700万,却在特定结构化推理任务中展现出与谷歌Gemini 2.5 Pro等万倍参数量级模型相抗衡的实力。这一发现为AI领域“小而精”模型的发展提供了全新思路。

该模型由研究院资深研究员Alexia Jolicoeur-Martineau团队开发,其核心设计理念颠覆了传统AI架构。不同于依赖多层网络协作的分层推理模型(HRM),TRM采用仅含两层的极简结构,通过“递归推理”机制实现性能突破。模型会反复检验自身输出的预测结果,在每轮迭代中修正前序错误,直至获得稳定解。

这种设计使TRM在保持低计算资源消耗的同时,通过深度迭代模拟了大型模型的复杂推理过程。研究团队形象地将其策略概括为“以递归替代规模”,即通过算法优化而非参数堆砌实现性能提升。

在实测环节,TRM在多个结构化任务基准测试中表现亮眼:极限数独测试准确率达87.4%,困难迷宫任务准确率85%,抽象推理能力测试ARC-AGI中取得45%准确率,ARC-AGI-2测试准确率则为8%。这些数据表明,其性能已接近或超越DeepSeek R1、o3-mini等知名大模型,尽管参数规模不足后者的0.01%。

但研究团队明确指出,TRM的卓越表现具有特定适用范围。该模型专为数独、迷宫等规则明确的网格类问题优化,在需要开放式语言生成的场景中并不适用。其优势在于封闭环境下的精确逻辑推理,而非通用语言处理能力。

深入分析显示,TRM的成功源于对“极简主义”的极致追求。实验表明,增加模型层数或参数规模反而会导致小数据集上的过拟合现象,降低实际性能。双层结构与递归机制的组合,恰好实现了复杂度与效率的最优平衡。

目前,TRM的全部代码、训练脚本及测试数据集已通过MIT许可证在GitHub平台开源。全球开发者可自由获取、修改并用于商业项目,这一举措预计将推动结构化推理AI在工业、教育等领域的快速应用。

反对 0
举报 0
收藏 0
打赏 0
评论 0
RGB-Mini LED显示器与智能投影领衔,海信&Vidda六大3C潮品重磅发布
RGB-Mini LED显示器与智能投影领衔,海信&Vidda六大3C潮品重磅发布

0评论2026-05-09603

首批ChatGPT原住民毕业:18岁少年借AI叩开天文学新大门,青年力量崛起
首批ChatGPT原住民毕业:18岁少年借AI叩开天文学新大门,青年力量崛起

0评论2026-05-092335

中国移动发布“九天全栈协同创新行动” 携手伙伴构建智能服务新生态
中国移动发布“九天全栈协同创新行动” 携手伙伴构建智能服务新生态

0评论2026-05-091260

超越梯度下降:OpenAI翁家翌提出Heuristic Learning开启AI训练新范式
超越梯度下降:OpenAI翁家翌提出Heuristic Learning开启AI训练新范式

0评论2026-05-091756

安卓版ChatGPT迎升级:远程接管Codex,开发者开发灵活性与便捷性双提升
安卓版ChatGPT迎升级:远程接管Codex,开发者开发灵活性与便捷性双提升

0评论2026-05-092196

Arm首款自研AGI CPU受热捧,未来数年需求超20亿美元前景可期
Arm首款自研AGI CPU受热捧,未来数年需求超20亿美元前景可期

0评论2026-05-09890

郑州升达经贸管理学院校长张欣率队赴郑大创新中心 共探校企协同育人新路径
郑州升达经贸管理学院校长张欣率队赴郑大创新中心 共探校企协同育人新路径

0评论2026-05-011678

科技助力春耕:黑龙江育秧大棚里智能机器人“上岗”护苗
科技助力春耕:黑龙江育秧大棚里智能机器人“上岗”护苗

0评论2026-05-012157

维信诺发布自研OLED垂域大模型“维擎” 构建三级AI架构赋能全产业链
维信诺发布自研OLED垂域大模型“维擎” 构建三级AI架构赋能全产业链

0评论2026-05-012062

宇树科技再推新作:双臂人形机器人亮相,低至2.69万元开启智能操作新体验
宇树科技再推新作:双臂人形机器人亮相,低至2.69万元开启智能操作新体验

0评论2026-05-011168