分享好友 资讯首页 频道列表

百年前AI竟能写代码修bug?智能本质或迎来新思考

2026-05-09 13:0329980

一个仅掌握1930年前知识的AI模型,竟在编程领域展现出惊人潜力。这个被称为"talkie-1930-13b"的特殊模型,其训练数据严格限定在1931年1月1日之前,对电视机、互联网等现代概念一无所知。然而经过微调后,这个"数字老古董"成功解决了xarray库的补丁问题,引发科技界对智能本质的新思考。

该模型由AI研究员尼克·莱文、多伦多大学副教授戴维·杜文纳德以及GPT系列创始人亚历克·拉德福德共同开发。其核心设计理念极具突破性:通过完全排除现代信息,构建一个知识边界凝固在1930年底的特殊系统。研究团队意外发现,这个与现代技术隔绝的模型,经过250个样本的微调训练后,竟能完成真实的软件工程任务。

在解决xarray库补丁问题的过程中,模型展现出令人惊叹的推理能力。尽管过程耗时49轮交互,期间多次出现错误尝试,但模型始终保持持续改进。第12轮尝试应用补丁失败后,它通过不断调整策略,最终在第44轮成功完成任务。这种试错-修正的循环模式,与现代AI模型的推理过程高度相似。

基准测试数据进一步印证了这一发现的突破性。当训练规模扩展至10亿token时,模型在SWE-bench-Verified验证集上达到4.5%的pass@1准确率。这个数字虽低于当前顶尖模型,但相较于其在Humaneval基准上4%的pass@100表现,已显示出显著进步。更值得关注的是,使用互联网数据训练的对照模型talkie-web,在相同测试中仅取得5.5%的成绩,优势幅度远低于预期。

研究团队在GitHub开源了完整项目,包含模型训练代码和交互日志。从公开的demo记录可见,模型在修复过程中展现出完整的逻辑链条:从理解问题描述,到设计解决方案,再到验证修正错误,每个环节都留下清晰的思考痕迹。这种结构化的问题解决能力,与其知识储备的年代形成鲜明反差。

该成果引发关于智能本质的激烈讨论。传统观点认为,AI需要海量现代数据才能发展出实用能力,但这项研究显示,具备基础语言理解能力的模型,通过针对性训练即可掌握专业领域技能。有学者指出,这或许意味着智能发展的关键不在于数据规模,而在于模型能否建立有效的推理框架。

目前研究团队正呼吁更多开发者参与项目复现,特别关注不同训练规模下的性能变化曲线。他们认为,比较1930知识模型与现代互联网模型在持续训练中的表现差异,可能为理解智能涌现机制提供全新视角。该项目代码已完整开源,供全球研究者验证和扩展。

反对 0
举报 0
收藏 0
打赏 0
评论 0
保时捷纯电动Cayenne登场:以电动之躯续写“性能”传奇新篇
保时捷纯电动Cayenne登场:以电动之躯续写“性能”传奇新篇

0评论2026-05-012190

RIVIAN两项自动驾驶安全专利:为特殊乘员安全保驾护航
RIVIAN两项自动驾驶安全专利:为特殊乘员安全保驾护航

0评论2026-05-012305

OWC推出Express 4M2 Ultra:雷电5认证四盘位M.2硬盘盒,性能散热双提升
OWC推出Express 4M2 Ultra:雷电5认证四盘位M.2硬盘盒,性能散热双提升

0评论2026-04-231824

晶晨半导体再冲港股:芯片出货破10亿颗,技术领跑但经营风险并存
晶晨半导体再冲港股:芯片出货破10亿颗,技术领跑但经营风险并存

0评论2026-04-231719

蔚来ES9旗舰SUV发布:搭载中国首个量产交付线控转向 租电42万元起
蔚来ES9旗舰SUV发布:搭载中国首个量产交付线控转向 租电42万元起

0评论2026-04-131713

深大谢和平团队攻克海水制氢难题 构建全链条体系助力“海洋绿氢”腾飞
深大谢和平团队攻克海水制氢难题 构建全链条体系助力“海洋绿氢”腾飞

0评论2026-04-13673