分享好友 资讯首页 频道列表

AI新星郑耀威:北航博士引领LLaMA-Factory登顶全球热门项目榜

2025-07-03 23:2328260

在北航的校园里,有一位年轻学子以其卓越的学术成就和开源项目的巨大影响力,成为了人工智能领域的璀璨新星,他就是计算机学院2022级博士研究生郑耀威。

自高中时期被谷歌AlphaGo击败人类世界冠军的新闻所吸引,郑耀威便立志投身于人工智能领域。考入北航后,他迅速展现出了对知识的渴望和科研的热情。大一期间,他利用课余时间自学了Python、概率论、机器学习、深度学习等多门专业课程,累计课时超过800小时,为日后的科研之路打下了坚实的基础。

大二时,郑耀威主动加入张日崇教授的科研团队,开始了自己的科研创新之旅。他坚持每天进步一点点,从跑实验、读代码做起,逐渐深入到科研的核心领域。在本科二年级的暑假,他选择留校科研,每天沉浸在实验室的讨论、建模与调试中,这段经历让他收获颇丰。

“博观而约取,厚积而薄发”是郑耀威的人生信条。他心无旁骛地钻研科研问题,与导师和高年级同学频繁碰撞思想,不断激发灵感与创新思维。凭借在低资源场景机器学习技术领域的深入研究,他以第一作者身份在ACL、CVPR、AAAI、WWW等国际顶级会议上发表了多篇高水平学术论文,其中学生一作的论文就有6篇,谷歌学术引用量超过600次,第一作者论文引用量更是超过500次。

除了学术研究,郑耀威还积极参与各类课外科技竞赛。他提出的“基于语法图上随机游走的多方面情感分类”算法,荣获北航冯如杯科技竞赛一等奖。在全国数字健康创新应用大赛中,他开发的自动检查心脑血管疾病算法脱颖而出,荣获算法模型一等奖。他还获得了全国大学生冰壶人工智能挑战赛总冠军、蓝桥杯信息技术大赛全国一等奖等众多奖项,展现了北航学子的卓越风采。

然而,郑耀威的成就远不止于此。他敏锐地察觉到大模型微调和推理资源消耗巨大的问题,阻碍了AI的落地应用。为此,他将研究重心放在了大模型微调框架上,成功实现了大语言模型的量化和低秩分解技术,大幅降低了模型的显存消耗和训练成本。依托这一技术,他构建了大模型高效微调框架LLaMA-Factory,并开源至GitHub平台。

LLaMA-Factory项目一经提出就受到了广泛关注,社区开发者的需求纷至沓来。郑耀威不断学习各类型号硬件平台文档,实现了硬件感知的自动优化方案,使LLaMA-Factory在英伟达芯片和国产芯片上均能无痛运行。这一贡献赢得了华为昇腾芯片部门官方的高度认可,他也因此荣获华为昇腾生态开源卓越贡献奖。

在郑耀威的不懈努力下,LLaMA-Factory项目逐渐赢得了社区开发者的广泛赞誉与热烈欢迎。项目累计获得超过40000星标,成为了国内最热门的大语言模型微调框架,并登顶Github热门项目榜单全球第一。他还多次受邀参加行业峰会、开发者大会,与全球各地的LLaMA-Factory用户面对面交流,共同探讨技术难题。

郑耀威积极将学术成果与社会应用紧密结合。他介绍了LLaMA-Factory在山西文旅AI导游场景中的实际应用,还与业界大咖共话DeepSeek带来的AI应用加速创新。他的开源精神和技术实力得到了业界的广泛认可。

对于自己的成长过程,郑耀威尤为感谢身边老师的支持。他回忆起在项目受挫时,导师张日崇教授花一整天陪他一起分析代码、逐句讨论论文的经历,至今仍铭记在心。他也希望更多同学能够走进创新,用好大模型,通过参与开源社区的形式接触前沿技术,与学者碰撞观点。

反对 0
举报 0
收藏 0
打赏 0
评论 0
极智嘉携手华通丰田,AI+机器人赋能汽车零部件仓储高效数智化转型
极智嘉携手华通丰田,AI+机器人赋能汽车零部件仓储高效数智化转型

0评论2026-05-092871

黄仁勋谈AI革命:中美竞赛高风险,工程师责任与机遇并存
黄仁勋谈AI革命:中美竞赛高风险,工程师责任与机遇并存

0评论2026-05-092826

DeepSeek发布多模态大模型技术报告,创新框架突破空间参照瓶颈
DeepSeek发布多模态大模型技术报告,创新框架突破空间参照瓶颈

0评论2026-05-01795

中国AI大模型周调用量骤降:价格、模式与市场变化下的新挑战
中国AI大模型周调用量骤降:价格、模式与市场变化下的新挑战

0评论2026-05-012894

农业AI大模型:赋能种子繁育与品种筛选,开启种业智能新时代
农业AI大模型:赋能种子繁育与品种筛选,开启种业智能新时代

0评论2026-05-01725

贵州借“东数西算”优势 具身智能产业联盟与中试基地共促产业升级
贵州借“东数西算”优势 具身智能产业联盟与中试基地共促产业升级

0评论2026-05-012318

乐道L80:智能电动车“死亡谷”中,能否成为破局“关键牌”?
乐道L80:智能电动车“死亡谷”中,能否成为破局“关键牌”?

0评论2026-05-012382

OpenAI意外“剧透”:GPT-5.5等未发布AI模型现身Codex CLI终端
OpenAI意外“剧透”:GPT-5.5等未发布AI模型现身Codex CLI终端

0评论2026-04-232891

消息称OpenAI拟15亿美元投资一合资企业,发力企业级AI市场
消息称OpenAI拟15亿美元投资一合资企业,发力企业级AI市场

0评论2026-04-232728

阿维塔06T全场景运动轿车上市:21.99万元起
阿维塔06T全场景运动轿车上市:21.99万元起

0评论2026-04-232690