登顶全球第一!北航郑耀威!
创始人
2025-07-03 13:41:42
0

他以学生一作

发表高水平学术论文6篇

谷歌学术引用量超过600次

第一作者论文引用量超过500次

他是LLaMA-Factory开源项目的主导者

单个项目获得超过4万收藏量

成为大语言模型微调国内最热门框架

登顶Github热门项目榜单全球第一

他受邀发表10余场主题演讲

荣获华为昇腾生态开源卓越贡献奖

中国电信魔乐社区卓越贡献合作伙伴

他是开源技术先锋

计算机学院2022级博士研究生

郑耀威

学术成果与个人荣誉

  • 发表学术论文7篇,其中学生一作论文6篇

  • 2024年华为昇腾生态开源卓越贡献奖

  • 2024年中国电信魔乐社区卓越贡献合作伙伴

  • 2023年全国数字健康创新应用大赛算法模型一等奖

  • 2022年“华为杯”中国研究生数学建模竞赛一等奖

  • 2021年“挑战杯”首都科创作品竞赛二等奖

  • 2020年北航榜样:创新表率之星

发表大会演讲

  • 2025年GOSIM AI Paris

  • 2025年vLLM Beijing Meetup

  • 2025年北京人工智能产业创新发展大会

  • 2024年GOSIM CHINA开源创新大会

  • 2024年阿里云栖大会

  • 2024年阿里云AI智领者峰会

  • 2024年山东省昇腾人工智能产业峰会

  • 2023年AICC人工智能计算大会

缘起AI,厚积薄发

2016年,谷歌AlphaGo在围棋大赛中击败人类世界冠军的消息轰动世界。正在备战高考的郑耀威,被人工智能的奥秘深深吸引,立志要在人工智能领域做出突破。考入北航后,他立刻投身人工智能的知识海洋。

郑耀威在大一就展现出强烈的学习主动性,从自学课程、参与竞赛到主动加入实验室,每一步都稳扎稳打。大一期间,他利用课余时间先后自学了6门专业公开课,涵盖Python、概率论、机器学习、深度学习等多个领域,累计课时达800余学时,打下了坚实的专业基础。他说:我因AlphaGo的契机走进了人工智能世界,又因北航优秀学长学姐的事迹坚定了创新的志向。”看到学长学姐在AI领域发光发热,他也立下了志向。

为了能更深入地投入学术研究,大二时,郑耀威主动加入计算机学院张日崇教授的科研团队。起初只能从跑实验和读代码做起,但他坚持“每天都有进步”。每周往返于沙河与学院路之间。在这段披星戴月的奔波路上,郑耀威开启了属于自己的科研创新之旅。他在本科二年级暑假选择留校科研,每天沉浸在实验室的讨论、建模与调试中。“那时候每天都觉得特别充实。”

“博观而约取,厚积而薄发” 是郑耀威的人生信条。秉持对学术的执着追求,他心无旁骛地钻研科研问题。与导师张日崇教授、高年级同学的思想频繁碰撞,有时一天会进行三四次深入讨论,这不断激发着他的灵感与创新思维。郑耀威专注于低资源场景下的机器学习技术研究,面对重重困难,他一次次地尝试、总结、提升,第一作者的身份在ACL、CVPR、AAAI、WWW等国际顶级会议上发表了多篇论文,其中学生一作论文6篇

在科研之余,他也积极参与各类课外科技竞赛。他提出的“基于语法图上随机游走的多方面情感分类”,斩获北航冯如杯科技竞赛一等奖。他开发自动检查心脑血管疾病算法,在全国数字健康创新应用大赛中脱颖而出,荣获算法模型一等奖。此外,他还荣获全国大学生冰壶人工智能挑战赛的总冠军、蓝桥杯信息技术大赛全国一等奖等各类专业竞赛奖项,展现了北航学子的卓越风采与创新精神。

郑耀威获得全国数字健康创新应用大赛一等奖

“竞赛不是目的,而是锻炼创新力的过程。”郑耀威说。他印象最深的是数学建模美赛:连续三天两夜奋战,与队友轮流通宵,边查资料边写代码,最终收获了极强的团队协作能力。这些实践经历不仅提升了他的技术能力,也锻炼了他面对压力和不确定性的应变能力。

智享开源,大模型赋能

“互联网的精神就是自由、开放、共享。”2022年末,ChatGPT的诞生彻底引爆了人工智能领域,以大模型为代表的人工智能技术深刻改变学术、生产和生活的方方面面。郑耀威在被吸引的同时,察觉到大模型微调和推理资源消耗巨大,阻碍了AI落地应用,且GPU资源被大型公司垄断,给研究人员和开发者带来重重壁垒。他坦言:开源打破了大模型的信息壁垒,我希望通过我的项目让所有人都可以真正用好大模型。”

为此,他将研究重心全然倾注于大模型微调框架。以第一代LLaMA开源大模型为基石,结合自身在低资源场景机器学习领域的技术积累,历经数月沉浸式钻研与开发,成功在该框架中实现了大语言模型的量化和低秩分解技术,使模型的显存消耗大幅降低,训练成本更是降低了30倍。依托这一技术,他构建了大模型高效微调框架LLaMA-Factory,并开源至GitHub平台

LlamaFactory项目获得国内外多家机构认可

该项目一经提出就受到了广泛关注,社区开发者的需求纷至沓来,特别是在国产化计算环境中实现应用方面。为此,郑耀威学习了各类型号硬件平台文档,实现了硬件感知的自动优化方案,使LLaMA-Factory在英伟达芯片和国产芯片上均能无痛运行。这一贡献赢得了华为昇腾芯片部门官方的高度认可,郑耀威也因此荣获华为昇腾生态开源卓越贡献奖

郑耀威获中国电信魔乐社区卓越贡献伙伴

他坦言:“维护开源项目其实压力也挺大,但既然它代表了我们实验室,我就要把它做好。”在不断优化功能的过程中,他始终坚持回应社区开发者的问题与建议,在他的不懈努力下,项目逐渐赢得了社区开发者的广泛赞誉与热烈欢迎。2024年年初,项目达到了1万颗GitHub星标,目前累计获得超过40000星标成为了国内最热门的大语言模型微调框架,并登顶Github热门项目榜单全球第一!

LLaMA-Factory登顶Github热门项目榜单全球第一

郑耀威积极将学术成果与社会应用紧密结合。他多次受邀参加行业峰会、开发者大会,与全球各地的LLaMA-Factory用户面对面交流,共同探讨技术难题。2023年11月,在北京举行的AICC人工智能计算大会上,他首次发表主题演讲,深入讲解LLaMA-Factory的技术创新与广泛应用。

郑耀威发表大模型高效训练主题演讲

2024年8月,郑耀威将项目带至国际计算语言学年会ACL现场,向来自世界各地的开发者演示框架技术,并交流开源经验。阿里云栖大会上,他还介绍了LLaMA-Factory在山西文旅AI导游场景中的实际应用。

2025年2月,郑耀威作为嘉宾参加了北京人工智能产业创新发展大会端侧推理圆桌论坛,围绕DeepSeek爆火后的行业趋势,与华为、软通、清昴等企业嘉宾共同探讨大模型如何更好落地服务每一个人。

郑耀威参加国际计算语言学顶会ACL

郑耀威分享LLaMA-Factory在山西文旅AI导游场景的实践

郑耀威与业界大咖共话DeepSeek带来的AI应用加速创新

逐梦前行,奋斗永不停歇

谈及自己的成长过程时,郑耀威尤为感谢身边老师的支持。他回忆起在项目受挫时,导师张日崇教授花一整天陪他一起分析代码、逐句讨论论文的经历,“那种陪伴式的科研指导,我至今铭记在心。”而本科辅导员在“挑战杯”竞赛中给予的悉心指导、PPT演练支持,也让他更加坚定了科研道路的选择。

面对学弟学妹们,他也提出了诚恳的建议。“做科研不要只局限于写论文,而是为了真正解决人们的难题。”他建议同学们在学好课内知识之余,可以通过参与开源社区的形式接触前沿技术,与学者碰撞观点。同时,他强调了数学与英语的重要性。他希望有更多同学走进创新,用好大模型,也希望通过开源精神,让每个人都能有机会做出耀眼的成果。

对于人工智能的未来,他有着自己的思考。在他看来,大模型不应只是技术成果,更应该成为全社会共享的福祉。他特别关注当前大模型“知识定格”的局限性,并提出AI应具备“动态学习力”,能够随着世界变化不断更新知识体系,从而真正迈向通用智能

将大模型赋能给每个人,是郑耀威的理想。如今,LLaMA-Factory项目已成为国内外广受欢迎的大模型微调工具,被阿里云、腾讯云、英伟达、亚马逊云计算等众多知名企业广泛应用。他表示,开源项目的持续维护源于他希望人人皆可训练大模型的初衷。未来,郑耀威将继续推动人工智能技术开源,致力于让AI大模型的资源惠及所有人,为社会创造更大价值。

相关内容

热门资讯

国产新技术打破传统单细胞测序局... 来源:滚动播报 (来源:千龙网) 8月22日,由华大生命科学研究院牵头建设的基因组多维解析技术全国重...
从MR到机器人,vivo的“快... 文丨壹观察 宿艺 “未来已经到来,只是尚未流行。”多年前,科幻作家威廉·吉布森通宵体验虚拟现实空间后...
千余封家书“空降”金陵中学军训... 8月24日晚,南京市金陵中学高一年级军训基地的夜空下,一场酝酿多日的“惊喜”悄然抵达。一千余封承载着...
中国低轨卫星组网提速,卫星互联... 近期,我国卫星互联网建设领域迎来了显著加速。从7月底至8月中旬,中国星网GW星座在短短二十余天内,成...
华为Mate 80系列首发麒麟... 据huaweicentral报道,华为已为Mate 80系列的发布做好了准备,除了新功能外,新机预计...
Circles携手OpenAI... 全球电信巨头Circles与人工智能先锋OpenAI携手,共同开创电信领域的新纪元。双方宣布建立一项...
“星舰”取消24日第十次试飞,... 【环球网报道】美国太空探索技术公司(SpaceX)当地时间24日傍晚宣布取消原计划当日进行的“星舰”...
余承东宣布鸿蒙5终端设备数突破... 快科技8月25日消息,今天下午,华为常务董事、终端BG董事长余承东宣布搭载HarmonyOS 5(以...
新川又一科技创新中心建成投用! 近日, 新川创新科技园 又一科技创新中心建成投用! 新川电子城(成都)智慧科技创新中心 项目面积:...
超声风速仪的优点—监测风场气象... 来源:云境天合科技 【TH-CQX2,山东云境天合气象环境监测仪器设备厂,品质保障】超声波风速风向记...
唐本忠:科技创新的文化与制度浅... 作者|唐本忠〔中国科学院院士、香港中文大学(深圳)理工学院院长〕编辑|于永 我们的文化有着实用主义的...
顶尖人才最高可拿“1亿元”!温... 近日,温州市政府官网发布《温州市加快建设人工智能创新发展先行市的若干政策举措(征求意见稿)》,拟推出...
科诺耐火取得电极糊旋转挤压快速... 金融界2025年8月25日消息,国家知识产权局信息显示,巩义市科诺耐火材料有限公司取得一项名为“电极...
“赛博养老搭子”来了!你pic... 8月22日-24日,第九届中国(广州)国际养老健康产业博览会在广州举行。科技赋能的养老产品是本届广州...
原创 折... 要说对手机类型的兴趣,自然是传统直板机使用的人最多,但也不乏有些用腻了的人想缓缓口味,折叠屏手机就是...
从流量平台到生态共建,互联网巨... //店员完成餐品制作后正在打包封签,这些动作都在明厨亮灶直播状态下完成(图源:新华网) 这两个看似寻...
宁德时代投资成立新公司,含充电... 企查查APP显示,近日,时代骐骥新能源科技(榆林)有限公司成立,经营范围包含:充电控制设备租赁;充电...
小米三星布局移动智慧屏,闺蜜机... 近期,市场观察机构发布了一份引人瞩目的报告,指出小米与三星两大科技巨头已正式涉足移动智慧屏领域,此举...
中核集团成功验证快堆非能动余热... 2025-08-24 15:40:35 作者:狼叫兽 近日,中核集团中国原子能科学研究院反应堆工程...
什么手机最好用?荣耀Magic... 在讨论“什么手机最好用”的时候,荣耀Magic V Flip2无疑是首选。无论是外观设计、屏幕体验还...