计算机教育 | 大模型与系统能力培养
创始人
2025-06-30 11:00:23
0

计算机系统包括计算机原理与体系结构、操作系统、程序设计语言与编译器、分布式系统等,是计算机领域的重要研究方向,在AI大模型出现的背景下,计算机系统的教学需要发生哪些变化?

首先,AI软件栈是非常复杂的,比传统软件栈的层次可能还要多一些,包括:①AI处理芯片及其指令集(ISA);②通用异构编程模型(如CUDA);③基础算子库(包括AI算法里面常用的矩阵乘法、卷积、激活函数等);④通信库;⑤编译器与变异优化;⑥编程框架;⑦分布式框架等。

可以看到,AI大模型其实涉及非常丰富的软件层次,还涉及很多新的优化方法。比如,传统的编译优化基本上是等价变换,就是把一组计算等价地变换成另一组计算,在这个过程中删除冗余的计算。然而,在AI计算的优化里有很多不等价变化,如AI模型的量化,把原来的16位权重变成8位甚至4位,把原来的浮点数存成整数。这个时候怎么做才能够既减少大小,又保证精度尽量不下降?这涉及算法模型与编译优化的互动。另一类不等价变换是模型的稀疏化。正常的神经网络计算,主要是稠密矩阵的计算。实际上,它里面的参数有一些可能比较小,把它变成0效果也很好,于是就出现了一些体系结构,如英伟达,它支持所谓结构化稀疏,即每4个元素里有2个是0两个非0,都可以用它里面的稀疏张量单元支持这种操作。另外一种优化也是在算法层面的,如果Transformer中每一个query都有对应的数据结构支持,它会非常大,有人做的简化就是所有的query都共享一个K和V,它需要的空间就小很多,但问题是精度就不好,因此又出现了grouped-query进行折衷。

因此,AI大模型对整个计算机系统的发展及其教学产生了比较大的影响。计算机系统主要有两个驱动力:一个是底层硬件的变化,一个是上层应用的变化。现在大模型很明显已经占了非常主要的计算基础设施的投资以及计算的时间和成本。对于这样的AI大模型的训练和推理,对应的系统要有什么样的变化,教育如何适应这些变化是摆在计算机系统教育者面前的紧迫问题。计算机系统本来就是由应用驱动的。过去的一些典型的应用,像大数据、移动计算,还有更早期的数据库OLTP等也驱动了计算机系统的发展。AI大模型体现出了更强的综合性,它的算法不完全是传统的计算机算法,其实更像是统计模型,统计算法在里面起到比较大的作用。当然,有软件也要有硬件综合起来。因此,做系统的人(包括系统软件和硬件)需要对算法和统计模型有更好的理解,要达到优化的目的,需要了解算法和模型层面能够做什么,硬件和软件分别可以做什么。这样的综合能力也对传统的系统能力培养课程提出了更高的要求。

传统的系统能力培养课程要针对这一变化进行调整。以笔者在清华开设的“编译优化”课程为例,主要还是采用编译经典教材“龙书”的内容,包括数据流分析、过程间分析、循环分析、自动并行化等基于等价变换和冗余删除的传统编译优化内容,对于量化、稀疏化这些“近似等价变化”维度的AI模型优化还没有覆盖。对于体系结构课程来说也是有类似的问题:硬件到底提供什么样的功能?例如英伟达根据模型参数的稀疏性,在张量运算单元TensorCore上实现了结构化稀疏技术,但如何将模型最优地变换为结构化稀疏参数是一个需要软硬件协同考虑的过程。统计模型对误差有较好的容忍能力,低位宽的数据运算格式有助于提升运算性能和访存压力,FP8这种八位的浮点数和新的FP4四位的浮点数,对于模型的训练和推理来说是否能够有效使用起来?传统的体系结构更多的是理解应用的计算模式和访存模式,对精度和统计类的一些问题,是缺乏了解的,这些都需要在系统能力培养的课程中补足。

从教学的角度来讲,要求教育者更加深入地了解统计和AI模型,在传统的数据结构和确定性算法的基础上,增加统计的、非确定性的、有误差的算法与系统组件,全面修订现有的系统能力相关课程内容。

作者简介:陈文光,男,清华大学计算机系王建筑讲席教授,研究方向为分布与并行处理以及编程系统,cwg@tsinghua.edu.cn。

相关内容

热门资讯

华为大动作!开源盘古7B稠密和... 6月30日,华为正式宣布开源盘古70亿参数的稠密模型、盘古Pro MoE 720亿参数的混合专家模型...
刘慈欣《吞食者》“入侵”西安!... 《吞食者》“入侵”西安 拉开“沉浸大战”序幕 6月25日,西安骡马市民生购物中心奥斯卡XR未来影院,...
市妇联举办学习应用AI能力提升... 为深入学习贯彻习近平总书记关于妇女儿童和妇联工作的重要论述,增强妇联干部对人工智能等前沿技术的认知与...
智能制造与机器人领域新突破:河... 在河南省教育厅的悉心指导下,一场聚焦于智能制造与机器人行业产教融合的重要盛会顺利召开。此次盛会由河南...
积极开展先行先试!天津加快建设... 天津北方网讯:6月30日,2025上合组织数字经济论坛新闻发布会在天津举行。天津市数据局局长邓光华介...
济南城市治理的数智跃迁 大众网记者 刘帅 济南报道 在不久前举办的文化强国建设高峰论坛上,济南“以‘数智’之光 照亮文明之路...
猫王音响创始人“怼”雷军遭围攻... 6 月 30 日今天,#猫王音响创始人最后一次回应怼雷军#登上微博热搜第五,小雷本以为这个话题在上一...
首届魔搭开发者大会举办,已服务... 6月30日,首届魔搭开发者大会在北京举办。自2022年11月初成立以来,历经两年多高速发展,社区已汇...
数字化转型助力肥沃土地,多打粮... "以客户为中心就是持续为客户创造更多的价值。" "以奋斗者为本就是通过合理的价值分配让创造价值的人获...
智能眼镜开启视觉交互新体验 本报记者 郭冀川 近期,智能眼镜在消费电子市场可谓风头正盛。从销售端来看,618购物节期间,智能眼镜...
数字生活迎时代创新 这款游戏早... 当三大运营商宣布全面重启eSIM服务的消息传来,整个移动通信领域为之震动。这项曾被反复讨论的技术终于...
杭州城投,如何智创未来? 潮新闻客户端 记者 黄伟芬 通讯员 俞璐 谭婧 杭州,将跻身全国首批拥有城投专属人工智能产业大模型的...
搜狐医药 | 蚂蚁健康应用AQ... 出品 | 搜狐健康 作者 | 袁洋 编辑 | 吴施楠 2025世界人工智能大会(WAIC)近日揭晓大...
康斯特(300445)新增【胎... 证券之星消息,根据市场公开信息整理,6月30日康斯特(300445)新增【胎压监测】概念。 新增概念...
厦门企业加速布局机器人赛道,相... 一群机器人在央视蛇年春晚上扭秧歌,全球首场人形机器人半程马拉松赛在北京举办,全球首场人形机器人格斗比...
“AI考生”何以成为力学“学霸... 科技日报记者 于紫月 在近日落下帷幕的第十五届全国周培源大学生力学竞赛中,一位特殊的“考生”吸引了人...
南京占据4席 数量全省第一——... 6月28日,江苏省具身智能机器人产业联盟成立仪式暨产业创新发展对接会在南京举行。会上发布江苏省具身智...
机器人产业人才竞争激烈,全国现... 近日,北京亦庄半程马拉松上,机器人“选手”表现抢眼,引发广泛关注。随着机器人产业的蓬勃发展,人才成为...
720亿参数!华为首个开源大模... 智东西 作者 | 李水青 编辑 | 云鹏 智东西6月30日报道,今日,华为首个开源大模型来了。70亿...
AI+场景创新②丨从找衣服到安... 从实验室 走向养老社区等人居生活场景 机器人正成为 银发经济中的重要一环 在成都市温江区的一家养老社...