论坛预告:CCF YOCSEF技术论坛:大模型训练算力基础设施路在何方?
时间:2024年9月21日(星期六)8:30-12:00
地点:北京西郊宾馆一号楼第六会议室
执行主席:鄢兴雨,贺瑞君
活动简介:
随着大模型的快速发展,全球算力需求急剧上升。尤其在中国,受益于技术进展和应用场景的扩展,各类大模型数量不断增加。而大模型训练需要强大的算力支持,这导致对高性能智能计算资源的需求激增。然而,AI算力芯片领域的贸易管制,特别是进口A100、H100等高性能GPU芯片受到限制,使得中国在部署这些关键算力基础设施时遇到挑战。这种限制直接导致了国内算力供应的短缺,迫使许多依赖进口高算力芯片的企业等主体寻求国产替代方案。
然而,国内算力生产也面临诸多挑战。目前,虽然有部分大模型厂商开始使用国产芯片进行训练,但总体而言,国产芯片算力在技术路线、软件生态等方面仍有待提升。目前国产算力芯片除了紧跟英伟达的GPU路线之外,还有NPU、DCU甚至使用传统算力中心来进行模型训练等技术路线的探索。
本论坛邀请相关领域产业界和学术界的专家、学者、企业家,以及关心领域发展的媒体,就支持大模型训练的国产算力基础设施的发展路线进行探讨,以期明朗化一些路线。欢迎莅临共同进行探讨。
引导发言嘉宾一:陈健
陈健,博士,北京并行科技股份有限公司董事长,CCF中国计算机学会副理事长,CCF高专委常委,CCF人工智能专委执委,CCF YOCSEF主席(2019-2020),TEEC清华企业家协会北京分会副主席,清华航院校友会常务副会长。
发言主题:国产算力发展的机遇和可能突破路径
引导发言嘉宾二:吴保东
吴保东,无问芯穹研发总监,负责多元异构算力平台infiniai-cloud 的研发工作,研究方向包含大规模算力集群动态调度,大模型容错训练和训推一体化混合部署等。博士毕业于中科院计算所,曾在商汤科技和清华大学从事gpu 虚拟化和集群调度方向的博士后研究,并负责了超过2万张GPU卡的调度系统研发,支撑了整个公司90%以上的训练业务和用户给公司带来了超过1000万GPU时的新增算力和20%以上的GPU资源利用率提升。
发言主题:国产算力能否复制英伟达芯片的优化之路
引导发言嘉宾三:翟季冬
翟季冬,清华大学计算机系长聘教授、博士生导师、高性能所副所长。国家杰出青年科学基金获得者,国家重点研发计划项目负责人。CCF杰出会员、高性能计算专委副主任,ACM中国高性能计算专家委员会秘书长。主要研究领域包括并行计算、编程模型与编译优化。在并行计算与系统领域顶级会议和期刊发表论文100余篇,出版专著1部。研究成果获IEEE TPDS 2021最佳论文奖、IEEE CLUSTER 2021最佳论文奖、ACM ICS 2021最佳学生论文奖等。担任NPC 2018程序委员会主席、IEEE CLUSTER 2021领域主席,IEEE Transactions on Computers等多个国际学术期刊编委。担任清华大学学生超算团队教练,指导的团队十四次获得世界冠军。获教育部科技进步一等奖、中国计算机学会自然科学一等奖、CCF-IEEE CS青年科学家奖。
发言主题:大模型训练中算力中心的能与不能
思辨主题:
1)用存量算力中心来进行大模型算力替代,是可行路径还是资源浪费?
2)国产算力芯片的发展路径有什么划分?未来3~5年主流算力芯片会是什么路径和构型?
3)英伟达GB200单位面积算力提升有限,软件与体系结构优化更出彩。国产芯片设计与体系结构融合的现状如何?
执行主席:
鄢兴雨,CCF YOCSEF总部AC委员,北京智谱华章科技有限公司技术总监。先后作为技术负责人领导Aminer、智谱大模型开放平台的建设开发,负责算力芯片适配认证工作。目前的主要研究领域包括数据挖掘、预训练模型、大模型工程化等。硕士毕业于卡耐基梅隆大学,曾于谷歌总部任高级研发工程师,2019年回国联合创立智谱华章。
贺瑞君,CCF YOCSEF总部AC委员,CCF传播工作委员会副主任、国际合作委员会执委。人民邮电出版社高级策划编辑、副编审、第五届出版专业领军人才,专注信息类高水平学术专著及前沿技术图书出版,近5年所出版图书获中国出版政府奖图书提名奖、全国优秀科普作品奖,数十种图书分别入选国家“十三五”‘十四五’重点出版物规划,多个丛书项目获国家出版基金支持。
参会联系人:王鹏,15110090523(微信同号),yocsef@ccf.org.cn