2023年9月24日,CCF YOCSEF成都“开源生态下超算软件技术的发展之路”技术论坛在国家超算成都中心顺利举行。论坛由中国计算机学会主办,CCF YOCSEF成都学术委员会、国家超级计算成都中心、青软创新科技集团股份有限公司协办。论坛由YOCSEF成都AC委员陈磊(国家超级计算成都中心),刘昶(成都大学)担任论坛执行主席,YOCSEF成都AC委员周蓓(四川农业大学),唐诗(真术相成科技)担任线上主席。来自中国科学院计算技术研究所、四川大学、西南财经大学、成都信息工程大学等省内外高校研究学者,还有开放原子开源基金会、达坦科技、飞腾信息技术(成都)、成都启英泰伦科技、成都德奥思软件、北京软通动力等单位的行业专家,以及YOCSEF桂林分论坛AC委员共计40余人参与了本次论坛。
随着全球科技竞争的日益激烈,科技创新已成为各国经济发展的关键驱动力。在这个大背景下,开源社区的创新活力和超算软件技术的快速发展为科技创新提供了强大的动力,为提升国家科技和产业核心竞争力提供了有力的支撑。本次论坛将围绕开源生态与超算软件技术的深度融合,旨在讨论如何在开源生态下构建高效、稳定、可持续的超算软件技术体系,如何利用开源生态促进超算软件技术的创新和转化,从而推动科技创新和产业发展的紧密结合,推动国家信息化规划与数字中国建设整体布局的实施。
上午首先是走进国家超算成都中心活动,与会人员及家属共同参观了成都超算中心展厅及主机系统,了解成都超算中心的功能定位、算力规模等情况,让大家近距离接触到了超级计算机这一“国之重器”。
国家超算成都中心算力规模按照峰值性能300PFlops进行总体规划并建设相应配套系统,于2020年9月完成一期峰值性能170PFlops超算系统的建设,并于2021年6月成为国家科技部批复设立的第十个国家级超算中心。
下午两点在国家超算成都中心第一会议室,“开源生态下超算软件技术的发展之路”技术论坛正式开始。
环节一:引导发言
首先是由开放原子开源基金会郭晧以《超算领域开源生态发展实践》为题,从上游、中游、下游系统介绍了HPC软件堆栈的全景图,并从物理算力调度、云计算算力调度和操作系统等不同维度介绍了开放原子高性能计算相关的开源项目,以及开放原子开源基金会背景,分析了超算领域开源生态的组织拓展性,也对超算技术的发展和应用提出了展望。
第二个引导发言是由来自中国科学院计算技术研究所副研究员贾伟乐以《第一性原理计算的超算生态和软件技术之我见》为题,从第一性原理计算软件和算法角度,分享了超算应用软件技术的最新应用和发展趋势,同时也提出了超算应用软件面临的挑战和机遇。
第三个引导发言是由达坦科技联合创始人王璞以《HPC、AI、Cloud开源底层技术融合发展趋势浅谈》为题,以一个全面而深入的视角,揭示了开源底层技术之间相互借鉴,讲解了Cloud和HPC的架构的差异性,并且提出了在大模型时代下Cloud和HPC不同的侧重优势。
环节二:思辨环节
在思辨环节,与会嘉宾围绕“开源生态下超算软件技术发展”,分别从三个思辨议题进行了讨论。
思辨议题1:开源生态下如何保障超算底层软件系统的技术安全与演进?
西华大学何冠霖提出了用国外的GPU和CPU加速体系存在风险,国外开源软件有一定安全风险,要不断加强国内自主可控的开源体系建设。来自爱奇艺的李海认为开源也有国界的,我们应该需要打造适合自己的开源平台来保障软件生态的安全。开放原子开源基金会郭晧认为我们可以以“跟随,自主,超越”三个阶段,在国外的开源软件生态的基础上,进一步加大研发,逐步实现自主安全可控,进而实现技术上的演进创新。西南石油张晓均认为超算应该是面向特定行业方向服务的,在考虑安全时,要够做到代码的审计等工作,包括从攻防动态特性上考虑安全机制,也是非常重要的。要从逆向工程思维去提高系统的稳健性。飞腾王毅竺表示我们应当从超算行业的软件需求出发,聚焦生态和应用层面,再去考虑软件生态安全和演进才是有价值的。达坦科技王璞表示,大多数软件的价值并没有被全面认可,大多都认为开源就是免费,从底层操作系统到上层应用软件开发难度都是非常大的。也许经过多年发展,只有当我们能引领别人的时候,那么软件的生态安全就有保障了。
思辨议题2:开源计算框架如何增强超算应用软件的开发与运行效率?
国家超算成都中心郑亮认为,超级计算机是为了解决人类以前解决不了的问题,多年以前超算的应用90%以上都解数学和物理方程,而如今随着人工智能的兴起,对超算应用带来很大的变化,我们可以更加聚焦到AI应用软件来讨论这个问题。中为新智毛河提出开发效率和运行效率是互斥的,可以通过开源计算框架以及开发中间件的应用去兼顾运算效率。成都德奥思软件吕岩则更关注开源计算框架部署、维护问题,只有足够的技术投入才能给开发者提供完整生态助力。开放原子开源基金会郭皓提出计算框架需要提供友好的文档,同时保障用户后续增值服务是非常困难的,但可以考虑从开源协作的思路来解决这些问题。西南财经大学杨新认为要增强应用软件的开发和运行效率的前提是要有相应对等的市场需求。比如当前AI大模型时代开启,也许可以通过AI助手的方式,来提高超算应用软件的开发效率。成都信息工程大学王铁军谈到,在软件开发过程中只要用到相应的计算框架,开发效率一定会提高。但是针对当前硬件种类繁多,底层架构多样化的趋势,开源计算框架首先需要解决能否针对不同硬件实现通用适配的问题。
思辨议题3:如何借助开源生态推动人工智能与超算的深度融合?
成都信息工程大学王铁军认为人工智能更偏向商业业务方向,而超算则更多是偏向科研领域,二者本身融合是比较困难的。但随着AI大模型的发展,让人们看到通过开源生态来促成人工智能和超算深度融合的可能性,可以将超算发展中积累的框架和算法移植到人工智能中去,大幅提高AI大模型训练效率。国家超算成都中心曾先锋认为人工智能和超算的并行发展首先是解决有和无的问题,要先保证有东西用,而利用开源生态去促进AI和超算的深度融合,就需要国家队牵头,产业和学术界共同协作才能落地。飞腾王毅竺表示,人工智能和超算底层运行的算子模块才是两者共性因子,如果开源生态能够推动底层算力模块不断地迭代发展,才能真正实现AI和超算的深度融合。西南石油大学彭博认为,人工智能大模型的迅速发展很大程度上都是依赖于开源生态,相较超算较为封闭的应用领域来看发展速度更快,我们也可以借助人工智能这种模式来提高超算生态的开放度,从而带动两者的融合发展。
经过一下午的紧张的讨论思辨一方面让大家对超算从底层系统到上层应用软件整体开源生态体系有了更加清晰的认识和了解,同时也让大家共同看到了在当前AIGC如火如荼的发展态势,充分发挥开源生态的内在驱动力去进一步促进人工智能和超算的融合发展已是必然趋势。
最后,两位执行主席为三位思辨引导嘉宾颁发了感谢牌。CCF YOCSEF成都现任主席牛宪华进行了论坛总结发言,并预告了YOCSEF成都的下一次活动—2023年11月11日举办的《“AI+儿童医学”未来技术发展趋势》技术论坛。