2023年7月27日上午,由中国计算机学会(CCF)主办,东北大学秦皇岛分校协办,由河北东软软件有限公司、河北桃李科技有限公司、曙光信息产业股份有限公司赞助的“大语言模型时代,从自然语言到软件系统的实现路径”技术论坛在北戴河东海滩海景花园酒店顺利举办。针对ChatGPT等大语言模型在软件开发领域的研究及应用现状,对自然语言生成软件的关键问题、核心技术和开发模式等议题进行了深入的思辨,以期为研究人员的研究方向、开发人员的职业规划和高校人才教育的培养目标做出前瞻性的指引。本次论坛由CCF YOCSEF保定AC、东北大学秦皇岛分校计算机科学系万聪和CCF YOCSEF保定AC、河北雄安桃李科技有限公司王震共同主持。邀请了东北大学李北博士、燕山大学冯建周副教授、东北大学秦皇岛分校宋欣副教授做引导发言,同时在思辨环节邀请了河北东软软件有限公司产品研发和创新中心王亚坤副主任、燕山大学吴培良教授、东北大学秦皇岛分校王聪副教授共同参与思辨讨论,CCF YOCSEF 总部AC, 首都师范大学副教授唐晓岚以及来自全国各高校和企事业单位等专家学者共计50余人参会。
第一个环节由YOCSEF保定AC王震介绍了YOCSEF文化和保定分论坛,然后进入到嘉宾引导发言环节,首先是来自东北大学李北博士的《先推敲后生成,大语言模型的Prompt设计》,李北介绍了大语言模型的发展历史、训练方法和能力,又结合微软亚洲研究院的相关工作,介绍了大模型在代码生成中的相关案例。
接下来是燕山大学冯建周副教授的《面向深度语义理解的自然语言处理技术在不同行业应用探讨》,冯建周从科技文献分类、科普大模型、法律大模型等案例出发,介绍了语言大模型在多种领域的应用,提出了领域知识在大语言模型应用当中的重要作用。
最后是东北大学秦皇岛分校宋欣副教授的《ChatGPT与计算机视觉模型的对接融合分析与展望》,宋欣以ChatGPT为例,介绍了语言大模型和视觉模型的对接探索,指出了在CV领域开发通用人工智能的几项难点,包括:数据复杂性、人类智力复杂性和缺乏认知理论支持。
引导发言之后,YOCSEF保定2022-2023年度主席刘帅奇为嘉宾颁发了感谢牌并合影。
最后,论坛进入思辨环节。本环节共讨论了三个议题:
议题1:以信息管理系统为例,在从自然语言到软件系统的生成过程中,还需要解决哪些关键问题?
与会嘉宾从大模型的技术、应用、安全、经济可行性等角度进行了广泛讨论。学术界嘉宾对大模型训练过程中代码语料样本不足、数据隐私、人文伦理道德问题表达了看法;企业界嘉宾对大模型训练、使用的成本,代码测试和部署等问题表达了看法。
议题2: 大型语言模型对开发人员掌握的核心技能带来哪些影响,传统的技能(编程语言,数据库,框架)和新技能(AI模型,数学)在开发人员的技能体系中会有怎样的演化和调整?
与会嘉宾从短期影响和长期影响两个角度进行了思辨,从短期来看,普遍认为大模型能够极大的简化编程工作、降低学习门槛,但是对开发人员的核心技能不会造成决定性影响;从长期来看,学习和创新能力、数学知识和数据处理知识、软件测试能力将发挥更重要的作用。
议题3: 基于大模型的应用级自动化生成工具,其工作模式应当是怎样的?
与会嘉宾从开发人员角色、工具部署方式、应用软件的领域等角度进行了讨论。从角色来看,自动化工具应当为架构人员提供优化架构的能力,为中级开发人员生成架构方案,为初级开发人员生成代码;从部署方式来看,根据开发者对于安全性、隐私性的不同要求,选择私有或者公有的不同部署方式。总的来说,自动化生成工具会极大简化软件开发流程,但是对于大型软件的生产还有一定的路要走。
思辨环节输出以下结论:
(1)领域大模型的训练、安全隐私问题、应用部署和调试是软件自动化生成所面临的几个关键问题。
(2)大语言模型对软件开发人员的影响是有利有弊的,对于相关从业人员来说,工作中应当使用大模型进行赋能,主动应对变化。
(3)通过使用自然语言和辅助工具,自动化生成软件的过程还有一些门槛,对于复杂的大型软件还有相当的距离,但并非是遥不可及的。
思辨环节之后,YOCSEF保定主席王珺为嘉宾颁发了感谢牌。