山西卫视晚间新闻报道
7月15日下午,CCF YOCSEF太原在山西大学计算机与信息技术学院举办“AI for Science大行其道,如何应对AI against Scientists”观点论坛,本次论坛由YOCSEF太原AC委员姚姗姗和副主席徐双担任执行主席,AC委员许骁哲和AC委员韩英担任线上主席。
执行主席姚姗姗和徐双作开场介绍
本次观点论坛邀请到中国科学院计算技术研究所研究员冯洋、太原理工大学计算机科学与技术学院教授王莉担任引导嘉宾,还邀请到中国科学院计算技术研究所研究员王元卓、华南理工大学软件学院副教授陈俊颖、山西大学计算机与信息技术学院教授张虎、中国科学院山西煤炭化学研究所副研究员宋昌、算力互联(北京)科技有限公司副总经理李哲、山西医科大学第一医院神经外科主治医师王明宇担任特邀嘉宾。本次观点论坛旨在讨论大模型对于科研人员的便利、冲击和挑战,并提出应对策略。
参会现场全景
引导发言
第一位引导嘉宾中国科学院计算技术研究所研究员冯洋以《在语料和模型规模之外:如何有效训练大模型?》为题作报告,她首先阐述了大语言模型出现的原因、进化历程,接着指出ChatGPT的关键技术主要是预训练语言模型和指令微调。大预言模型目前面临的挑战有算力需求高、语料收集困难、Scaling Law、隐私安全和伦理道德等问题,只有当模型参数达到一定规模时才会出现“涌现”能力。她还介绍了参数高效的微调方法LoRA和特定NLP任务的指令构建,目前“百聆”大模型存在的问题是以英语为主,其他语言能力不强,如果要提升大模型在其他语言上的能力,则需要扩充预训练语料,提升基座语言模型生成该语言能力,构建该语言指令,提升大模型在该语言上与人类对齐能力。但是构造多种语言的预训练语料和指令数据,会导致大模型的训练成本过高、效率低下。解决方法是通过交互式机器翻译来避免数据标注,同时提升语言生成和与人类对齐能力,因此“百聆”大模型表现出了更强的中文能力、多轮交互能力。目前“百聆”大模型在垂直领域方面的表现结果:翻译任务达到GPT4 95%的性能,取得开源的翻译大模型中的最佳性能,验证了百亿模型在垂直领域的可行性;在通用领域方面的表现结果:通用任务达到GPT3.5-turbo 89%的性能,增强的语言对齐带来多方面提升。最后,她从训练领域模型、高效训练和引入领域知识这3方面对大模型做出了未来展望。
中国科学院计算技术研究所研究员冯洋作引导报告
第二位引导嘉宾太原理工大学计算机科学与技术学院王莉教授以《大模型浪潮下的高校科研与教育》为题作报告,她首先阐述了大模型的定义和发展进化历程,接着引出大模型的出现对自然语言处理、计算机视觉、声音识别和语音合成等领域带来的机遇与挑战。她通过最新的研究论文指出GPT类大模型逐渐成为一种通用技术,已经影响到80%的工作岗位,着重指出了大模型对教育行业的影响,并提出了教师和学生的应对方案。随后她又强调了由于大模型的出现而产生了新的科研方向。最后她指出大模型加速了高等教育的变革,并给出了相应的数据需求、芯片需求、模型需求、应用需求和安全需求。
太原理工大学计算机科学与技术学院教授王莉作引导报告
姚姗姗为引导嘉宾冯洋颁发感谢证书
徐双为引导嘉宾王莉颁发感谢证书
激烈的思辨讨论
思辨点一:生成式大模型的使用,会给研究工作带来哪些便利和挑战?
中国科学院计算技术研究所研究员王元卓指出目前大模型在学术界和产业界被过度关注,因为它颠覆了传统的思维和认知,并通过举例说明了对申报项目、论文选题的影响,但是大模型生成结果的可靠性检测依旧是个尚未解决的问题。华南理工大学软件学院副教授陈俊颖强调大模型因为包含大量的模型参数从而具有很好的下游任务匹配能力,甚至具备一定的推理能力,我们可以通过微调大模型将其适配到相应的下游任务,同时也可以在相应的垂直类应用中充分利用大模型的优势。大模型也给科研工作带来一些挑战,例如目前的大模型主要以大语言模型为主,但是大语言模型和大图像模型之间并不互通,而且图像大模型的构建与训练数据集有很大关系。比如,前段时间发布的SAM图像分割大模型,有研究团队将其应用到几十个医学图像分割数据集上,发现效果都不好,可见图像大模型的发展仍然存在较大挑战,可能需要针对多种的图像类型和视觉任务设计和训练图像大模型。YOCSEF太原副主席张光华指出大模型已经成为一个必不可少的工具,不是每个研究人员都需要开发新的大模型,因为训练大模型对算力资源的要求比较高,所以对于普通科研人员来说有壁垒,目前大模型的通用知识领域能力比较强,但是专业领域能力还有待提升。YOCSEF太原AC委员姚姗姗认为大模型有助于总结论文的创新点,但是对于我们认知之外的生成知识无法判断其正确性,这是目前面临的主要挑战。山西医科大学第一医院神经外科主治医师王明宇认为在医疗领域,大模型还没有特别成熟的案例,但是AI影像辅助阅片已经优于人工阅片,尤其在医学伦理和患者隐私方面,大模型还需要更多地被约束。YOCSEF太原AC委员魏巍指出了大模型的通用性和局限性,尤其是对自然语言处理、计算机视觉等研究方向有非常大的冲击。YOCSEF太原AC委员韩英认为目前电商行业中已经有很多用户在利用虚拟数字人进行直播带货,他们可以24小时不停歇地工作,我们可以很清晰地看到大模型对电商直播行业的巨大冲击。
胡欣宇、姚姗姗为特邀嘉宾王元卓和陈俊颖颁发感谢证书
思辨点二:大模型会对哪些研究方向造成冲击,该如何应对?
山西大学计算机与信息技术学院教授张虎认为大模型出现之前神经网络在多个应用领域已经取得很好的效果,大模型的出现给高校的研究工作提供了便利,但是也带来很大的冲击,同时也对创新提出了更高的要求。之前的研究方向是否还有必要继续下去,目前在没有开源的条件下,我们是否应该研究大模型的内部架构。中国科学院山西煤炭化学研究所副研究员宋昌认为我们要从用户角度去关注大模型,不仅仅把它当作一个工具,还要把它当作人来看待,大模型的智力在某些领域超越了人类,在某种程度上替代了人类大脑,因此对任何研究方向都会造成冲击。因为大模型迭代的速度会越来越快,未来如何控制大模型的演化是一个重要的研究领域。YOCSEF太原学术秘书董云云指出各个领域都受到了大模型的冲击,我们可以深入探索模型内部的可解释性,增加模型内部的可信度。华南理工大学软件学院副教授陈俊颖认为目前大模型可以帮助科研人员生成漂亮的寓意图片以及润色论文,节省了科研人员的大量时间。但是,大模型也存在着较大的学术伦理问题,需要使用者具有丰富的经验知识。例如,使用大模型生成的图片是否涉及侵权,以及使用大模型润色的论文是否逻辑准确而且符合常识,这些都需要科研人员自己来分析和判断。
姚姗姗、徐双为特邀嘉宾张虎和宋昌颁发感谢证书
思辨点三:面对大模型的高研究成本,青椒应如何调整研究模式?
算力互联(北京)科技有限公司副总经理李哲认为目前算力资源紧张,供需矛盾导致算力服务涨价严重。国内部分大模型企业存在屯算力现象,预计明年7月份左右算力服务价格会显著下降。山西医科大学第一医院神经外科主治医师王明宇认为大模型的发展可能会超越人类,但是人类在某些方面的优势还是不可替代的。例如在医疗领域,大模型还存在很多漏洞,会对用户产生致命的误导。YOCSEF太原AC委员许骁哲认为大语言模型的研究成本除了算力成本还有语料收集成本,对于青椒而言,不需要自己开发大模型,小模型也能够满足细分领域的研究需求。YOCSEF太原学术秘书翟双姣认为在科研中,不能完全依赖大模型的生成结果,因为它有可能一本正经地胡说八道。YOCSEF太原副主席张国业认为他们之前曾经尝试使用大模型来生成调研报告,发现得到的结果比较差强人意,只有不到10%可以被采纳。未来我们应该注重大模型和搜索引擎的结合,这样知识生成和数据挖掘可以有比较好的优势互补。YOCSEF太原副主席张光华认为如何测试大模型的能力边界是很好的研究方向,因为大模型会产生很多低级错误,可以通过设定边界值来测定大模型的生成能力。YOCSEF太原AC委员李毅认为大模型是青年教师职业发展上弯道超车的一个机会,因为大模型的生成结果会有很多细节问题,所以学习如何使用大模型也是一个很值得研究的方向,比如提示词工程。
姚姗姗、徐双为特邀嘉宾李哲和王明宇颁发感谢证书
YOCSEF太原主席胡欣宇作总结和致谢
最后,YOCSEF太原主席胡欣宇作总结和致谢,未来面向同时支持文字、图像、声音、视频等形态的多模态场景大模型已成为主流趋势,希望本次观点论坛的举办能够为推动山西省高校和研究机构利用好大模型提供新的思路和方案,为中国科学院和地方高校的科教融合搭建一个良好的交流平台。本次观点论坛得到了山西大学计算机与信息技术学院、高慧强学软件(海南)有限公司、上海德拓信息技术股份有限公司的赞助支持,山西广播电视台和智慧生活报也对本次观点论坛进行了宣传报道。
参会人员合影
撰稿:董云云 许骁哲 韩英
审稿:胡欣宇
审核:胡欣宇
CCF YOCSEF太原
中国计算机学会青年计算机科技论坛(CCF Young Computer Scientists & Engineers Forum,简称CCF YOCSEF)是由中国计算机学会1998年创建的系列性学术活动。CCF YOCSEF太原是2013年5月成立的分论坛,自成立以来,CCF YOCSEF太原分论坛紧密结合太原科技、学术与产业生态,围绕地方学术与科技热点问题展开研究思辨与讨论,为地方发展提供智库支持,聚集了一批自信、活力、敢于创新、有抱负、有能力的青年精英。历届主席分别为强彦(2013-2014)、秦品乐(2014-2015)、赵鹏(2015-2016)、王宪朝(2016-2017)、赵涓涓(2017-2018)、郭威(2018-2019)、宋昌(2019-2020)、裴向东(2020-2021)、董媛香(2021-2022)、魏巍(2022-2023),现任主席为胡欣宇。
联系人:主席—胡欣宇 (15525481152 微信) 学术秘书—翟双姣 (13201593207 微信)如有企业和媒体想与CCF YOCSEF太原进行接洽、交流、报道与合作,请联系我们!联系人:副主席—徐双 (18834834689 微信)