随着大模型的兴起,人工智能在自然语言处理、计算机视觉和机器人控制等诸多领域取得了重大突破。大模型具有强大的表征能力和任务泛化能力,能够处理复杂的任务和大规模数据,极大地推动了人工智能的发展。然而,大模型也引发了一些担忧。一些学者认为,大模型会导致人工智能的进步停滞,海量的数据和计算资源需求可能导致技术的探索变得愈发昂贵和不可持续。此外,也有学者担忧大模型的出现可能催生出“快餐式”研究和技术泡沫,使人们更加注重结果和表现,而不是深入的理解和创新。鉴于此,我们需要深入思考大模型对人工智能发展的影响,探索更加有效和可持续的技术创新方法,确保学术研究和产业应用能够真正服务于社会发展。为此,中国计算机学会青年计算机科技论坛(CCF YOCSEF)广州分论坛于2023年9月16日举办了“大模型浪潮下的人工智能演进:潮起于此,还是潮落于斯?”观点论坛。此次论坛围绕“大模型的发展现状和未来、大模型是否制约人工智能的技术创新、大模型与AI伦理治理的协同发展、大模型与学术开放、公平以及大模型与就业”等议题,共同探讨大模型浪潮下的人工智能演进之路。
此次论坛由YOCSEF广州副主席李冠彬(中山大学)和YOCSEF广州主席龙锦益(暨南大学)共同担任执行主席,中山大学计算机学院承办,广州唐邦信息科技有限公司提供赞助支持。
YOCSEF总部副主席周彬,YOCSEF昆明副主席师智良,YOCSEF广州往届主席谭台哲(广东工业大学)、郝天永(华南师范大学)、黄栋(华南农业大学),YOCSEF广州优秀AC委员刘雷(广东科技报)、YOCSEF广州现任主席龙锦益(暨南大学),YOCSEF广州现任副主席李冠彬(中山大学)、刘同来(仲恺农业工程学院),YOCSEF广州往届与现任AC委员谢光强(广东工业大学)、胡建芳(中山大学)、沈颖(中山大学)、姚恩义(华南理工大学)、刘伟莉(广东技术师范大学)、姜思羽(广东外语外贸大学)、蓝连涛(华南农业大学)、朱鉴(广东工业大学 )、 傅城州(广东药科大学)、曾衍瀚(广州大学)、张天豫(广汽研究院)、黄培涛(唐邦信息科技)、 吴国凯(荔峰科技),以及来自全国多所高校及企事业单位共100多人线下或线上参加了此次论坛。
图1 论坛背景
在论坛开幕环节,首先由中山大学计算机学院领导致辞。对中山大学计算机学院的发展做了简要介绍,对线下与线上的参会人士表示了欢迎,肯定了此次论坛选题的思辨价值,对大模型面临的难点与现状进行了阐述,期待此次论坛能激发更多针对大模型技术的讨论及思考,并预祝此次论坛取得圆满成功。
图2 中山大学计算机学院领导致辞
此次论坛邀请了华南理工大学谭明奎教授、华南师范大学郝天永教授、上海交通大学谢伟迪副教授作为引导发言嘉宾,华南理工大学黄翰教授、南方科技大学郑锋副教授、中山大学陈亮副教授、复旦大学戈维峰青年副研究员作为思辨嘉宾。
谭明奎教授以“大模型及部署机遇、挑战与进展”为题,介绍了大模型发展的概况和特点,分析大模型应用与部署的机遇和挑战,并介绍了依托大圣视觉大模型,鹏城国家实验室在智能交通等下游场景的部署应用探索。郝天永教授以“大模型驱动的人工智能发展”为题,从ChatGPT入手,梳理了大模型的发展历程,介绍了大模型的研究前沿,并分享了大模型带来的人工智能研究新问题和新机遇。谢伟迪副教授以“知识驱动的多模态表征学习”为题,总结了当前大模型研究范式的转变,包括训练数据从单一到多元、模型架构从多元到统一、监督信号从人工到自学的三个特点,提出了理想中的通用视觉模型构想,即视觉场景应当具备人类感知水平,介绍了如何利用基础模型中的知识,并将现有计算机视觉系统的能力扩展到开放词汇场景方面的一些工作。
图3 华南理工大学谭明奎教授作引导报告
图4 华南师范大学郝天永教授作引导报告
图5 上海交通大学谢伟迪副教授作引导报告
在引导报告之后,论坛进入思辨环节。会场嘉宾围绕“大模型驱动下的人工智能各大子领域的发展现状如何,未来是统一大模型还是行业大模型?”、“‘大力出奇迹’的大模型范式是否正在逐渐制约人工智能的技术创新?”、“大模型千锤百炼与AI伦理治理会携手并进还是互相制约?”、“大模型的发展是推动还是抑制学术研究的开放性与公平性?是加剧人才短缺抑或导向失业大潮?”四个议题展开了深入思辨。
思辨议题一:大模型驱动下的人工智能各大子领域的发展现状如何,未来是统一大模型还是行业大模型?
在大模型的浪潮下,AI研究的思路完全发生了变化,大模型的出现对当前非海量数据的科研范式产生了冲击。过去的AI研究通常以单一子任务为导向,而大模型出现后,目标更多地转向研究任务之间的关系,并找到其中的共性。有与会嘉宾认为当前大语言模型的发展主要来自于模型在语义能力上的飞速提升,语言模型可以充当认知智能的核心,可以通过将其他模态往语言模态上对齐来优化其他模态上大模型的表现。但同时也有与会嘉宾提出,不认为短期内有能对齐ChatGPT表现的视觉大模型的出现,视觉数据的大更多是信息冗余量大。对齐图文模态至多只能得到与语言大模型水平相当的视觉大模型,但还不是理想的视觉大模型,最终还是应该由视觉和语言大模型互相蒸馏信息,实现联合学习。有嘉宾提出当前最大的问题是大模型意味着大投入,其底层是烧钱的逻辑,要考虑盈利的问题,且许多行业的数据由于涉及保密等原因也无法用于训练统一大模型,因此未来一段时间内不太可能出现统一大模型。但同时也相信统一的大模型一定会出现,只是需要一个过程,需要各个行业模型的加持。
思辨议题二:“大力出奇迹”的大模型范式是否正在逐渐制约人工智能的技术创新?
大模型范式是数据驱动的范式,它在处理那些知识不能直接呈现但可以通过多次学习来掌握的场景时表现出色。大模型现在确实在很多任务中表现很好,值得被尊重,但也确实会抑制一些其他领域的发展,小模型的技术突破容易被掩盖已经是事实。但也有与会嘉宾提出,小模型被压制的现象都是短期的人为的,做小模型研究的需要把定位弄清,找到自己的生存空间。大模型的出现创造出很多新的方向,可以去思考如何把大模型作为工具和知识去使用。有嘉宾举例指出大模型在医学、飞机故障诊断等一些需要严格规章且依赖手册的特定领域仍然无法得到应用。当前,小模型的技术突破仍然十分重要,很多领域依然依赖小模型,需要找到合适的切入点。有嘉宾呼吁小模型研究被压制以及模型同质化问题应该得到期刊、会议审稿人与组委会的关注和思考。也有与会嘉宾提到,大模型对论文的发表可能短时间内产生了一些影响,但是在技术层面却是一个重大的变革。此外,大模型的出现抑制了从前一些盲目刷点但创新有限的工作的进行,一定程度上反而能够激发出更多创新的工作,从论文阅读者的角度而言是一种可喜的发展态势。
思辨议题三:大模型千锤百炼与AI伦理治理会携手并进还是互相制约?
与会嘉宾指出,大模型与AI伦理治理肯定应当是携手并进的。在没有大模型的时候,伦理治理问题本身就长期存在,但是同时也存在着完备的规则体系来对各方各面进行约束。而当前在大模型的浪潮之下,相应配套的法律法规等技术内容的滞后,导致了大模型与AI伦理治理尚未能够协同发展。GPT的出现对人类某些心理的冲击很大,让人觉得自己的有些能力已经不被需要,觉得许多职业要被取代。此外,人性的本能会驱动人类对大模型的一些不可取的使用方式,比如一些学生会用大模型交课程报告、利用大模型进行可能涉及隐私内容的创作等,种种类似行为都会带来AI伦理治理方面的问题。与此同时,比起伦理问题更严重的是安全问题,有些人为了交差,会上传单位的信息与数据,从而利用大模型完成报告文件的撰写,在这样的过程中可能会涉及严重的信息与隐私泄露。此外,大模型的训练需要大量的数据,其数据通常从网络上爬到,数据隐私由于模型的原因被进一步暴露,而且其中难免甚至必然包含许多没有得到版权的数据。由于大模型因为encoder-decoder机制的本质,数据只要参与了大模型的训练,就存在泄露的隐患。更有甚者,一些非法分子也训练并使用大模型进行不法活动。凡此种种情况,都需要得到社会各界的深入关注和思考,大模型带来的AI伦理问题,需要人的驱动,专业的驱动,法律法条的驱动,必须从多方面共同努力,才能真正实现大模型与AI伦理治理的携手并进。
思辨议题四:大模型的发展是推动还是抑制学术研究的开放性与公平性?是加剧人才短缺抑或导向失业大潮?
有与会嘉宾提出,做研究和占有研究资源是两个概念,占有资源并不一定就能做好研究,做出好的研究也并不一定是因为占有大量资源。大模型作为新潮的内容,必然会吸引资源,公平性不是由于大模型引起的,而是由于当前的科研体制导致的。也有嘉宾认为,有资源的情况下做一个大模型并不难,难的是后续不断的维护。要让一个公司提供长期的技术支持,前提能找到一个清晰的商业模式,但是这样的商业模式当前似乎仍尚未出现。此外,研究的公平性很难评估,学术公平性和开放性的问题本来就存在,核心的担忧在于大模型的出现会不会进一步加剧该问题。若把科学研究区分为资源密集型与智力密集型,大模型的出现只是使得计算机研究从智力密集型向资源密集型产生了一定程度上的转向,但是计算机之外的一些学科的科研本身就是资源密集型的,这不过是模式上的一点转变。短期内肯定会有一些传统岗位面临失业,这不仅仅是大模型,而是所有人工智能技术发展都会带来的影响,但是同时这也会带来新的机会,新的研究方向可以产生,新的就业岗位也可以产生。大模型一定程度上会提升评判优秀人才的门槛,需要更有创意和前瞻性的人才,在大模型的大潮下必将衍生出许多依托于大模型的新的就业岗位。此外,国家正在逐步构建并完善配套机制并出台相关政策,以支持大模型研究的深入推进,并加强对相关人才的培养与激励。
图6 嘉宾热议
此次论坛邀请相关领域知名专家学者,围绕“大模型浪潮下的人工智能演进:潮起于此,还是潮落于斯?”,对于相关热点问题进行了多方面的探讨。YOCSEF总部副主席周彬对论坛进行了总结并表示肯定,一方面,本次论坛总结并分析了大模型相关研究的发展现状,探讨了大模型浪潮下人工智能未来的研究方向;另一方面,此次论坛也着眼于大模型在社会层面的影响,对大模型相关的伦理、社会问题进行了深入思辨。此次论坛历时近四小时,最后在线下会场与线上云会场一片轻松而热烈的氛围中圆满结束。
图7 与会嘉宾合影留念