——CCF YOCSEF天津于2023年9月23日在天津举办了题为“民航大模型建设之路如何知止而有得,进而有为 ?”技术论坛
世界正在经历新一轮科技革命和产业变革,以新一代信息技术融合应用为主要特征的智慧民航建设正全方位重塑民航业的形态、模式和格局,必将引领民航业的未来发展方向。大模型已经成为新一代信息技术的主要发展方向之一,成为各国竞争的焦点。在大模型浪潮下,如何利用大模型赋能智慧民航建设成为摆在行业发展前进路上的重要问题。通过本论坛的举办,来自政府、科研院所、高校与民航领域企业的人士共聚一堂,与会专家深入探讨民航大模型建设的关键技术路径等重要议题,共同探讨民航领域的前沿技术与发展方向,以期为民航大模型建设提供有益的发展建议。
经过为期一天的深入探讨和热烈思辨,本次论坛观点总结如下:
(1)围绕未来民航大模型的主要需求场景与发展方向的讨论,经集体讨论发现面向民航行业,大模型的能力边界尚不清晰,主要因素是由于民航领域具有场景多样性、系统复杂性以及对安全性有极高要求的特点。民航领域的场景具有复杂多样性特点,不同的场景可能需要不同模型的支持,只进行了极少领域的探索;在应用方面需要从大模型的数据、计算、场景等三要素与民航领域的特殊要求融合,才能评估大模型技术的能力边界;民航领域对安全性的要求很高,考虑到民航领域的特殊性,安全性和可信度是评价民航业大模型能力边界的前提。也有专家认为未来可能没有大模型解决不了的民航业问题,主要通过投入产出比来决定是否需要大模型。
(2)围绕民航大模型技术路线的讨论,主要针对如何定义民航行业需求驱动下的大模型的问题展开,需要明确民航行业的大模型的发展路线是“分而治之”和“统一基座”,有专家认为由于大模型的构建成本较高,“分而治之”可能是现阶段的路线。“统一基座”可能是未来趋势。也有专家认为两者并不矛盾,从计算机技术的角度希望能“统一基座”,从落地角度要“分而治之”,甚至可以在分而治之之后增加一层统一决策层,形成总分总的架构。
(3)在关于民航大模型落地的关键挑战与应对措施方面,主要聚焦于算力、技术、数据等方面展开讨论。算力是民航大模型落地的一个大问题,需要大量的计算资源,这通常需要昂贵的硬件和基础设施投资,同时需要通过信创与大模型双轮驱动智慧民航发展;当前技术开发可能是制约民航大模型的主要问题,主要是场景需求与大模型技术人员存在“代沟”;众多专家认为数据保密、数据不共享也是民航大模型的最大挑战之一。
此次论坛由中国民航大学、浪潮天津协办。活动由CCF YOCSEF天津AC学术秘书刘才华(中国民航大学)、CCF YOCSEF天津AC委员王琦(浪潮天津)担任现场活动执行主席。民航领域及人工智能领域科研一线学者、产业专家汇聚一堂,针对民航大模型建设之路进行深入思辨讨论,为我国在该领域的发展尤其是应用落地建言献策。
针对论坛主题邀请了来自政府主管单位、高校、企业界的三十余位一线专家参加论坛引导及思辨,他们分别来自中航信移动科技有限公司、上海交通大学、中国科学院自动化研究所、天津中科闻歌科技有限公司、民航局信息中心、北京首都国际机场股份有限公司、北京大兴国际机场、中国国际航空股份有限公司、中国民航大学、慧言科技(天津)有限公司、国航客服中心、国家超级计算天津中心、摩尔线程、浪潮集团、天津科技大学、天津工业大学等单位。
中航信移动科技有限公司首席技术官唐红武的引导发言主题为“智看民航”。首先讲述了民航大模型的使用需求,并举例了民航智能问答对大模型的需求,然后指出大模型的需求,一个是智能客服,另外一个是新的人机交互模式。之后,他深入讨论了民航大模型的技术路线。他着重介绍了民航领域数据集的增量训练过程,包括数据清洗与采样、阶梯式训练流程以及半自动构造指令微调数据的方法。此外,他还强调了多模态知识图谱与多模态模型的结合,以增强基座模型对民航专有数据的理解和决策能力。唐红武还讨论了模型的分布式训练和模型优化。最后,唐红武分享了民航大模型的现有应用场景,涵盖了智能交互和智能视觉场景。他总结指出,未来大模型将能够更好地理解用户的意图,提供更多样化的信息和服务,从而提高行业的准确性和用户体验。
上海交通大学长聘副教授、国家优青张伟楠的引导发言主题为“决策大模型及在民航的应用潜力”。首先指出了ChatGPT的创新点,即具有连续多轮对话的能力,并且采用了强化学习和基于人类反馈的系统。这使得它能够更好地理解用户意图、适应用户使用习惯,并在预测、生成和决策任务中提供连贯的对话体验。之后,他介绍了面向智能决策的基础模型,分为以大语言模型为中心和以强化学习大模型为核心,进一步介绍了现有的强化学习大模型、策略大模型(如Gato和DB1)、以及多智能体大模型(如MADT和MAT)。最后,张伟楠总结了决策智能和决策式大模型在面临开放变化环境情况下的泛化问题,介绍了团队在决策大模型的工作,对标DeepMind发布的Gato,发布了世界范围内领先的决策大模型DB1,在机器人场景、游戏场景和调度规划场景下也取得了阶段性进展。
中国科学院自动化研究所副研究员、紫东太初大模型技术骨干朱贵波的引导发言主题为“多模态大模型驱动领域变革”。首先介绍了紫东太初大模型从百亿模型到千亿模型的历程,他提到了“紫东太初”1.0和2.0版本,其中1.0版本是首个千亿参数的三模态大模型,而2.0版本则致力于提取全模态多任务统一生成式学习框架,实现多任务全模态融合能力。之后,朱贵波介绍了微调开发工具链的重要性,这些工具链可以快速基于平台内置的基础大模型定制出专属的行业模型,例如教育大模型和医疗大模型。用户只需准备少量行业数据并经过简单步骤,即可在平台上训练和部署他们的专属模型。最后,朱贵波分享了一些典型的应用案例,强调了多模态大模型的广泛应用潜力,例如在民航领域的数字乘务员和航空数字员工,以及飞机方案设计和仿真平台中的应用。
三位引导嘉宾发言结束后,论坛进入激烈的思辨讨论环节,与会嘉宾围绕议题“面向民航行业,大模型的能力边界在哪里?”进行深入思辨,思辨讨论的观点总结如下:
观点一:民航领域的场景多种多样,不同的场景需要不同模型的支持。可以将场景根据是否是民航专有的需求进行分类,对于非民航专有的需求,如气象预测、人员监控监测、应急处理、视频识别等,很多行业都在研究,之后可以相互交流借鉴;对于民航专有的需求,如空管、资源调度等,需要民航行业的人才再开发。
观点二:大模型的边界讨论首先需要探讨需不需要大模型,一些行业应用小模型就可以解决的场景,大模型虽然可以解决,但是不需要大模型。一些行业巨复杂问题,则可能需要大模型的技术,但是探讨这些大模型技术的能力边界需要综合考量该场景下的算力、成本、数据的可行性。
观点三:民航领域对安全性的要求很高,考虑到民航领域的特殊性,安全性和可信度是民航大模型落地的前提条件。在开发和应用大模型时,必须投入大量的资源来确保其在各种情况下都能提供高度安全和可信的决策支持。这包括数据的质量和标准、计算资源的可用性和效率、以及对模型的可解释性和合规性的考虑。只有在这些前提条件下,大模型才能成功地为民航领域提供有益的应用,而不会危及飞行安全和运营可靠性,只有在这些特性具备的条件下,才能探索清晰大模型在民航业的边界。
上午的引导发言和思辨结束后,下午首先由天津中科闻歌科技有限公司产研中心总监王林进行引导发言。
王林的引导发言主题为“大语言模型在垂直领域的应用探索”。王林首先指出了大语言模型在垂直领域的应用面临的问题,包括算力需求、数据质量以及安全可用性问题。其次,王林指出可以通过指令微调将通用大模型应用于领域任务,可以通过量化微调和全参数微调等方法,并介绍了具体的应用场景,如复杂场景信息抽取、多语言内容理解等。最后,王林列举了大语言模型在垂直领域的应用,包括内容生成、文档分析、信息抽取、写作风格修改、民航领域智能问答等。
之后,论坛进入激烈的思辨讨论环节,针对“如何定义民航行业需求驱动下的大模型?”,思辨讨论的观点如下:
观点一:需求驱动下的民航行业大模型需要具有相对宽泛的通识能力,同时还需要具有民航领域特殊知识的处理能力。大模型的“大”是指数据量和参数大,小模型的“小”不是算力,而是聚焦专业知识。
观点二:现阶段民航行业的大模型的现象是“分而治之”和“统一基座”都有的,由于大模型的构建成本较高,“分而治之”会更多一点。“统一基座”可能是未来趋势。
观点三:“分而治之”和“统一基座”并不矛盾,从计算机技术的角度希望能“统一基座”,从落地角度要“分而治之”。“统一基座”构建通识知识和沟通能力,而在知识层面“分而治之”,可以根据不同的数据参数构建特定场景的模型。也可以说“分而治之”是应用,“统一基座”是通识。
观点四:从安全的角度来看,一个有效的安全基座在民航领域至关重要。这个基座可以从三个角度考虑:首先,包括软硬件、运行环境和人员,以确保系统的整体安全性。其次,数据的安全性。最后,是模型本身的安全性。因此,应该把模型训练到小而精,应用到民航领域,这也就是“分而治之”,再结合大模型底座,也就是“统一基座”,最后把大小模型协同,充分发挥它们的优势。
关于民航大模型落地的关键挑战与应对措施,思辨讨论的观点总结如下:
观点一:算力是民航大模型落地的一个大问题,在构建和训练大规模机器学习模型时,需要大量的计算资源,这通常需要昂贵的硬件和基础设施投资。这不管对于企业还是学校来说都可能是一个巨大的经济负担。此外,算力也存在供应链风险问题,对于民航领域这样对数据安全和算法可控性有高要求的领域来说,需要实现信创与大模型的双轮驱动。
观点二:大模型落地的几个关键点包括:首先,在场景需求和大模型技术人员沟通时可能存在“代沟”的问题;其次是数据,包括数据的质量、多样性和标注,之后是需要充分利用现有算力;最后是安全问题,包括硬件安全、数据安全和模型安全,这还可能涉及到政策问题。
观点三:民航大模型最大的挑战还是行业壁垒问题,也就是数据保密、数据不共享的问题,虽然这是出于合法合规、商业竞争和隐私保护的考虑。然而,这种数据保密的趋势可能导致信息孤岛,不同企业之间难以共享关键信息,从而妨碍了行业内部的协作和信息共享。
论坛最后,CCF YOCSEF天津AC主席张鹏对论坛活动进行了总结。他对执行主席刘才华和王琦为本次大会所做的工作表示肯定,对所有参加和关注论坛活动的嘉宾表示感谢。同时,他指出此次活动是CCF YOCSEF 天津的一个崭新起点,希望本次论坛形成的观点和思维的碰撞能够带来新的启发,产生社会价值。他还衷心希望与会嘉宾今后能够持续关注并积极参与CCF YOCSEF 天津的活动。