分论坛 > 上海 > 新闻动态
CCF YOCSEF上海举办大模型时代的生成式可信推荐系统之技术论道
2025-01-13 阅读量:3 小字

1

论坛背景

CCF YOCSEF上海-技术论坛

       2024年9月28日,由中国计算机学会主办,CCF YOCSEF上海学术委员会组织,深兰人工智能(上海)有限公司、上海大学支持的“大模型时代的生成式可信推荐系统之技术论道”在上海市缤谷大厦10楼会议室顺利召开。

       传统推荐系统作为解决信息过载问题的核心技术,是人工智能和大数据技术与实际应用结合最为紧密的一个研究方向,已经被广泛应用于社交网络分析、数据挖掘、信息检索等领域。大模型作为当前人工智能和大数据时代的前沿技术,由于其强大的语言理解能力、广泛的知识储备,以及良好的创新性和通用性,已经成为当下各领域与人工智能相结合的首选技术。

       本次论坛深入探讨了在当前大模型时代背景下,如何借助前沿的生成式技术来发展推荐系统,并使其逐渐成为行业的可行选择。与传统的检索召回式推荐系统相比,生成式推荐系统不仅可以推荐已有内容,还能够凭借其强大的理解和生成能力,为用户提供量身定制的内容,极大提升用户满意度。然而,生成式推荐系统也面临信任、安全、隐私、幻觉、价值观等诸多挑战。如何解决这些问题,确保生成式推荐系统的安全可信是当今学者争相研究的热点方向。

       本次“大模型时代的生成式可信推荐系统之技术论道”汇聚了当前国内在该领域颇具影响力的学者以及企业专家,分别从学术、应用、产业等多个角度深入探讨了安全可信的生成式推荐系统的可行性和技术方案。本次论坛为生成式推荐系统的发展贡献了新的智慧,确保在大模型时代下推荐系统的快速有序发展。

      本次技术论坛由CCF YOCSEF上海委员、同济大学张奇和CCF YOCSEF上海学术秘书、上海大学朱能军共同担任执行主席。论坛邀请到中国科学技术大学冯福利、华东师范大学张伟、杭州电子科技大学李宇渊、同济大学胡亮、山东大学孟雷、南京航空航天大学臧天梓作为引导和思辨嘉宾。此外,参与本次论坛的还有CCF YOCSEF上海副主席赵登吉、马骏,秘书长刘斐,学术委员王鹏伟、李晋国、郑臻哲、许盛诚。


胡亮论坛开场

       在开场环节,胡亮作为深兰人工智能首席科学家首先介绍了深兰人工智能(上海)有限公司的基本情况。深兰始终秉持“人工智能服务民生”的理念,与多所高校建立了联合实验室,在国际顶级会议上屡获荣誉。胡亮本人作为此次论坛的思辨嘉宾,他非常期待在此次论坛中与各位专家深入交流,借助深兰的平台,共同推动推荐系统产学研合作。

赵登吉开场

       紧接着,赵登吉介绍了YOCSEF的文化和使命。他指出,YOCSEF作为CCF下的一个青年科技人才交流平台,致力于促进学术界和工业界的合作与责任担当。他特别强调,YOCSEF通过一系列活动,尤其是以思辨为核心的交流,推动思想碰撞与创新。赵登吉还谈到,当前大模型的快速发展对搜索引擎和推荐系统产生了巨大影响,生成式推荐系统将成为未来技术变革的重要方向。本次论坛正是聚焦这一前沿议题,期待与会者能够通过深度交流,为未来推荐系统的发展提供宝贵的见解。


2

引导发言

CCF YOCSEF上海-技术论坛

冯福利

《生成式推荐关键技术》

中国科学技术大学

       冯福利介绍了生成式人工智能在推荐系统中的重要作用,指出生成式推荐技术能够通过个性化内容生成,满足用户的多元需求。他进一步解释了生成式推荐系统的架构和关键技术,展示了如何通过用户指令与反馈进行内容生成,优化生成提示词(Prompt),并引入自我检测机制来缓解大模型幻觉问题。通过个性化生成和信任度检测,生成式推荐系统不仅能够生成符合用户需求的内容,还能确保生成内容的可信性。他还探讨了大模型在生成推荐中的行为理解与个性化学习,指出协同信息的引入能够显著提升大模型的推荐效果,尤其是在应对新物品和复杂场景

 冯福利引导发言

张伟

《大模型生成式推荐系统初探》

华东师范大学

       张伟首先介绍了推荐系统中的大数据问题,指出推荐系统需要从数百万个物品中进行初步筛选,然后再进行精细排名,这一过程常常需要依赖深度神经网络等先进技术。他提到,生成式推荐系统的出现,为推荐系统提供了新的解决方案,不仅可以提高预测能力,还能够生成符合用户需求的个性化内容。他进一步讨论了生成模型在推荐系统中的应用,具体包括变分自编码器、生成对抗网络、扩散模型等。张伟强调,大语言模型在推荐系统中的应用前景广阔,特别是在个性化推荐、知识生成、交互推荐等方面的优势明显。通过大语言模型的特征工程和编码能力,推荐系统能够实现更精准的推荐。最后,张伟还介绍了大语言模型在推荐系统中的挑战,例如如何提升大语言模型的效率、确保生成内容的一致性等问题。他呼吁与会者在未来的研究和实践中,继续探索生成式推荐系统的潜力,为用户带来更优质的个性化推荐体验。


张伟引导发言

李宇渊

《可信推荐系统》

杭州电子科技大学

       李宇渊介绍了推荐系统的背景和现状,强调了推荐系统在数据、模型、设备等多维度上的复杂性。他还提到,随着人工智能的快速发展,隐私保护、数据安全、公平性和遗忘性成为构建可信推荐系统的核心议题。他深入探讨了数据隐私和推荐系统的遗忘性问题,提出通过推荐系统逆学习和高效逆向训练,能够更好地应对数据撤回和隐私保护的需求。针对推荐系统在大数据背景下的遗忘性,李宇渊分享了基于分组-聚合与课程学习优化的创新性框架,有效解决了数据敏感性和模型效率间的权衡问题。最后,李宇渊总结道:可信推荐系统的研究不仅需要技术层面的创新,更需要政策和法律的支持,通过跨领域合作和技术优化,可信推荐系统将在未来的智能化应用中发挥越来越重要的作用。

李宇渊引导发言

3

思辨环节

CCF YOCSEF上海-技术论坛

      在思辨环节中,思辨引导嘉宾和参会人员对三个思辨问题展开了充分的讨论。

思辨议题一:

基于推荐系统发展趋势,生成式推荐系统是必选项还是可选项?生成式推荐系统本质上是突破式创新还是增量式创新?

       冯福利首先发言并阐明自己的观点,认为生成式推荐系统是可选项且从本质上来看是增量式创新。这是由于推荐系统的整个生态所决定,以抖音平台为例,平台内容自身质量优质且每天更新量在千万次以上,其中真正进入推荐系统并呈现到用户眼前的只有极少量。因此,对于大多数用户来说,生成式推荐系统只是可选项,针对极少数特殊需求的用户而言是必选项。其次,推荐系统本质上都是一些技术的应用和改进,并没有什么突破性的创新。

       张伟从公司平台的角度认为生成式推荐是可选项。推荐系统领域是一种大数据场景,系统架构、方法设计都面向快速实时计算并实现实时交互,对时间要求高,而生成式推荐系统一方面将大模型作为核心模块挑战难度大,另一方面时间开销也不能满足实际需求。同时,他认为不可否认的是,生成式推荐具有一定的潜力,未来可能会改变现有推荐的范式。推荐系统在一定程度上是基于机器学习的发展而发展,从这个角度来说,属于增量式创新。

       李宇渊与上述两位嘉宾观点一致,认为大模型等技术只是作为一种可选技术应用到推荐系统当中,而不是针对某个特定场景的难点创新设计出来。其次,工业界应用的推荐系统与学术界所研究的存在一些差异性,如果想将生成式推荐系统应用到实际生产中仍存在困难,综上来说属于可选增量式的创新。

       胡亮则有不一样的观点,指出如今的推荐系统越来越偏向于监管角度,现有的数据量是海量的,单靠人工进行筛选效率低下且难以完成。生成式推荐系统不一定指的是内容的创新,也可以是对一些已有的内容重新生成,从中平滑过滤掉不利于国家发展和社会稳定的内容,而创作出符合国家核心价值观的内容,因此从国家和政府角度来说,生成式推荐系统是一个必选项。此外,推荐系统可以应用到更多领域,如智能机器人、医疗等,探索生成式推荐与这些领域的结合,从而形成突破式创新。

思辨嘉宾发言1

       孟雷从自身所做过的研究出发,认为生成式推荐是可选项,但是一项突破式创新。他认为推荐系统推荐的准确率和协同信息相关,如果将人与物品的协同信息输入到大模型当中,需要借助Prompt,而大模型输出的是不同于传统推荐得分的机器语言描述,其中存在很多不可控因素,并没有出现大幅度深层次的改变创新。之所以认为是突破式创新是因为大模型可以根据已有的内容挖掘出一些有意思的新内容,相信未来的几年中可以看到一些只有生成式推荐才能完成的应用场景。

       臧天梓从推荐系统发展趋势的角度认为生成式推荐是必选项并且从本质上来说是突破式创新。当前看来,生成式推荐系统是可选项仍处于科学研究阶段,在工业界应用较少,但其发展趋势非常迅速,目前基于大模型的研究已经成为行业热点,长久来看,未来可期。至于增量式创新还是突破式创新,她认为从整个机器学习领域来看本质上确实是增量式创新,只是技术的应用。但如果从推荐这个领域来看则是突破式创新,一方面不同于传统的推荐方式,即从候选池里根据一定的规则筛选出推荐的列表,生成式推荐可能生成根本不存在于候选推荐池中的新物品,从本质上提升了推荐的多样性和新颖性,克服了“信息茧房”问题;从另一方面来说,生成式推荐也在一定程度上解决了数据集的限制,对于缺失、稀疏数据,可以利用大模型进行补全和扩充。

       冯福利反问生成式推荐系统的突破式创新和增量式创新的边界在哪里,如何区分?执行主席张奇回复,他认为每个人对创新的理解不同,从方法层面、从用户角度、从技术层面、从行业应用角度,每一个人都有自己的度量和判断。

       王鹏伟(东华大学)回顾了一下推荐的发展历史,认为可选还是必选是由工业界来决定的,看其是否对工业界产生了大的颠覆、是否能够吸引用户来判断是可选项还是必选项。此外,王鹏伟还指出从技术上来看生成式推荐系统是增量式创新;而从模式上来看则属于突破式创新,完全区别于传统的推荐系统,而且不会存在冷启动问题。

       王春阳(华东师范大学)则从推荐系统的应用场景角度出发思考,认为对话推荐、多轮推荐、交互式推荐这类场景生成式推荐是必选项。

       王科(北京航空航天大学)从用户角度出发,认为用户在封闭场景中生成式推荐系统是可选项,而如果用户想跳出封闭场景,即在开放场景中则属于必选项。总结来说,生成式推荐系统是必选项还是可选项取决于用户的需求

       执行主席朱能军从学术研究者角度抛出了一个变种问题:作为朋友,是建议研究传统推荐系统还是拥抱生成式推荐系统?对此,冯福利认为如果在大模型方面有一定的资源和实际经验,则建议走大模型路线,可以做出很精彩的研究。胡亮、张伟等嘉宾同样认为如果资源、数据集、算力足够的话可以尝试研究生成式推荐系统,不然更建议在传统推荐系统的可解释性、模型压缩等等方面进行深入研究。

      执行主席张奇对该思辨议题做出总结,指出无论是必选项还是可选项、突破式创新还是增量式创新,每位专家今天从不同的角度分享不一样的想法,对于研究者而言,也期待能够将生成式推荐系统做成必选项和突破式创新技术

思辨议题二:

生成式推荐系统与传统推荐系统的共性与差异、各自关注点和应用场景?生成式推荐系统未来是否会给传统推荐系统的应用带来巨大冲击?

       冯福利提出了一个公式用于推荐系统决策时评估技术路线的收益和成本,收益可以从交互量和客单价两个角度出发,而成本包括计算开销、用户信任度、监管风险等,通过计算收益和成本可以在不同场景下做出决策,选择传统推荐系统还是生成式推荐系统。相比于传统的推荐,生成式推荐在内容相关的短视频平台上更具优势。

       胡亮认为生成式推荐和传统推荐系统的共性和差异来自于人,可以设计得完全不同,比如生成式推荐可以带来更多可能性,创造出一种新的推荐范式,传统的推荐是对历史数据的推荐,生成式推荐可以设计为面向未来的推荐,可以动态生成新的产品或路线,这在传统推荐中不可能做到。此外,张伟总结指出,传统推荐系统是基于历史数据针对静态的当前需求进行推荐,而生成式推荐更适合动态的、面向未来的一种推荐。

       张伟指出在共性方面,无论是传统推荐还是生成式推荐,都侧重于学习用户和物品的表,以便提前计算和存储,对于一些特殊的应用场景,比如对话式推荐,生成式推荐会给传统推荐系统带来巨大冲击,因为大模型在从文本中理解用户需求的能力是传统推荐所不能比拟的。

       孟雷认为生成式推荐并非传统推荐模型的升级,他认为两者不同之处在于传统推荐偏向于对用户和物品建模,建立一个打分的模型;而生成式推荐更偏向于去设计Prompt。同时他认为生成式推荐在短期内不会对传统推荐产生冲击,企业现在都有一个成熟的完整模式,短期内不会做出改变。李宇渊同样提出生成式推荐系统不会给传统的推荐系统带来冲击,反而认为生成式的推荐系统会融入现在传统推荐系统框架。他认为不管基于什么技术手段都没有颠覆传统的推荐模式,仍然处于传统推荐范式之内

思辨嘉宾发言2

       臧天梓提出两者之间在推荐流程、推荐范式、新颖性以及设备资源等方面存在差异性,既有主观因素,也存在客观因素。两者共性在于出发点都是以人为本的服务理念,推荐系统的最终目的都是服务于人,提高用户的满意度。此外,她认为生成式推荐和传统推荐并不是对立或者此消彼长的关系,而是互相促进、齐头并进的关系。因此,生成式推荐会对传统的推荐系统应用带来一定程度上的冲击,但并不会完全取代,因为它们各有优势和应用场景。

       李斌(循麓智能科技&上海交通大学)从商业化角度和产业界应用角度考虑,以汽车智能座舱为例,指出生成式推荐在效果上表现不佳,而传统的推荐因为更能捕捉用户的明确需求更受欢迎。

       也有嘉宾认为生成式推荐系统会给传统推荐系统带来巨大冲击,他们指出未来生成式推荐系统可以发展为以人为中心的全领域统一推荐,比如在手机厂商领域有不同的推荐系统、电商领域也有自己的推荐系统,传统的数据驱动的方式不能很好的理解用户在不同领域的需求,那么在未来,生成式推荐系统就可能对不同领域进行统一,理解用户在不同场景下的需求,这将掀起新的革命。张伟对此发展前景持有不同意见,他认为在未来,不太可能会出现一种生成式推荐系统把所有领域的应用场景都解决,一方面,由于商业利益关系,商业数据很难实现共享流通;另一方面,不同应用领域之间存在差异,不能互相深入内部得到有价值信息。

思辨议题三:

生成式推荐系统应用于为用户生成定制化推荐内容时,需要克服哪些实际困难与挑战,是否利大于弊?

       在很多场景下,不同年龄阶段、不同性格的用户对内容风格、安全性等方面的要求完全不同,因此就要考虑在为用户生成定制推荐内容时,存在哪些风险和挑战?个性化生成是否利大于弊?

       臧天梓首先针对这个问题发言,她围绕上述提到的“信息茧房”问题,提出“信息茧房”就如同一个舒适圈,让用户既享受又疲惫,而生成式推荐系统可以满足用户的诉求,帮助用户跳出舒适圈,开阔眼界。由于生成式推荐系统生成的多样性,这里便存在两个问题:一是监管难题,如生成的内容是否合法合规、是否适合特定人群、安全性如何保证,因此,对生成内容的监督和检测变成了一个难题;二是大模型在认知和生成内容上可能存在文化偏见和性别偏见,这些可能与用户的本意相反,激化用户与大模型的矛盾。

        李宇渊针对生成式推荐系统提出了四点困难和挑战,首先就是最为直接和本质的成本和收益问题,不管是学术界还是工业界,收益能大于成本则优秀,反之则淘汰,一个技术再优秀,不能为企业带来收益也不会采用,这也符合事物的发展规律,刚开始研究的为从零到一的工作,之后在此基础上逐渐完善,那如何平衡成本和收益则成为了关键。其次是时效性的难题,在具体的推荐场景中,推荐反应时间要求在毫秒级别,而目前的大模型停留在秒级别,如何克服这个差距仍然是很大的挑战。接着是持续性学习的问题,目前大模型采用的是预训练,这一步骤完成之后知识已经固化,而在现实中,知识是不断更新和产生的,那如何让模型能够持续性的更新也成为一个问题。最后就是推荐可信性问题,如何保证用户对推荐结果的信任是一个难题。

       孟雷从技术的角度,以具体的食材和用户需求场景为例,提出当前利用大模型来做出推荐所面临的实际困难是大模型的输入和输出应该如何设计,才能满足不同类型用户的不同需求。冯福利梳理了上述已经提及的成本问题、监管难题,提出对于从业人员而言,考虑生成的质量控制和生成时机选择成为一个难题,而对于研究人员,详细阐述了无论是离线实验还是在线A/B测试都难以验证定制化推荐内容的好坏和价值。

       许盛诚从应用的角度认为当前所面临的主要困难是数据问题,生成式推荐系统高度依赖于高质量的数据进行训练,而实际中的数据往往存在噪声和缺失,严重影响推荐的准确度和个性化。如何保证数据的质量和多样性,解决数据孤岛和访问权限问题成为了一个挑战。此外,他还提到,人工智能具有黑盒效应和难以解释性,这就存在伦理问题和法律风险,这导致企业不得不去考虑相应的成本问题。

       执行主席张奇对该议题进行总结和补充,认为生成式推荐系统在引导和修正媒体内容方面的潜力,可以通过国家层面的认知生成相应的内容来引导用户形成正确的价值观和意识形态。关于定制化生成内容利大还是弊大的问题,他认为从不同的角度、不同层面上有待探索和发现。

4

论坛总结

CCF YOCSEF上海-技术论坛

       在本次论坛中,各位引导发言和思辨嘉宾围绕大模型时代下生成式推荐系统和传统推荐系统的未来发展上提出了各自的观点与思路,并围绕三个极具讨论的问题开展了深入思辨。

       在最后,执行主席朱能军对本次论坛进行了总结,他将本次论坛的主要观点分成了保守派、中间派和开放派三类,其中保守派坚守传统推荐,中间派适当地将传统推荐系统与大模型进行结合,开放派则积极拥抱生成式推荐系统。每一派都有自己的技术和应用路线、都有自己存在的价值和护城河。这正是大模型对传统推荐领域冲击最好的诠释。

       本次论坛也通过CCF YOCSEF上海视频号进行了直播,并获得了线上观众上千次的积极响应和互动。


参会合影

承担社会责任,提升成员能力

关注我们

十月更多活动筹备中……

供稿:张奇、朱能军

审核:赵登吉、杨慧烨

排版发布:郭畅


热门动态
2018-07-31
CCF YOCSEF 上海分论坛于2018年7月23日晚在上海交通大学徐汇校区...
2018-07-14
人工智能(AI)在理论、技术和应用等方面得到学术界、产业界、教...
2018-07-11
CCF YOCSEF上海分论坛于2018年7月6日晚上在上海市黄浦区洛克外滩...
CCF聚焦