中国计算机学会青年计算机科技论坛
CCF Young Computer Scientists&Engineers Forum
CCF YOCSEF合肥
推荐系统作为人们从海量信息中获取相关信息的重要方式,已经吸引了学术界和工业界的广泛研究和关注。然而,推荐系统尚未建立自成一体的科学技术体系,更多被认为是机器学习的应用,企业界可能也更多地从工程落地出发进行研究。那么,推荐系统的核心科学问题和技术问题是什么?推荐研究的边界或特色是什么?推荐的未来如何发展?
4月24日,CCF YOCSEF合肥成功举办“推荐系统的未来,路在何方”的线上闭门论坛。
图1 技术论坛简介
本次论坛由CCF YOCSEF合肥现任主席、中国科学技术大学何向南,CCF YOCSEF合肥AC委员、中国科学技术大学连德富担任执行主席,由CCF YOCSEF合肥AC委员、安徽大学刘慧婷担任线上主席。中国科学技术大学陈恩红教授、清华大学张敏副教授、微软亚洲研究院谢幸研究员、南洋理工大学孙爱欣副教授、YOCSEF总部AC、中国人民大学赵鑫副教授以及众多来自高校及企业的从事推荐系统的研究人员,通过线上的形式参与了本次论坛。
论坛伊始,YOCSEF合肥首任主席陈恩红作为开场嘉宾,欢迎各位嘉宾参加会议,他回顾了推荐系统领域近10年来蓬勃的发展历程。推荐系统已经在各种应用场景中发挥出重要作用,然而推荐系统的基础问题、前沿问题以及未来需要攻关突破的点,依旧值得深入探讨。同时,他也强调推荐系统的研究应该与国家倡导的“四个面向”紧密结合。
图2 YOCSEF合肥首任主席陈恩红教授开场发言
其后,YOCSEF合肥现任主席何向南介绍了对本次论坛的背景和初衷。近年来,推荐系统吸引了来自学术界和工业界的广泛研究,在信息检索、数据挖掘、机器学习等AI重要领域的顶级会议中发表了数千篇论文。但是,推荐系统尚未建立自成一体的科学技术体系。作为推荐领域的学者,在申请国家基金项目时往往会有点底气不足,觉得推荐系统是一个面向民生的商业性问题,难以面向国家的重大需求,时常会产生“作为面向商业场景的推荐系统,国家战略性如何体现,科学问题是什么”的困惑。本次论坛将针对以上问题展开思辨,深入探讨推荐系统的科学问题是什么,这些问题是否是推荐系统这个领域独有的?当前工业界的推荐系统有哪些痛点,学术界发表的论文是否真的能够解决这些问题?推荐系统的未来发展方向是哪些?
图3 YOCSEF合肥现任主席何向南介绍
嘉宾分享 观点鲜明
清华大学张敏副教授围绕“推荐系统还需要做吗?推荐系统到底是什么”的问题做引导发言。她表示推荐系统的问题是有规律性的、解决方法是相对稳定的、评价指标是可靠可重现的,因此推荐系统是一个科学问题。她强调,推荐系统不仅是自然科学问题,也是社会科学问题。这是因为推荐系统会涉及人和信息的交互,需要引入社会科学的方法,考虑社会环境对用户的影响。她也给出了4个推荐系统中值得研究的问题,包括用户需求的理解、推荐可信赖性、推荐场景的扩展、用户隐私等问题。
图3 清华大学张敏副教授做引导发言
微软亚洲研究院谢幸研究员做了《信息过载与信息偏食》的引导发言。他表示,推荐的初心是为了解决信息过载问题,减少用户处理信息的时间;后来推荐系统逐渐走向商业化,以解决信息过载为名,行诱导用户沉迷之实,延长用户访问信息的时间。推荐系统的个性化服务带来了信息偏食问题。信息偏食不仅影响了个人,还影响了社会,带来了社会的分裂。因此,他强调推荐系统需要跨学科合作的研究,需要理解信息过载和信息偏差都对人和社会带来什么影响。设立更加科学的优化目标,制定可实施的算法模型监管框架。
图4 微软亚洲研究院谢幸研究员做引导发言
南洋理工大学孙爱欣副教授做了《Right Item to Right User at Right Time》的引导发言。他表示学术界和工业界的推荐系统的研究存在较大的鸿沟。学术界的研究工作,往往会对问题进行简化,比如典型的缺乏对时间的建模,导致评估不准确,与工业界的真实应用场景存在较大的差异。工业界对学术界的推荐模型进行测试之后发现与预期差异较大,这就导致信任分歧的产生。因此,他强调未来推荐系统的研究上应该要更加关注于合理的评测标准。
图5 南洋理工大学孙爱欣副教授做引导发言
中国人民大学赵鑫副教授也针对推荐系统的定位问题做了引导发言。他拿比较成熟的信息检索领域来进行类比,信息检索领域有自己的核心概念和基本原则,还有标准化的测试数据集,各种任务场景设置也比较接近。他认为推荐系统领域也应该要凝练出自己的核心概念和基本原则,组织标准化的测试数据集,并且要创建强连接的研究社区。同时,他也指出了学术界和工业级应用之间对接的关键,即学术界的研究中应该要考虑以下三个方面:1)当前工业界推荐系统的工作范式(即召回加重排);2)工业级应用中用户和物品往往有丰富的特征;3)工业级应用中往往有时空复杂度的限制。
图6 中国人民大学赵鑫副教授做引导发言
思辨环节 讨论激烈
接下来论坛进入思辨环节。嘉宾们在线上云会场展开激烈讨论。嘉宾围绕“推荐是科学问题,还是技术问题?”“如何看待学术界和工业界的鸿沟?”“下一代推荐系统会怎样?”等三个议题展开了思辨。
议题一:推荐是科学问题,还是技术问题?
其中,中国人民大学的窦志成教授认为推荐系统是工程科学,目标是为了应用。它不同于普通的自然科学,自然科学是认知世界,而工程科学是改造世界。推荐系统旨在解决用户从海量信息中获取想要的信息。
中国科学技术大学冯福利教授则认为推荐系统的科学问题是其他领域(心理、社会)在信息科学里的延伸。推荐系统本身只是一个技术问题,旨在如何更服务好用户、社会和国家。他拿蒸汽机来作类比,认为二者背后都涉及科学问题内涵,即推荐背后是心理学、社会学,蒸汽机背后是物理学,推荐系统的设计类似于蒸汽机的设计,是一个技术问题,即如何更好的利用这些科学规律。
北京邮电大学的白婷助理教授认为推荐系统是一个复杂性的科学问题。推荐领域其实它的应用范围很广,从使用场景看,它其实是一个应用问题,比如优化一些CTR或者各种场景平台下的指标;如果我们从技术的角度看,它又是一个科学的问题,比如如何更好的理解用户的偏好。从推荐系统的影响来看,它又是一个社会学的问题,比如它是否会产生信息茧房,导致社会分裂等。综上,推荐系统其实是一个非常复杂性的问题。
清华大学张敏副教授认为推荐系统的科学问题是满足这个用户或这批用户当时的隐式的需求。推荐系统不同于搜索,有搜索词可以展示用户的显式需求。因此,推荐系统研究关键就在于研究用户的行为和偏好,挖掘用户隐式需求的规律。
合肥工业大学的吴乐教授拿自然语言处理、计算机视觉领域来做类比。这两个领域的科学问题是让机器理解人的语言、视觉世界。她认为推荐系统的科学问题是让机器理解人的行为,并对人的行为进行预测。
电子科技大学的刘峤教授认为目前推荐系统所采用的研究方法大多是经验性的,用户行为建模的理论模型不完备,模型具有不可证伪性。他认为目前推荐系统正在尝试建立自己的理论体系,所以推荐系统所处的位置应该是on the way to science。
山东大学的任昭春教授认为推荐系统和信息检索应该是紧密相关但互相并行的赛道。虽然二者都是建立人和信息之间的桥梁,推荐系统的目标是捕捉用户的隐式需求,而信息检索更多的是捕捉用户的显式需求,找到物品与搜索词进行匹配。此外,他也认为推荐系统不是机器学习的应用领域,因为人的需求难以被用机器学习定义。
议题二:如何看待学术界和工业界的鸿沟?
针对该议题,华为诺亚实验室的唐睿明主任首先发表了观点。他认为产生学术界和工业界的鸿沟的主要原因是因为价值观不统一。学术界往往追求较大的创新性,而忽视了一些细节问题。然而细节问题,比如对数值型特征的处理,往往对工业界系统的性能起着较大的作用。同时,他也认为解决鸿沟最有效的方式是让工业界发布一些特定的数据集,来让学术界人员一起进行研究。
上海交大的张伟楠副教授认为学术界和工业界的鸿沟是一直存在的,完全消除鸿沟也不现实。学术界和工业界在研究目标、研究资源上有自己的倾向性。他认为可以保持求同存异的方式,沿着同一个大方向上进行合作。此外,学术界可以尝试做一些更加超前,更加有创新性的研究工作。
武汉大学的李晨亮副教授也有类似的看法。他认为学术界和工业的出发点不同,学术界以单点突破为主,深入探索和开发公开的数据集,以发文章讲好故事为目标。而工业界以业务增长为目标,研究相对保守,可以使用的特征多样,场景也更为丰富。因此,他认为学术界应该要派学生走入工业界,同时,工业界也应该反馈学术界,积极发布一些新的数据集。
南洋理工大学孙爱欣副教授认为学术界也非常保守。一篇文章如果模型性能不能超越现有方法,将会非常难以发表。同时,学术界的工作想要反驳之前的文章也非常困难,导致前人的工作如果有错误的设定,不准确的评估标准,反而会一直沿用下去。
清华大学的丁璟韬博士后也认为鸿沟不可避免,工业界考虑的是“系统”二字,而学术界考虑更多的是“推荐”二字。他认为要解决鸿沟,学生驻场实习非常有必要,可以一起确认问题,一起解决问题。此外,他认为学术界的高质量的论文可以对工业界的应用有所启发,他认为学术界的研究可以多关注和讨论提出的模型适用于哪种场景。
微软亚洲研究院谢幸研究员认为学术界和工业界出现鸿沟这个现象可能从一个角度说明了工业界技术趋向成熟,已经走在了学术界前面。与数据库和操作系统这些领域不同,尽管技术也很成熟,学术界仍然可以通过自己开发大系统的做法弥补这个鸿沟。真实的推荐场景不光需要有大系统,还需要有大规模用户,这点超出了学术界能力。学术界的研究可以更加超前一些,做一些现在觉得还不实际的事,就像30多年前,最早的推荐系统是在互联网还没有出现,甚至个人电脑还没有广泛普及的时代就提出了。
清华大学张敏副教授也有类似的看法。她认为工业界和学术界还是挺有差异的,所以有很多可以合作的地方。工业界重点是系统性、集成;学术研究是针对一个点,有核心影响的点。二者有很多机会融合和互补。也是我们一直以来和公司合作的原则,是可以双赢的。来自工业界的需求和数据,是学术界必须认真考虑和学习的。不可避免,也没有必要避免。此外,她认为学术界一定要有长远的眼光,而不是与工业界解决同样的问题。
议题三:下一代推荐系统会怎样?
针对推荐系统的未来,YOCSEF总部前任主席、清华大学崔鹏副教授认为当前推荐系统脱离了初衷,用户主体性在技术演进过程中丧失了。推荐系统已经控制了人们会获取什么样的信息,他的社会影响、以及他带来的偏差问题依旧未可知。在未来,推荐系统应该要让步一些主体性给用户,让用户能够控制自己想要获取的信息。
快手的宋洋博士指出了推荐系统的几个未来研究方向,包括:1)隐私计算和端上计算,以保护用户隐私的同时也可以实现更加实时的计算;2)软硬件协同的推荐系统,以提升推荐系统的算力和精度;3)未来虚拟现实和增强现实的场景下的推荐系统。
阿里的马坚鑫博士也认为元宇宙下的推荐系统是一个值得研究的问题。元宇宙下可以捕捉更多的用户信息,更好的理解用户的隐式需求;同时,元宇宙下的推荐系统会更加拟人化,提高推荐转换率和用户体验。
YOCSEF长沙学术秘书、湖南大学姜文君教授认为目前推荐系统主要满足信息消费型服务为主。她认为未来可以探索助力成长型的推荐系统,推荐系统应该可以助力人们在交互过程中获取知识,提升技能。
YOCSEF广州前任主席、中山大学王昌栋副教授认为推荐系统也考虑国家、社会等因素,可以利用推荐系统促进主流价值观传播、助力国家治理、引导人们积极向上。
山东省人工智能研究院的程志勇研究员认为未来推荐系统需要考虑全方位的公平性。比如,用户、物品、还有商家之间的公平性。同时,他也强调信息舆论引导方面也要考虑公平性,防止极化的信息导致用户极化的思维。
在思辨环节中,大家都踊跃参与讨论。百度的董大祥、微软亚研院的吴方照、快手的李彪、山东大学的任昭春、山东省人工智能研究院的程志勇……都发表了各自的观点。大家从不同的角度、不同的行业分享了各自的看法,分别探讨了推荐系统的内涵、推荐系统领域的发展现状以及存在的问题、以及推荐系统的未来需要什么样的理论、技术、评价体系等问题。
图7 与会嘉宾云合影