1.上午议程
1.1.开幕致辞
图1. CCF YOCSEF 济南分论坛主席刘新锋发表开幕致辞
CCF YOCSEF 济南分论坛主席刘新锋发表开幕致辞,他表示,本次论坛因为疫情原因、从筹备到举办都异常艰难,风险与压力并存,不到最后一刻随时都有被取消的可能,对到场嘉宾以及参会工作人员表示了衷心感谢。随后,刘新锋围绕论坛历史、定位目标、社会责任等方面进行了CCF YOCSEF的文化介绍,着重阐述了CCF YOCSEF自报家门、直呼其名、人人平等、推进社会进步的观点和输出的文化传统。最后,刘新锋介绍了本次深度技术论坛相关内容和到场嘉宾。他提到,数字化转型是新一代智能技术驱动下的社会变革,是社会政府、企业当下面临的一个重要挑战,国家“十四五”也要求了“加快数字化发展建设数字中国”,明确指出以数字化助推城乡发展和治理模式创新。但是目前如何实现政法综治业务的全过程数字化,如何设置有效的社社会治理数字化工具等问题仍处于探索阶段。本次论坛将围绕数字化赋能传统社会治理模式的技术路径和智能化提升社会治理手段的技术路径两条主线开展数字化智慧社会治理技术问题探讨,旨在梳理一条数字化社会治理的可行技术路径,凝练数字化社会治理白皮书和内参报告等深度输出,为传统社会治理模型与信息技术的数字化融合以及济南市社会治理数字化平台建设进言献策。
1.2.引导发言1:社会治理行业应用实践
图2. 浪潮软件科技副总经理商浩作引导发言“社会治理行业应用实践”
浪潮软件科技有限公司副总经理商浩分享了关于社会治理行业的应用实践,介绍了社会治理及社会治理所面临的多个问题和挑战:多数城市同时具有城市和农村两种形态,新生事物层出不穷,放大了社会治理的难度。另外,突发事件的发生呈现常态化的趋势。目前建设中最主要的问题是重点人员难管理,数据繁多无法统一,像各委办局、各区县各地市都有自建的系统,数据标准不统一。而且物联设备复杂繁多、民众参与度不足、网格员工作压力大。网格员不仅承担了综治的相关工作,还要兼顾民政,司法,城管等方面的工作,一个网格员可能同时要装很多个手机应用软件。他表示,针对社会治理问题及挑战,浪潮公司所研发的产品的总体目标是提升社会治理的总体水平,实现五个一、打造基于网格化的两个现代化:总体建设目标是构建权责明晰、高效联动、上下贯通、运转灵活、多方参与的社会治理体系,提升社会治理的社会化、法治化、智能化、专业化的水平。实现了一数通全域、一屏观全域、一网管全域、一渠道流转、一时间预警。坚持实战实效实用的原则,实现服务管理的精细化,业务协同的自动化,辅助决策的智能化,网格治理全民化,考核评价的标准化。基于网格+打造社会治理现代化和治理体系现代化双轮驱动的一体化平台。
随后他在产品的总体架构、运行机制、数据支撑体系等方面进行了分享:他表示总体架构是由省市指挥,区县为主导,然后街镇社区具体应用。按照“1+1+N”的模式,两个1就是以综治中心、行政服务中心为中心,N是通过数据整合和业务梳理后的部门子平台,打造一体化的指挥平台。产品的运行机制是以实体化的综治中心为基础,建立起行动协同处置,趋势智能预判,态势全息感知的一体化指挥平台。在数据上,当前数据繁多,建设了一体化大数据平台,解决各委办局的数据孤岛和数据不能共享的问题。利用AI智能清洗、全量数据汇报,打实数据底座,为决策提供数据支撑。目前主要的产品体系为两中枢和七产品的应用体系。两个中枢是地理信息系统和视频监控交互平台。基于这两个能力支撑,建设了党建引领平台,基层治理平台,协同联动平台,多元共治平台,风险防控平台,平安建设平台,一网统管平台。
最后他对两中枢和七产品的应用体系进行了详细讲解,两中枢系统包括地理信息系统和视频监控交互平台:GIS地理信息系统,是覆盖全区的一张地图,为指挥系统提供GIS服务应用支撑,比如通过GIS系统查看地形地貌等。视频交互平台,是将分布在不同部门和不同系统中的视频资源经过统一整合,为各部门赋能,为基础的应用提供视频能力支撑。七产品包括:①实现了党建管理的精细化、规范化、智能化和科学化的综合服务管理系统:党建引领平台,是通过构建大数据平台、考核管理平台、教育学习综合服务平台、党建活动积分管理系统,从而满足各级组织在新时期开展党员宣传,教育管理服务工作的要求,实现党建管理的精细化、规范化、智能化和科学化。党建引领平台利用大数据分析,对不同层级的党组织数量,党员数据进行统计分析,使党建工作做到心中有数、工作有底、决策有据。②含有全国第一个“标准化+差异化”的省级网格服务管理系统的基层社会治理平台:基层平台以基层的管理清单、服务清单、问题清单为导向,以业务为出发点,以数据收集为核心,实现基层数字治理的数字化和精细化。平台采用分级部署的应用架构,做到了全国第一个实现“标准化+差异化”的省级网格化服务管理系统,保证了全省主要工作功能的统一,又保证了市县文化服务管理的个性功能的开展。③可提供可视化指挥调度,还可以实现跨部门指挥调度的协同联动平台:协同联动平台实现信息全量汇聚,汇聚之后由中心统一分发转派,实现线上流转和督查考核评价。联动指挥平台可视化系统是基于地理信息系统构建的一个智能多维可视实时联动的指挥调度平台,实现重大事件的多部门联动,可视化资源的联动,调度资源的全面管理。指挥调度平台,分为平时和战时。平时以事件为驱动,跨部门协同流转调研事件,为这个统一的效能监督提供标准的定量的可视窗口。战时就是利用各种物联感知设备,将现场的实施情况,以及可视化的资源及时反馈给指挥中心,实现各类资源可视化的精准调度与指挥。跨部门联动指挥,是以各级的实体化中心为基础,借助实体化中心的能力,做到屏障结合多方协同,建立一体化的指挥联动平台。整个联动平台实现了管理手段智能化,联动三方便捷化,闭环管理科学化,数据管理平台化的产品价值。④实现多主体共同参与社会治理的多远共治平台:通过链接群众、组织、政府等多元角色,共同参与基层社会治理,构建网格式组团式的微治理模式,实现多元共治,将更多的社会主体纳入到社会治理中来。多元共治平台的产品价值是通过上报、调查、调解、办理,构建了基层多元共治服务体系,回应了人民群众对社会治理参与的热切期盼,发动人民群众主动参与,构建共建共治的社会治理新体系。⑤实现预警研判、辅助决策分析的风险防控平台:以实时的数据,以各类物联感知设备,及时预警、发现,在最低层级最早时间最小成本解决相对突出的问题。利用物联感知设备,将数据重组组合分析,预警研判决策分析。风险防护平台实现了数字赋能,科学研判,及时预警,高效处置,使治理效率大幅提升。⑥实现了基层治理考核的平安建设平台:平安建设平台是适应新形势下加强社会管理的新举措,通过构建平安建设系统,指标体系的建设、指标权重的建设、运算模型的建设、考核数据的建设,作为平安建设的成绩单,提升平安建设的总体水平。基层治理考核通过定目标,建队伍,管过程,抓重点,拿结果,对人、部门、网格的业务进行有效的考核管理,完善治理效能的评估体系。通过平安建设平台的建设,主要目的是提升治安治理的效率,建立健全多元化解纠纷的机制。⑦实现“观”“管”“防”的一网统管体系:一网统管平台是以物联网,大数据,人工智能,5G移动通讯等前沿技术作为支撑,整合城市的相关服务,加强对城市运行状况的实施监测,动态分析,统筹协调。平台包括国家城市运管服平台、省级城市运管服平台。市级城市运管服平台,按照建设要求,三级平台要互联互通、数据同步、业务协同。一网统管的整体架构就是以城市之窗提供数据,智慧应用研判分析,赋能平台提供能力,基础平台提供数据底座的支撑。
发言结束后,与会专家围绕“如何看待智能化技术在社会治理应用平台系统中的使用成效?”“平台如何保护居民和网格员数据隐私?”“信息技术应用创新产业方面,从芯片到服务器架构是否国产化?”以及“如何判断应急事件?”等问题开展了进一步讨论,总结如下:
(提问1)
孟雷:我们论坛的主旨是怎么数字化、智能化。那您怎么看待智能化技术在系统中的应用?人工智能技术在系统里能够做一些什么事情?是否能有一定的成效?
商浩:省级系统我们是第一个做的,山东除了省级系统,各地还有自建平台。我们建立了统一的数据,在各地系统实时抽取数据,通过智能化对各市数据进行提取评估;第二个方面,建立了网格活跃度的概念,让网格成为最小的治理单位,对网格活跃程度进行统一,避免僵尸网格空转网格的产生,提高孵化水平;第三个方面,通过分析对重点关注人员进行分类画像,建立弱势群体的分类标签,在服务走访的时候重点关注这些人群。
(提问2)
郭延辉: 综治平台如何保护居民和网格员数据隐私,涉及到哪些数据?
商浩:目前已有对普通人员进行加密,尽量不存储数据,尽量只调用数据,存储的是非敏感数据。对于访问权限来说,设立部分互联网的行政服务阈,很少与互联网沟通。
(提问3)
刘新锋:国家比较重视信创,从芯片到服务器架构,是否国产呢?
商浩:目前有一些国外的,国家政务国有化正在逐步进行。
(提问4)
李梁:对应急事件的判断是依据什么标准?
商浩:现在的做法是只要发现了,就要呈现。我们对事件类型做一个定义和发现,然后把事件移交给公安进行内部流程的督察。系统的定位目标是发现问题,就当事件来处理。
1.3引导发言2:智慧司法专网跨域认证和可信交互研究
图3.山东大学尹义龙教授团队孙皓亮博士引导发言 “智慧司法专网跨域认证和可信交互研究”
尹义龙教授团队的孙皓亮博士作了题为“智慧司法专网跨域认证和可信交互研究”的引导发言。孙皓亮博士首先介绍了智慧司法的研究现状及问题:智慧司法是符合国家十四五规划加快数字化发展建设数字中国的要求,同时也是数字法制和智慧司法科技创新工程的重要内容。团队工作是为智慧司法提供可信协同的支撑环境。可信协同主要分为两部分。①可信融合,是指跨部门、跨网络,跨场景支撑环境的可信融合和统一认证。②协同支撑,是多模式,多管道,多设备跨时空业务流程动态协同。目前在智慧司法里,这两方面仍然存在一些问题。针对智慧司法里的可信融合问题,目前法院,检察院和司法行政部门之间尚未形成跨部门融合可信互通环境。传统的安全区域隔离方式也无法满足细粒度业务的访问控制。在智慧司法协同支撑上,司法部门也缺乏对通用的业务进行协同处理及流转的信息化架构,跨部门的数据可信流转较慢,而且在智慧司法综合业务中的跨部门业务数据流传程序比较复杂,智能化水平非常低,数据和应用系统的存储比较分散。智慧司法的跨部门可信融合和协同主要包含五大技术:第一部分是云端分布式融合统管支撑环境构建技术,目前法检司内部是云网协同,没有完全采用这个新框架。最近的发展趋势也是要实现跨部门的可信互通,实现隐私计算以及微服务网格信息化架构。第二大技术是智慧司法专用网络跨域统一用户认证和可信交互技术,同时也是团队正在研究的一个课题。目前主要采用单一的加密方式,之后的发展趋势是支持多接入边缘计算与子计算和可信交互以及一些异常操作行为的识别。第三大技术是面向复杂监管场所的多设备群质协同和物联网管控技术,目前各个系统是孤立的,信息是碎片化的,后期发展的目标是多元设备的数据汇集与智能协同联动,以及基于统一的大数据汇集和分析的服刑人员和环境风险管控和预警处置。第四大技术是跨部门协同业务流程动态构建技术。目前的问题是节点孤立、业务分散、缺乏协同,后期期望实现跨部门协同业务处理,以及快速流转和数据协同。最后是智慧司法综合业务融合协同平台的构建技术,目前的方式存在业务流转程序复杂,智能化水平低以及分散式数据汇聚存储问题,后期期望实现智能分析、可视化、大数据汇集和一体化存储。
随后孙皓亮博士介绍了跨部门可信协同应用的支撑环境以及数字身份统一认证与可信交互的系统建设方案:他表示针对法检司跨部门网络融合和业务协同面临的困难和挑战,构建了三个子系统,分别实现统一用户认证、云端分布式融合,以及多设备群智协同,分别解决这个智慧司法跨部门综合业务协同平台中的可信交互、统管支撑和物联管控的三方面问题。最终为法检司的公诉审判以及监管执法业务协同提供可靠支撑。子系统一,“云边端”分布式融合支撑环境,主要技术是智慧司法“云边端”分布式融合统管支撑环境体系架构,主要包含三方面技术,跨域边缘计算节点可信纳管技术,“云边端”分布式协同管理技术,以及基于云原生框架的服务编排和服务能力开放技术。子系统二,是跨域专网用户统一用户认证和可信交互技术,主要技术是基于数字身份的跨部门一体化权限管理和可信交互技术,主要包含三方面,基于案件粒度的访问控制模式、异常数据操作行为识别技术,以及基于多接入边缘计算的统一接入管理技术。第三个的系统是多设备群智协同和物联管控技术,主要内容是监管场所的数据汇聚和智能协同的管控模型,主要应用了三方面的技术和方法,包括服刑人员的情绪和行为风险分析技术,风险态势演化实时评估和预警技术以及基于多种物联终端管控的突发事件应急处置方法。跨部门协同业务流程动态构建,主要建立跨部门协同业务流程动态模型,包括司法协同业务的可信业务策略,跨库数据协同服务策略,以及跨部门协同业务的信息安全策略。最后整合业务建成业务融合协同平台,用到了包括综合业务融合协同可视化技术在内的综合业务融合协同性能提升技术,以及综合业务一体化存储技术。
第三部分,孙皓亮博士介绍了尹义龙教授团队承担的重点研发计划专项“智慧司法可信协同支撑环境关键技术研究”:他介绍到团队主要研究是智慧司法专用网络跨域统一用户认证和可信交互技术,主要研究任务包括研究基于数字身份的跨部门一体化权限管理和可信交互技术,研发基于案件粒度的访问控制模式、研究异常数据操作行为识别技术,以及研发边缘计算模式下多接入技术融合的统一接入管理系统,对应的关键技术问题是如何解决身份安全的统一认证,如何解决案件粒度下不同用户不同决策的安全访问控制,如何解决数据操作行为的特征表示以及如何解决多种边缘单元接入的有效融合。团队计划采取包括构建统一的数字身份认证,同步法监司内部的用户和权限信息,多种访问控制模式,融合日志采集单元的关键信息提取以及多种认证模式协同在内的技术,预计会得到基于数字身份的跨部门统一权限管理系统,设计出基于案件粒度基于角色的多级访问控制模式以及异常行为识别算法,提供边缘计算模式下多接入技术融合的统一接入管理系统。系统主要使用智慧司法专用网络跨域统一用户认证和可信交互技术,团队的研究包括主要四个模块,基于数字身份的跨部门一体化权限管理和可信交互、基于案件粒度的访问控制模式、异常数据操作行为识别,以及边缘计算模式下多技术融合的统一接入管理系统,四个模块融合得到基于数字身份的跨部门一体化权限管理系统。
第四部分是针对基于数字身份的跨部门一体化权限管理系统技术方案的介绍:通过同步法检司的组织、账户以及资源等多源数据汇集到控制中心,控制中心基于客户端的智能设备信息和资源的访问权限策略,确定客户端的访问权限,控制中心包括基于数字身份的跨部门一体化权限管理模块、基于案件粒度的多访问控制模块、跨部门协同业务数据异常操作行为识别模块、边缘计算模式下多技术融合的统一管理模块等四个模块,系统基于微服务架构实现数据采集、鉴权跨部门服务的分布式访问,期望能够满足百万级用户的并发访问。具体方案通过四个系统子模块来介绍:首先基于数字身份的跨部门一体化权限管理和可信交互模块中,主要实现构建统一的数字身份和最终实现跨部门的一体化权限管理。针对统一的数字身份构建,融合组织、账户、资源等多源数据信息,建立根账户体系,基于根账户体系生成或配置统一的数字身份信息。而一体化权限管理,要同步法检司内部的用户和权限信息,实现法检司内部的用户和权限数据共享、采集终端基础信息实现终端智能管理、采集日志数据实现预警分析。其次,子模块二是基于案件力度的访问控制模式,主要构建三种访问控制模式,强制访问、自主访问和新颖的基于角色访问控制。基于目前三种访问控制,团队对案件配置不同的访问控制策略,配置案件不同阶段不同节点的访问控制策略,实现案件粒度的多级访问控制,其次利用案件访问控制策略,获取法检司人员的访问权限。第三个子模块是异常数据操作行为识别模块,主要包含三部分:第一部分是鲁棒特征提取,融合日志采集单元提取的关键信息来对操作行为进行表示;第二部分是不同数据条件下的模型学习,在没有标记数据的情况下做无监督学习,有标记的做监督学习,部分标记的话就做半监督学习。模型学习之后得到预测模型,需要进行高效预测模型部署,将预测模型内嵌于一体化权限管理系统。第四个子模块是边缘计算模式多技术融合的统一接入管理系统,主要内容是利用多接入边缘计算单元的信息,实现与云中心资源信息实时同步、利用边缘设备识别人脸、指纹等数字身份信息,通过多种认证模式协同,实现可靠认证。
报告的最后孙皓亮博士进行了总结与展望:他指出团队研究的统一用户认证技术可提供跨部门可信协同应用的支撑环境,为跨部门身份认证安全等提供技术支撑。其次通过综合运用数字身份认证和分区分层权限管理技术,实现跨域、跨部门统一用户认证和可信交互,在技术方面具备一定创新性。第三,基于案件粒度和多种访问方式,可以支撑跨法检司的有效访问控制,团队在这方面思路上具有较强的创新性。第四,是引入机器学习技术,实现业务数据访问操作行为的有效特征表达,以及对跨法检司业务数据异常访问操作行为的可靠识别,团队实现了一个系统的功能创新。第五,通过建立根账户体系以及对边缘端计算单元的关键特征提取、融合,有效解决法检司协同业务中的可信身份认证,这个可以体现出团队研究的方法的创新。最后,目前研究的业务协同理念对法检司外的其他部门(例如:银行与税务)具有普适性,如果把这个协同理念应用到其他部门,还能够提高社会运行的效率。针对团队研究的统一认证和可信交互技术,它可凝练为“零信任安全”理念,有望应用于各类安全产业。
报告结束后与会专家就“法检司案件粒度定义是什么?”“法检司部门信息流转慢是机制问题还是信息化手段不充分?”“异常访问的定义是什么以及如何识别?”“如何理解系统会针对不同的数据,使用不同的技术,实现可靠的认证识别算法?”“如何检测有权限用的异常行为?”“通过行为模式是否可以进行身份冒用识别?”等问题进行了思辨讨论,总结如下:
(提问1)
侯睿:我对您分享内容中的案件粒度感兴趣,您是否可以具体讲一下。
孙皓亮:之前的访问控制是针对用户的,而现在我们在案件处理流程中赋予各种角色,然后对这些角色进行访问控制。
侯睿:也就是Id对应权限,能看到对应的案件的哪些部分,能访问到哪些字段?
刘新峰:是的,而且司检法案件相互间是隔离的,现在要把三个之间打通。
(提问2)
刘新锋:智慧司法的业务信息流转慢的原因是什么,是不同部门间人工审批存在延迟、还是各部门系统缺乏直连接口?智能技术在其中起到作用?
孙皓亮:从业务方面来理解就是目前这三个系统还没有打通,可能我们需要从系统里跳出来然后再进入另一个系统,这是主要的问题。
(提问3)
吕洪涛:异常访问具体指什么,我们识别它的目的是什么?
孙皓亮:异常数据主要针对恶意行为,比如案件关键信息的恶意修改、删除、添加,防的是内部人员这种操作。首先可以是生成一些数据作为标注,后面期望能够接入这些示范单位调取真实数据。
(提问4)
刘新锋:注意到系统会针对不同数据,使用全监督、半监督、无监督等不同技术,实现可靠的认证识别算法,能否分享一个例子?
孙皓亮:举个例子,常规来说这些操作都是正常的,恶意行为是很罕见的。可以训练一个模型来建模数据分布,那么恶意行为是不符合这个分布,就可以识别这是种异常行为。
(提问5)
刘宁:数据库有严格的权限,如果对人员有一个严格的访问限制,是否就可以检测它的异常?
孙皓亮:要在他已有权限的时候,要识别人员做出的恶意行为。
(提问6)
李新:如果冒用别人身份,那么他的行为模式和当事人不一样,是否这样可以识别?
孟庆钢:我们和尹义龙老师和孙皓亮老师是一个课题组的,我们在第四模块那个支持边缘计算模式下多技术的融合里,有对人的使用习惯等进行分析。如果发生异常的话,首先要升级认证模式,否则就进行拒绝。
孙皓亮:这个问题不是一个模块或者算法的事情,要多个模块的联动去解决这个问题。
1.4引导发言3:智慧警务与社会管理实践思考
图4.山东警察学院警务信息系主任侯睿作引导发言“智慧警务与社会治理实践思考”
山东警察学院的侯睿主任以“智慧警务与社会治理实践思考”为题,分享了数字化助推智慧警务与社会管理的研究、实践和思考。他点明了数据是情报人员的生命的观点,以案件侦查和疫情防控为例阐述了数据挖掘、信息研判、情报获取、决策支撑的现有方法和关键技术:他提到,在警务工作中,首先掌握一个数据信息,然后围绕这个数据信息做深度的挖掘,挖掘出相关信息从中来找它间接关联的人、地、事务、组织。犯罪嫌疑人可能会提前进行防范,反侦查,但是有些东西是他作为一个客观的人,他无法隐匿的行为。警察的工作是要找到这项行为对应相应的一些产业设备,能捕捉到这个数据。目前都是靠表征的数据,比如视频、手机漫游轨迹、Wifi探针、基站的辐射范围等,找到这样的数据里蕴藏的信息,这就是事物存在和运动状态的反应,找到这样的信息之后,再加上背景资料的研判,得到一个所谓的情报。在目前的案件侦查和疫情防控工作中主要通过以下方法和技术进行情报获取、研判和决策支撑,首先通过对涉案目标进行打标签,只要有一个关注的对象,那么一定要对它进行标注,比如说生物识别,指纹,虹膜,声纹,DNA,血流变,其中血流变,作为人群识别的一种方式,目前还没有被推广。只是在银行,以及特种要害部门和领域里边使用到。其次是人脸识别,通过身份识别的准确、唯一性来进行识别。第三通过社交网络数据的异常信息进行标注,比如某一个人经常接触一些吸贩毒人员,他将成为重点人员。还有某些人他带有特定的诉求,它应该在什么位置,但是它经常在敏感的时间节点到某些特定的位置去,例如自爆、自残,这个需要重点识别。还有一些心理特征,兴趣爱好也是作为标签存在的。
此外,侯主任介绍了在城市扩大化、文化多元化、互动虚拟化的背景下,公安部门的群防群治宣传、智慧警务APP等专群结合数字化社会治理工作:他提到,受抖音等媒体的启发将警察和警务工作进行虚拟化,进行反诈宣传。通过对人群、数据标签进行细分,筛选、确定高危被骗人群,对他进行定向的,准确的,精准的劝阻。这就是我们现在做反诈的一个基本思路。
关于社会治理,侯主任表示一方面社会治理能力提高,还有一方面要专群结合,把专门工作和群众工作相结合。所以就有了智慧警局、虚拟警察、AI警察等来应对新时代群众工作,网络环境下的群众工作,网络环境下的群防群治的宣防工作。从警务方面的工作考虑,社会治理应当是个精细化,同样反诈也是精细化的。这才是国家治理现代化的题中之义。每一个人都是一个特别的个体。不能把所有人的要求放到一个人身上。过去,因为我们没法精准的给每个人定义所以达不到期望的效果。而现在大数据技术,人工智能技术,加上通信技术就可以实现精准的测定,然后精准的投放,这样的智慧治理的现代化程度就会提高。
关于大数据技术,侯主任提到,通过大数据分析技术可以发现规律、解释现象、预测未来,对全社会数据进行掌控,然后得到社会存在和社会运行发展的信息,构建知识图谱。基于这方面技术,结合社会治理,公安系统推出了智慧警务。智慧警务是以互联网、物联网、云计算、智能引擎、视频技术、数据挖掘、知识管理等为技术支撑,以公安信息化为核心,通过互联化、物联化、智能化的方式,促进公安系统各个功能模块高度集成、协调运作,实现警务信息“强度整合、高度共享、深度应用”之目标的警务发展新理念和新模式。首先是用在军方,然后就是公安,通过这些技术做支撑,结合自身信息化,通过这些互联化,物联化,智能化,来促进这些要素的整合共享甚至应用,这是目前警务发展的一个新的模式。
侯主任随后讲到了智慧警务体系,通过使用前端感知体系对工作中的社会管控、案件侦查、情报研判、流调以及其他的一些工作进行数据采集把它汇聚到公安大脑里进行分析。然后做出准确的预测或者决策辅助来支撑警务行为。我们把它称之为情报指挥行动,叫情指行一体化。在这个过程当中,随时反馈,从警务行为的末端,如派出所民警,巡警,特警。他随时把情况上传到公安大脑,1大脑进行二次分析。然后指挥前端再去采集相应的信息进行补充。这样就把盲目的、主观的、随意性的决策变成一种客观的、准确的、有数据支撑的有效决策。除此之外,还做了P-GIS,以地理信息做底层,把所有带经纬度的东西全做到这一个底层上,一层一层的数据叠加。最下层是地理信息,然后以地理信息做标注,把摄像头、探针等特殊的设备的位置全部标定,在这个标定基础上,再标定人、手机、车。将这些信息全部附上坐标系,在某一个时间,某一个情况发生时候,经过收集来的信息可以进行研判。通过这种资源的整合,然后多元态势感知,可以调动很多部门。比如暴恐袭击发生之后,医院、防化部门,消防部门都要赶往袭击地点。大家在同时间,在同一个指挥体系内向一个方向发展运动。并且通过预案,防止这个地方出现次生灾害。在这里有一个重要东西就是我们把人地事物组织这些要素,通通标定在特定的地理信息上,叫一标三实。我们通过把人地事物组织运行状态的进行多维感知,感知以后会遇到一个中心,将这些外部信息进行整合,进行池化。同时还有内部数据,警务工作对自身的管理,警务工作面对不同的情况,采取相应的处置措施,这是动态的。这就是警务元素的数据化,警务流程秩序智慧化。让被动警务变主动警务,汗水警务变智慧警务。
随后侯主任提到了智慧警务的支撑,一个是数据关联聚合,形成某些领域的特定的知识图谱, 还有一个就是人体识别,AI技术。关于AI运算智能用于社会治理,侯主任提到了微信公众号中的虚拟警察、疫情防控期间以及给大家带来业务便利的智慧警察局,这类数字AI民警背后都是由AI运算智能进行支撑的。它可以确保挖掘到数据价值和关联性,减少充分性操作,把人的工作重点放在数据的潜在的价值上,实现自动化、聚焦化和删减化。
最后,侯主任提到了存量数据的挖掘问题,他结合司法系统的数据的共享问题,警务工作中如何对常年累积的案卷中的价值进行充分挖掘问题、常年办理某项业以及群众的某些诉求问题展开描述,他提到通过实体、要素、标签、关系、应用的分析和构建,达到社会治安综合治理的知识图谱的构建,通过这种方式,提高效度、信度效果,降低劳动强度,发现潜在关联,然后通过聚类分析,挖掘出大量的潜在的信息,然后进行多次分析被害人的情况和作案人的情况,把两个群体,精准的刻画出来,这是目前警务工作中面对存量数据的挖掘的处理流程。侯主任最后表示,目前的工作重点放在前端劝阻预警上,希望在这个领域跟各位的专家进行深度的合作,希望专家提供相关支持。 报告结束后与会专家围绕“智慧警务的难点是治理要素的筛选还是数据建模和收集?”“虚拟警察在政务上如何使用?”“密集人群的交叉轨迹分析是如何做到的?”“知识图谱中算法和人工干预的比重是如何分配的?”“地域数据的汇聚和跨部门协同如何进行?”等问题展开讨论,总结如下:
(提问1)
刘新锋:智慧警务的难点在哪里,是治理要素的筛选,还是建模或者收集数据?
侯睿:主要难点在于数据的时效性比较差、数据质量比较低,还有数据之间的关系挖掘,现在想做就是通过迭代的关系自动找出间接关系。
(提问2)
徐立先:虚拟警察在政务上是怎么使用的?应该把他建模为三维数字人执行警务吗?
侯睿:虚拟警察主要是一个应答的形象,前端要有一个直观形象让用户以为和警察在互动,后台是知识图谱在运行。由于群众提问一般都是比较固定的问题,所以目前对虚拟警察的依赖度还是比较高的。
(提问3)
李梁:疫情防控在分析轨迹交叉的时候就是利用wifi手机定位吗?还有就是比较密集人群的紧急事件怎么来获取运动信息?
侯睿:wifi只是其中一个,还要结合视频等其他数据,要根据不同场景和对象目标采用具体技术。
(提问4)
许海振:智慧警务中观点性的数据比较多,而且数据比较复杂。那么在知识图谱中对于普通人群来说,算法成分和人工干预成分各占多大比重?
侯睿:重点人员是一人一道,就是每增加一次轨迹就给他加分。对于普通人员数据建立相对较少。重点人员的手动比例要远远大于普通群众。
(提问5)
孙皓亮:各部门协同系统中,大数据分析是地区各自分析然后汇总吗?
侯睿:有中心还有分中心。一般在分中心有备份。某些特定数据库是和公安部对接,其他情况需要请求。
图5.论坛嘉宾合影
2.下午议程:闭门论坛
2.1.议题一:数字化赋能传统社会治理模式的技术路径
图6.闭门论坛阶段议题一讨论现场
数字化赋能传统社会治理模式的技术路径设置了三个子议题,包括社会治理场景的数字化建模、人工智能算法与传统社会治理的结合模式、以及数字化社会治理下的数据隐私和决策可信。议题参与专家包括商皓、侯睿、许海振等社会治理业务专家,以及孟庆刚、李新、孙皓亮、武蕾、徐敏峰、刘新锋、郭延辉、刘宁、杜丽娜等来自高校的人工智能技术专家。与会专家三个小时的深度讨论输出总结如下:
子议题1:社会治理场景的数字化建模
针对社会治理场景的数字化建模议题,结合社会治安综合治理、智慧社区治理、舆情治理、矛盾纠纷调处等复杂社会治理场景参与主体多、数据来源杂、业务流程各异等问题,与会专家凝练出三个主要思辨点:(1)社会治安综合治理、智慧社区治理、舆情治理、矛盾纠纷调处等复杂社会治理场景参与主体多、数据来源杂、业务流程各异,使用哪些数据治理技术能够完成传统社会治理模式和流程的数字化构建?(2)自然资源部明确“到2025年,50%以上的政府决策、生产调度和生活规划可通过线上实景三维空间完成”,社会治理的实景三维技术和挑战有哪些?(3)哪些共性技术能够作为数字化社会治理模型的统一架构?主要观点总结如下:
思辨点1:使用哪些数据治理技术能够完成传统社会治理模式和流程的数字化构建?
针对数字化建模问题,商浩谈了自己的看法,他表示由于各级行政机构有不同的系统,数据之间的流转和表结构都是不统一的,首先要建立一个统一的标准或事项清单,规定网格员或者工作人员的工作职责范围。另外,山东省也在建立一体化的数据共享中心,各级机关都在提数据需求,可以对数据进行挖掘分析,对特殊人群或者重点人员做人员画像。
侯睿结合警务工作,发表了自己针对数字化建模问题的看法,他表示现在警务里面主要是经验建模,把执法经验转化成数学语言进行建模,然后在警务工作中找数据作为验证集,但这种模式以后会逐渐被替代掉。
针对主持人刘宁提出的在识别领域哪些技术对社会治理能起到有价值的应用问题:孙皓亮表达了自己的看法,他提到模式识别包括生物特征识别,图像场景的识别等,在社会治理方面有广泛应用,比如对场景场所的智慧监控和预警,目前的系统智能化程度还不是很高,一方面要继续提升,另一方面还是不能完全抛弃人工,专家知识还是比智能系统要强很多的。
主持人刘宁提出基于互联网时代网上有大量的新闻消息,在媒体领域哪些数据治理技术能够完成治理模式或流程的数字化构建问题:媒体领域的许海振表示数字化治理的一个前提是要有应用场景和应用需要求,同时数字化治理过程中要有权威部门来牵头,这样这个平台才是可信赖的、有价值的,从而建设让群众满意的政府。
思辨点2: 社会治理的实景三维技术和挑战有哪些?
针对社会治理场景的实景三维是否需要三维GIS的问题:武蕾表示实景三维可以通过已有软件,在三维GIS的基础上把数据累加到上面,能够实现人地事物组织的融合,但社会治理数字孪生平台在目前开发过程中似乎对三维孪生模型没有太大的需求,二维GIS足够用了。侯睿提出反对意见,认为三维GIS的应用场景远远大于二维GIS,只是受系统建设的现状所限。比如城市化高层建筑很多,二维GIS不能解决,需要三维数据来呈现。再比如,暴恐袭击后的毁伤程度建模,辐射范围不光是平面的,需要三维表示。此外,地形地貌的描述也需要三维GIS。现在三维GIS在警务系统里用的比较少,国内的方法一是精度不够,还有信赖度不高,要价太高,将来走信创必须替代这些方法。
面对三维建模问题:李新表示三维模型的数据量太大,用什么方法可以把三维模型快速加载,在web层或者手机层进行快速显示,还是困难的问题。在数据叠加上,包括智能推理,还需要很多技术。是否可以针对某种具体类型的范围,通过模型分析来达到事后研判或者提前预防?因此,在模型方面、技术接口方面、共享数据方面、应用层面的社区管理或治安管理等还有很多层面的内容需要继续研发。作为技术人员,我们是否能够定义一些标准,基于这些标准能快速把模型都集成进来,分层做一些研究工作。
针对主持人刘宁提出的哪些三维建模技术能够更好的促进数字化社会治理的转变问题:
徐敏峰表示在三维建模促进数字化社会治理应用方面,社会治理场景有很多定位的问题,例如发生爆炸,可以在二维平面定位爆炸地点,在分析的时候,利用三维技术去做爆炸分析。在获取三维信息方面,对于城市信息可以直接扫描,对于更大的范围可以用无人机来解决精度问题。此外,重建的模型目前可以存储在本地,以应对数据量大而导致的加载慢问题。
针对社会治理数字化建模的难题:郭延辉表示无论二维还是三维只是技术上数字化的一个方面,更多的还要从其他方面来考虑,比如社会治理中参与的角色有哪些,政府职能部门在智能化方面充当什么角色,以及群众有什么诉求。另外,我们要理清楚社会治理主要有哪些方面的数据,它们的建模是多种多样的,在数据交互中存在很多问题,更需要考虑对政府开放哪些接口,对技术人员开发哪些接口,这是需要分层进行处理的。
侯睿从警务人员的角度发表了针对主持人刘宁提出的社会治理中数据管理和数据获取问题的看法:他表示办案需要很多数据,尤其是高科技犯罪。以电诈为例,需要微信、qq群、网站等信息流和账户等资金流等多方面信息,每种数据有自己的格式,而且交换是有条件的(比如隐私原因)。博弈结果就是,有些共性字段可以互相交换。另外有些信息具有实时性的问题,比如实时轨迹,可以给出延迟后的数据。
针对侯睿提出的实时轨迹具有实时性的难题,商浩结合自身工作举例:他提到上海的无人感知设备比较丰富,通过做视频解析来解决重点人员关注的问题,例如可以通过判断开关灯和外卖信息,来看居民的生活状态。
针对刘新锋提出数据建模的复杂度难控制,如果后期需要添加修改字段,这些字段又涉及多个数据库系统的问题:侯睿表示警务工作更多是数据的调取方,从时间和空间来调取数据。确实有很多没考虑到的因素,目前也在优化场景和业务模型来解决。
刘新锋根据各位专家的回答进行了总结:数据获取的精度、数据传输、数据管理和共享、数据治理建模复杂度、人工智能和业务场景的结合是我们现在遇到的五大挑战。
思辨点3: 哪些共性技术能够作为数字化社会治理模型的统一架构?
针主持人刘宁提出的哪些共性技术在数字化治理中能够作为基础技术进行应用的问题:刘新锋表示BIM的渲染技术、数字孪生技术、元宇宙技术,不同领域对技术的定义完全不同,要解决这个问题需要先理清什么是技术。
侯睿从警务人员角度举例,刑事科学技术,就是一种技术方法的具体实现,借助什么材料、工艺、程序,例如指纹,早期是用粉末的方式,然后出现真空镀膜或者化学试剂,但都是一次性且容易破坏的,现在用光学技术,这就是一种技术的发展。
孙皓亮从计算机领域谈了自己认为什么是技术,他表示能实现一种功能,达到某个目的,这叫技术。反过来讲,计算机中分析算法的复杂度和性能,这不叫技术。徐敏峰也发表了自己的看法,他认为从计算机的角度,对技术的定义就是某种算法。针对数字化治理,相关的专家可能更关注流程标准化的问题。不同层面需要不同专家来定义。主持人刘宁同意徐敏峰的观点,并补充道,从技术角度,个人理解是在完成需求的过程中使用各种方法就叫做技术。
针对数字孪生技术,侯睿谈了自己的看法,他认为好的社会治理能不能变成数字化,坏的能不能通过数字化进行改进,这是目前遇到的两个问题,只要能解决这两方面问题的方法,都叫技术。他认为数字孪生就是解决问题的方法,但是如何进行数字孪生,这又是接下来的问题。
针对侯睿提出如何进行数字孪生的问题:李新表示,通过视频融合技术把实时视频有机地融合到三维模型,实时地反应场景的变化,可能是个有价值的解决方法。另外,目前数字孪生可以做一些仿真,有了数字孪生技术就可以叠加在模型上做一些火灾的模拟。
刘新峰最后补充道:数字孪生的最大问题就是成本,什么时候成本降下来,就能有更多应用出现。
子议题2:人工智能算法与传统社会治理的结合模式
社会治理业务的自动化处理和决策是数字化社会治理的目标,这需要传统社会治理模式的改变。针对人工智能算法与传统社会治理的结合模式议题,与会专家从以下两点进行了思辨:
思辨点1: 如何将识别、检索、推荐、仿真等人工智能算法“嵌入”数字化社会治理业务流程、从而简化或替代人力?
侯睿首先从警务工作方面谈到了关于主持人刘宁提出的在非计算机领域中,社会治理过程中所遇到的问题:他表示警务工作中使用的人工智能还不是特别成熟,主要对一些简单重复性工作用人工智能替代,比如虚拟警察,准确度仍然比较低。另外,在案件推演中,推演出的意见采信度仍然不是很高,始终作为辅助而做不了证据。虚拟仿真在应急管理方面用的比较好,因为它没有很多逻辑分支。但是人的思想太细了,案件推演更有挑战,现在只能主动将人带入剧情,用很多条件判断去控制,具有游戏性质。刘新锋表示赞同,并补充说明医疗系统、自动驾驶方面都有这个问题。
针对侯睿遇到的案件推演问题发表了自己的观点,他表示目前最常见的人工智能是基于一些已有的、客观的数据训练网络模型训练而来的,本质上还是属于弱智能。有些时候并不是模型有问题,而是数据有问题,即使是人也不能根据信号做出准确的判断,他提到著名的AlphaGO也是基于大量训练状态,用学到的模型去估计下一步怎么走,而不是通过进行严密的逻辑推理来解决。
针对人工智能问题:徐敏峰提出了自己的看法,他表示人工智能确实存在问题,但是人也会出现问题,例如相机采集到的图像可以当作证据,或者医学通过图像处理技术采集X光片,但也是有误差存在的,为什么人类对这些技术信任度比较高呢?对于智能化的算法,如果用某种硬件进行包装后再输出,是否可以提高信任度?似乎现在人们对可看到的实物,信任度比较高。刘新锋提出反对意见,他表示照片或者CT是对原有技术的反映,精度比较高。但是人工智能是要对数据进行推理,而不是原来数据的呈现。针对这个问题,李新表示人工智能技术,需要不停发展,不停标注数据设计新模型,才能成长进步,例如图像识别领域已经很好的效果了。
针对主持人刘宁提出的使用人工智能分析流媒体数据时应该怎样结合的问题:许海振表示,这方面人工智能算法可以做到,但算法应用和用户诉求是否一致,是需要考虑的问题。例如机器人写稿,今天天气怎么样这个主题可以写的很好,因为这是个客观的主题。但是主观的题目,例如有温度的济南教育,我们设计算法时候并没有预计到这种题目,所以效果比较差。针对许海振的回答,主持人刘宁总结道:人工智能还是应该辅助减少人力成本。商浩针对主持人刘宁的总结表示赞同,并补充说道:社会治理中最重要的人工智能场景是事件流转,一般做法就是把事件转派给人员,这是个不断修正的过程。
针对主持人刘宁提出的人工智能无法模拟人类情感的问题:郭延辉发表了自己的看法,他表示,人工智能在逻辑推理方面,目前是处在弱智能阶段,一方面可以利用人工智能做数据治理,比如指纹识别等。在决策管理方面,可以用人工智能做一个初步的筛选,然后由人工做出决策。再一个就是习主席强调的是要注重联动融合,可以让大众都参与,有更多的数据依据来做判断,他认为这是一个从弱智能转向强智能的方式。刘宁对郭延辉的观点表示赞同,并总结道:尽管目前人工智能是弱智能,但也不妨碍用这些技术解决一些问题,毕竟全部解决不太可能。
针对人工智能算法“嵌入”数字化社会治理业务流程的问题,侯睿表示将重复劳动环节用人工智能来替代,是现阶段“嵌入”的一个方法。刘新锋提出了一个传统社会治理模式的改变的观点:他表示,社会治理的核心就是数据治理,面对低质数据,需要政府制定配套解决方案;或者通过质量监控或评估来修复,可以用算法来提高模型质量。徐敏峰表示很赞同,并补充道:有了高质量数据、鲁棒的算法,还需要再加上可见的实体。
思辨点2: 如何平衡算法系统复杂度和业务人员不均的数字素养与技能?
针对如何平衡算法系统复杂度和业务人员不均的数字素养与技能的问题:孙皓亮表示,人工智能模型与传统社会治理的深度结合需要打通社会治理数据流通的各个环节,例如每个系统都带有人脸识别,那么在一个系统注册是否就可以直接使用别的系统。打通这些系统的联系就在一定程度上可以避免人员素养和技能的要求了。针对孙皓亮的观点,张亮并不赞同,他提到,在集成电路方面,人工智能很多东西都没有落地,想法很好但是理解程度还不够。到目前为止,人工智能芯片方面一直没有落地,还在寻找解决方案的过程中。
针对以上问题,徐敏峰提出设想,有没有新的模式,除了语音、触摸屏以外,让人和机器做一些交流,从而让群众更愿意参与治理的过程?侯睿表示,虚拟警察本质上就是一种尝试,不是触屏、语音、读写,而是模仿虚拟人的交流,具有人的表情、情感等,未来还会更多尝试。
针对主持人刘宁提出的公务员工作中每天都要靠人力填写大量表格的问题,侯睿表示可以采用标准化流程来解决这一问题。
子议题3:数字化社会治理下的数据隐私和决策可信
数字化技术和人工智能算法可能需要使用业务人员和居民的个人信息、存在信息泄漏风险,与会专家围绕以下两个思辨点进行讨论:
思辨点1: 如何使用区块链、联邦学习等技术保障社会治理大数据使用中的隐私信息?
针对如何使用区块链、联邦学习等技术保障社会治理大数据使用中的隐私信息问题:侯睿表示,联邦学习在电信诈骗案件方面很有需求:例如,银行想让警方找到洗钱的团队,但是不会提供账户信息,于是就建立了数据交换区。还有通讯方面,判断手机卡是不是本人在使用的问题。社会管理方面,判断居民用水用电等问题,都会应用到联邦学习技术。专家郭延辉表示,数据隐私方面更多是政策问题。什么东西属于隐私数据,数据所有权归谁,谁能使用,需要法律法规来规范。以后出台这些方面的法规和约束,会促进数据持有方在数据共享方面以及数据隐私保护方面的参与,互相之间有更好的信任。
主持人刘宁结合数据隐私提出一个假设:如果有人用了自己的数据,有什么方法可以发现或者进行预防呢?针对这个问题,吕洪涛表示,联邦学习可以解决隐私保护的问题,联邦学习分成两类,横向和纵向。横向是大家数据形式特征都一样,但是数据分布不一样。纵向联邦是指每个人掌握的数据分布不一样,某种标签有些人有,而有些人没有。通过联邦学习可以让模型在各方数据之中训练更好的大模型,同时保护各方数据的隐私性。这取决于样本特征。例如,不同公司有不同特征,这就够了,可以大家一起训练同一个模型。侯睿表示,吕洪涛描述的这种情况更适合洗钱的案例,电信诈骗案件中银行关心有没有洗钱。原来洗钱方式有某种特征,在检测过程中又发现了新的洗钱模式。商浩结合综合治理方面的工作列举了一个例子:对于精神障碍患者需要联合卫建部门进行监控,有些需要定期服药的患者如果他的购买药品记录中断就要上门进行询问,但是医保部门往往不愿意提供这些记录。主持人刘宁针对以上专家的发言做了总结,机器学习的目的是更好的从数据中抽取特征,但是联邦学习的假设是如果数据分布在不同地方,虽然获取不到数据,但是可以通过把机器学习算法部署就可以训练出很好的模型。
思辨点2: 现有人工智能算法通常只能做到推理或决策过程的可解释,比如特征热力图或者基于决策树的推理过程刻画,如何设计治理业务导向的、业务人员可理解、可信赖的决策模型?
针对如何设计治理业务导向的、业务人员可理解、可信赖的决策模型这一问题,郭延辉首先提出了自己的问题:什么是数据可信?如何看决策可信?机器学习就像一个黑盒子,怎么看出来是否可信呢?针对以上问题:主持人刘宁表示,区块链通过多方确认机制来保证你的数据是可信的,同时可以把决策过程展示出来。现在也有相关方面的研究,例如用离散深度学习模型,就可以直接抽取规则,或者基于决策树,基于示例的方法。同时数据方面,应该是因果性的数据,而不是关联性的关系。决策可信是现在很重要的度量,但是现在人工智能很多方法达不到这个要求。孙皓亮认为,现在的人工智能算法大多数是基于深度学习的,本身是一个黑盒的决策系统,神经网络的输出不一定表示概率,需要对模型损失校正,将模型的输出结果和真实概率关联起来,避免虚假关联给决策带来负面影响。侯睿认为,决策可信可以从两个方面来理解,一个是决策过程可信,一个是决策结果可信。
2.2.议题二:智能化提升社会治理手段的技术路径
图7.闭门论坛阶段议题二讨论现场
智能化提升社会治理手段的技术路径议题设置了三个子议题,包括:低质业务数据下智能化模型的设计与构建,面向社会治理事件推演的多主体博弈技术,支撑社会治理全生命周期感知调控的数字孪生技术。参与议题的专家包括来自于计算机方向的专家以及产业界的专家,他们是:聂秀山、吕洪涛、陈关忠、李梁、王宇、沈旭、杜萍、宋立莉、李照川、李西娜。与会专家三个小时的深度讨论输出总结如下:
子议题1:低质业务数据下智能化模型的设计与构建
现实场景中,社会治理业务数据体量大、指标性信息稀疏、很难直接利用结构化数据设计基于规则的决策模型,而数据驱动的机器学习算法、特别是深度学习模型对数据数量以及标注信息的要求很高,基础数据采集设备缺乏、业务大数据难处理缺标注、决策推演模型性能难保证是智能化社会治理技术研发的痛点问题。与会专家围绕“面向社会治理业务大数据,哪些技术能够缓解现有人工智能技术的数据依赖或增强低质数据训练鲁棒性?”展开讨论,从数据缺失、重要数据发现和人机协同三个角度对现有技术进行梳理,形成以下思辨点:
思辨点1: 面对数据缺失问题,如何进行相应的模型设计以辅助业务?
针对数据缺失问题:聂秀山表示可以从两个方面着手,第一个从数据本身,提升数据本身质量。具体来说,在数据管理上采取数据标准贯标的方法,从政府和大型数据企业的角度制定数据质量评估和处理的标准,制定开放的公共数据,打破数据壁垒,激活数据价值,实现以需求为导向的共享的安全可靠的数据;第二个方面,从技术和模型的角度,采取弱监督、无监督等方法,提升模型对低质量数据的处理和分析能力,或者长尾分布的模型和方法。另外,目前随着预训练的发展,模型参数量的增大也可以缓解对数据质量的要求。除此之外,我们可以探索数据概念漂移检测方法,鉴于有些数据的分布会随着时间而变化,我们可以探索一些能够自适应新数据分布的模型以提高预测性能。主持人孟雷对聂秀山的发言进行了总结,他表示提出制定统一标准以尽可能避免数据低质量问题。在对低质量数据的处理上,从数据角度可以采取多元数据的助力,从模型角度可以采用长尾小样本学习方法。
针对三维场景遮挡情景下的数据缺失问题,杜萍表示人群疏散工作方面遇到了缺失数据问题的解决方案是从硬件设备的角度找到更多维度的数据,例如从视频里面提取人的轨迹信息。或者可以根据手机轨迹利用WIFI提取手机轨迹,在室内可以利用蓝牙提取轨迹。另外,还可以采用仿真数据。
针对主持人孟雷提出的在业务中遇到数据缺失的问题是如何解决的:李照川表示低质量数据的情况短时间内难以改变,需要去适应。企业方面的做法是与业务相结合,从业务着手去进行数据补齐,通过专业数据处理公司去处理数据;通过济南市或者各个地方的大数据平台获取高质量数据;通过走入社区,采取采用大批量调研的方式获取一手数据。目前来看,最有效的解决方法,是通过网络援助方式,或者打通渠道来提升。另外,可以通过一些奖励机制让普通人去参与社会治理,主动分享数据。
针对李照川的观点,聂秀山提出问题:数据质量是对模型性能的核心影响因素吗?影响有多少?可以通过模型解决低质量问题吗?李照川表示,数据质量对具体业务、模型的影响会很大,具体影响的是精确度和机动性,但是对整个平台的影响较小。可以通过模型来进行数据矫正,比如通过标准化地址对低质量地址进行自动矫正。而有些指标,如老年人的身体状态,难以通过算法去弥补,只能通过硬件设备来收集数据。吕洪涛对聂秀山提出的问题有自己的理解,他表示数据质量这些问题,首先是数据采集设备的缺乏,例如摄像头等传感器,因为成本很高所以很难去大范围部署。但是目前手机的普及率很高,可以通过手机采取数据,比如收集百度搜索记录、输入法历史等数据。另外,手机同时拥有摄像头、加速度计、GPS定位等多种传感器,这些同样可以产生数据。但是现在存在的问题是如何激励普通人自愿去将输入法等数据上传到公安平台。这个问题的解决需要衡量成本和效益,在保障安全、隐私的前提下给与普通人足够的激励,让普通人参与到数据采集中去。另一个角度,数据质量评估也需要公认的标准,例如发生了一个社会恐怖袭击事件,旁观者可能冒着生命危险录制了现场小视频,而这个视频能够对公安系统破案提供帮助,那么如何科学衡量这个数据的贡献又是一个问题。孟雷认为吕洪涛观点的角度非常新颖:如何通过多端设备、多人协同地解决数据缺失问题。
对于数据缺失的问题,研究人群疏散建模方向的李梁发表了自己的看法:他表示人群疏散建模在真实情况下难以获取数据,可以采用模拟数据,通过规律总结行人运动中的约束条件,对于不能采集数据的极端情况,一律根据约束条件去计算极值,将所有空值划分为极值状态,这样可以保证模型的下限。另外,针对最容易发生踩踏事件的地方可以部署硬件设备。对数据和场景的理解来说,密集人群的运动相对简单,可以用宏观的简单模型加以预测80%的人群,但是剩下的20%比较困难,动力学角度难以解决,可以试试分形学方法从基础结构入手。陈关忠表示,针对低质量数据问题,有两种解决办法:增加传感器,和通过算法适应数据。前者需要在建模之前评估需要采集哪些数据,并在关键节点部署传感器;收集来的数据需要在传感器阶段进行一次数据处理,入库前再进行一步数据清洗,通过人工的方式剔除低质量数据。清晰的原则是根据业务规则来判断数据是否异常,并通过机器学习的方法来预测和补充数据。
主持人孟雷基于以上发言作出总结:针对数据缺失问题,经讨论后凝练出多采集数据、制定数据标准、从模型角度解决低质数据等观点,吕洪涛提出能否通过打通渠道解决数据缺失问题,李梁提出通过建模方式建立仿真数据。
思辨点2: 面对多源异构的治理大数据,如何围绕社会治理下游任务进行重要数据的挖掘?
主持人孟雷对思辨点2做出了补充说明:当拥有许多数据的时候,在具体任务中到底用哪些数据?是否有成熟的方法论去挑选数据?针对这个问题,吕洪涛表示:如何挖掘重要数据,可以通过联邦学习中的个体法和互补法来判断数据质量,个体法直接用不同的待评估数据去训练模型,通过模型质量反判断不同数据的质量和重要性。互补法则为用同行的模型去测试一下待评估数据。另外,可以使用贝叶斯方法,通过不确定性、熵的降低度量数据的价值。针对吕洪涛的观点,宋立莉补充说明:大数据中有许多重复的数据,我们可以通过奖励机制,从重复数据中根据时间和质量等角度进行数据清洗。除在对数据的依赖过程中建模以外,可以再加上人的决策,通过人机协同,提高这个算法的模型性能。
思辨点3: 人机协同能否解决低质业务数据处理问题?
针对人机协同问题,孟雷表示:人机协同也就是人在回路,目前有许多方法,用的最多的是众包、众筹,对缺失数据问题就可以采用众包众筹的方法去做标记,或者采用多人答案共性去提出较好的答案。李照川发表了自己的看法,他表示:低质量数据在实际业务中很常见,针对不同行业的数据,通过开发不同的专业小工具针对性进行数据收集、预处理,以清洗数据。同时清洗是多个环节的,每个环节人工对数据进行校对和批注,保证数据质量,构建半监督、人在回路的方法。也可以将人机协同中的具体现实人替换为相应的专家知识,以实现更好效果。
针对人机协同问题,盖伟提出疑问:我们需要思考面对低质量数据,如何结合一线人员的经验,将其融入到模型的训练,或者对低质量数据的弥补中去?模型具备强大的学习能力,在这个过程中如何能把人机更好地融合起来,在这个系统里面发挥人的作用?针对盖伟提出的问题,孟雷表示目前的人机协同有两种方式,第一种是人模拟机器,第二种是人和机器人去帮忙检测,但是两方如何合力完成一件事情仍旧很难。
子议题2:面向社会治理事件推演的多主体博弈技术
社会治理事件包含大量治理主体、要素、及其间的复杂交互关系,因此治理事件的推演具有博弈演化性质,需要使用复杂网络建模。与会专家就如何结合强化学习、多主体博弈、时序图卷积网络等计算模型建模社会治理模型的自主进化过程、能否使用博弈模型揭示社会治理事件的机理和演化机制等方面展开思辨讨论,形成以下输出:
思辨点1:社会治理事件的建模需要考虑哪些因素?难点在哪里?
针对如何对社会治理时间进行建模的问题,李西娜表示,首先需要确定博弈的主体,如政府和企业,其次要明确不同主体分别要达到的目的,通过各自的目标刻画目标函数,最后使其最大化或最小化。建模的过程中我们还需要考虑经济因素,环境因素,安全因素等影响因素。一般先在博弈论中建立一个目标模型,再在复杂网络中建立模型,网络节点人物根据所服从网络拓扑特征设定不同的网络类型,将博弈论综合功能的模型作为复杂网络中的规则。
针对李西娜的观点,主持人孟雷提出问题,要素建模的关键是确定主体,以疫情为例,博弈双方为政府和居民,个人的目标为完成日常生活,政府目标是减少人员流动。在社会治理环境下,选择要素是否很困难?在确定主体的时候,政府为一方,而居民具备同质性,也具备个性,一般会考虑居民的个性作为很多主体吗?李西娜表示,同质主体归为一个主体,不同质的划分为独立主体,一般来说至多四方主体。一般把很多居民同质化,认为是一类主体,与政府做两方博弈,不过也可以考虑居民的个性,将其视作复杂网络中的节点。针对复杂网络,孟雷继续提出问题:用复杂网络去建模是否存在难点?在推理上有什么难点? 博弈方多为两方,环境因素等事件影响因素可以有很多吗?李西娜表示,用复杂网络建模和推理,难点在于如何去刻画个性(异质性)。若博弈方多为两方,环境因素等事件影响因素可以有很多,把它们作为目标函数的一部分即可。
思辨点2: 社会治理事件的博弈模型该如何设计?
针对在博弈论中,社会治理事件的建模一般用什么模型问题:李西娜表示,社会治理事件的表示其实是选择博弈策略的问题,比如政府是否加强监督,企业是否遵守规则,根据不同的策略主体可以表现出不同的意愿。一般先在博弈论中建立一个目标模型,再在复杂网络中建立模型,网络节点人物根据所服从网络拓扑特征设定不同的网络类型,将博弈论综合功能的模型作为复杂网络中的规则。吕洪涛表示,运用博弈论,可以通过仿真建模单纯地进行推演决策,通过仿真实验推演系统的变化,这样可以处理更加复杂的场景,以疫情为例,例如政府希望降低感染者数量,居民决定是否做核酸以及多久做一次核酸,这些目标就是每一方主体的目标函数,通过仿真的方式来让系统自发地演化,通过一轮一轮的演化,我们可以看到最后的推演结果。从社会治理的这个角度,通过仿真的方式来用多主体博弈对社会治理中的实际问题进行建模是一个有效的路径。
针对多主体博弈方式,吕洪涛表示:博弈论的前提假设是,每一个参与者都是理性的,只优化各自的目标函数。目标函数下主体只做出最符合自身利益的决策,但是全局上可能存在资源浪费等问题。这种问题可以通过多主体博弈的方式进行刻画和描述,通过一些规则和工具来辅助主体做更好的决策。李照川针对吕洪涛的观点表示反对:他认为多智能体之间可能存在矛盾,需要彼此之间不断的沟通和交流,通过算法上或者其他更好解决办法,比如跟政府商讨的一些流程来化解矛盾。在基层治理中,矛盾纠纷调解很有效。
吕洪涛针对李照川提到的矛盾纠纷调解的方法发表了不同见解:他表示,博弈论中最主要的还是刻画主体的行为和目标函数,最终在博弈中达到多主体的稳态。我们需要把社会治理问题抽象为数学问题,判断其是否满足博弈论的两个基本假设,一是存在多个理性的参与方,每个主体需要优化自己的目标;二是个主体有自己可选的策略,且策略选择对其他主体存在影响。矛盾调解目前在数学上较难建模。
针对社会治理事件建模,杜萍表示人群疏散中主要是用社会力模型对人群进行建模,并采用传染病模型对情绪传染问题进行建模,当人群中产生情绪躁动时就容易引发一系列事件,通过设置安全员,降低人群情绪等方法可以防止情绪传染,让整个人群的情绪趋于缓和。这一方法同样可以应用于线上的情绪传播问题。
思辨点3:能否结合数据驱动的深度学习缓解传统博弈模型预设参数依赖?
针对博弈模型预测社会治理实践推演问题,李西娜表示,社会治理实践的推演中,不同博弈主体面对多个博弈策略的时候,在复杂网络中的决策会影响到其他人,并对其他主体的决策进行模仿学习。吕洪涛对李西娜的观点做了补充:他表示可以用博弈论的方法,构建一个数字化模型,从而能够对社会治理事件的演化进行一个数学方面的推理。多主体博弈技术是可以结合复杂网络以及博弈方,决策空间定义,以及每一个主体目标函数的定义,但是我们也通过讨论发现多主体博弈其实更适合于宏观性质的推演,比如居民,我们尽量把他们当成一个整体来看,这样可以让我们推理不会那么复杂,更好去处理我们的数据。我们需要对社会治理事件具备充分深入了解,这是确定角色目标函数和影响因素是否合理的关键,也是推演的前提。方法上可以采取对特定因素进行测试,判断加入特定因素前后对社会治理事件推演结果的影响。另外,我们可以通过深度学习技术,如通过图神经网络描述社会治理事件上的个体,通过数据驱动的方式进行推演和预测。
针对博弈模型预测社会治理实践推演问题,主持人孟雷结合研究领域发表了自己的看法:他表示自己精通的领域实际上是强化学习和时续的神经网络深度学习算法。强化学习是在当前状态之下我们如何去选择,这方面可以和博弈主体优化函数策略能结合到一起。目前去推理具体事件,推测视频里面会发生的事情,一般都会用到深度学习图卷积神经网络,例如,在矛盾调解中矛盾双方和调解方,对三个人之间的状态,进行建模,构建一个三方的小网络,小网络中会有若干的属性,属性可能很复杂,例如人的状态、年龄、与另外两方的属性等,然后需要做的并不是跟博弈论一样,确定在这个时候要采取什么策略来定义这个空间,而是先拿到具体的数据,例如矛盾双方在第一个时间点是什么状态,到第二个时间点,调解方的数据介入,矛盾双方状态变了,可能变好,也可能变坏。还有可能在第二时间点,调解方的数据没有介入,两方的状态又会有变化。我们会从数据驱动的方法去学习他们的状态在不同节点随时间演化,这一方面是我们通过神经网络,根据数据里状态变化,用数学模型进行建模,通过神经网络映射出来的结果。这些映射类似博弈论,可以知道每个时间点,每个节点的状态,这样就可以跟博弈论结合起来做到推演,可以推演治理事件可能发生情况,但是它没有办法做到博弈论所能够做到的仿真。深度学习算法只能进行推理,不能进行演化。
针对主持人孟雷的观点,吕洪涛做出了补充,他表示:可以通过一些深度学习方法,将矛盾调解场景里面简单的决策模式用图卷积神经网络定义出来去做仿真推演。如果不去做理论结果的推导,这就是相对容易的。基于这种推演虽然不是一种优化,但是依然可以在开始的时候调节一些参数来看看结果是不是能够变好,例如刚才的矛盾调解场景,需要定义什么样的概率会让矛盾双方的态度趋向于缓和,这种概率在我们现实生活中有没有一些因素能够去影响它?例如通过一些社会教育,让他们在遇到矛盾情况下,发生冲突的几率下降,这个参数的变化,我们可以通过主体博弈方式进行仿真或推演,通过这种多主体博弈的方式,来来判断什么样的参数对于最终的结果有什么样的影响,从而来辅助我们进行决策。
孟雷针对专家的观点进行总结:我们基本知道博弈技术在推演上的优势是主流的深度学习技术所达不到的,如果简单的只是对于事件进行推演的话,深度学习技术也是一个非常好的方法,将治理事件上面的人描述成图神经网络,可以数据驱动的方法进行一个预测。从另外一个方面,将多主体博弈用于社会治理事件的推演存在一定要求,一是建模主体要明确,同时要把决策空间等可能情况定义好,另外一个方面也可以结合一些数据驱动的方法进行,在进行一个策略上面的选择使得我们的推理更好一点。
子议题3:支撑社会治理全生命周期感知调控的数字孪生技术
数字化社会治理需要同时考虑治理场景的动态数据和数字化的静态业务数据,需要物理和数字世界之间的数据和计算资源实现互联互通,以及智能化推演和决策模型的实时调度。与会专家围绕“数字孪生技术的应用对社会治理事件感知、处理、调控整个流程中的作用”“数字孪生、元宇宙等前沿数字生态架构与技术如何为智慧社会治理的感知、交互和调度方式提供建设思路?”“数字化社会治理平台该以软件系统形态集成在数据中台进行统一存储、管理和调度,还是以云边端协调架构提升系统的时效、容量和算力的需求?”等话题展开讨论,形成以下思辨点及意见输出:
思辨点1: 数字孪生技术如何支持社会治理事件的全周期感知和调控?
孟雷针对思辨点1作出补充:数字孪生调控很重要,如果摄像头检测出不法行为,我们前去制止存在时效性的问题,那么采取在比较关键的节点提前布置一些硬件,如双向喊话摄像头,或者通过机器人机器狗去做类似的事情?针对这个问题,王薇表示,目前达不到这个程度,但是机器人可以进行行为捕获并对场景进行分析,观察、捕捉到治理数据,通过挖掘数据背后它存在的因果关系,建立发生的场景以及导致的场景之间的关联,以逐渐挖掘背后这个产生的规律。她认为在这方面可以做一些工作,将发现的规律融入到整个的社会治理的大框架里去。微观层次上机器人从所感知到的数据当中来挖掘出因果关系,决策层面上面对这种关系我们如何应对,比如在高层可以部署强化学习,然后实现层层往下实施,层层往上反馈。她认为机器人在未来的社会治理方面,一定会起到收集社会治理方面存在的各种问题的作用。但问题本身存在时效性,所以难以在当时就能发现其背后因果关系。但是通过将机器人角色融入到整体框架里面去,机器人可以通过算法实现自主学习。
盖伟提出问题,目前感知和交互的方法很多,一线操作中,数据孪生与现有方法的不同,有什么需要注意的呢?李照川表示,模型最看重的是稳定性和质量,以及能否完成客户要完成的事情?关键就是在于最后形成一些指标,体征和决策。主持人孟雷根据李照川观点中的指标继续提问:指标是否是提取出来的处理过的信息?交互设备还有其他作用和应用场景吗?李照川表示,指标可以理解为简单模型,简单模型再组装为复杂模型则为体征,下一步则是客户决策。如果能满足这几点,通过决策告知客户可信度,就能形成完整链条。针对交互设备的其他应用场景问题,李照川表示调研、咨询、虚拟数字人去解答是常见交互方式,其他的比如正规的有12345热线。
思辨点2: 面向社会治理场景的数字孪生平台该如何建设?
针对面向社会治理场景的数字孪生平台该如何建设的问题,李照川结合工作中实际项目重庆地区的智慧治理孪生系统做了介绍:他提到该系统对几个街区进行建模。建模的参与方有街道办、公安、消防、物业安保。可以通过物联网查看违法侵占情况,在其他应用场景,可以根据信息通知消防、公安等进行消防疏散,也可以进行事件的全程追溯。针对高空抛物场景,设置了高空抛物检测摄像头,该摄像头采用边缘算力,配备定制芯片等加速摄像头计算用来抓拍违法行为,通过成熟的工作流,实现跨部门联动,回传二维数据和基于空间的信息,能够第一时间联系相关方进行人员追溯。
针对专家李照川的项目介绍,孟雷提出问题,项目中提到了边缘算力,有没有将一些技术下放到摄像头上,是否是可编程的?相关的技术是购置设备内嵌的,还是可以二次编译进去的?有IPV6部署吗?李照川依次做出解答,摄像头可以进行编程开发,一般是通过定制芯片可以做到。摄像头的相关技术是通过海康大华定制的100多种场景实现的,可以根据具体情况进行调参。部署方面应用到了IPV6和区块链技术。
孟雷继续提出问题,刚才提到的身份识别主要是这个依靠边缘端,通过融合的相关技术融检测到一些事件,并反馈回传,如何对回传信息进一步处理。能形成业务闭环吗?反馈回传的信息多为二维信息、提示或者文本,对于三维实景有作用吗?数据是实时反馈在孪生场景中的吗?三维高空巡视可以做吗?李照川表示项目中有成熟的工作流,可以实现跨部门联动。回传的不仅是二维数据,也有基于空间的信息,如疫苗接种率,可以通过图谱根据不同的颜色展现地图中不同的接种率。实时信息的作用不是很大,出于安全考虑不允许信息的实时传递,但是通过定制机器可以实现。至于作用,比如只需要知道网格员任务分发和交付的进度,精力有限,并不需要知道每一秒网格员的工作。三维高空巡视就是社区安保巡查,通过划分定点,与工业互联网相结合,可以基于HoloLens实现动态识别,但成本很高,目前采取利用用户的手机进行摄像头导航方式。
针对面向社会治理场景的数字孪生平台建设问题,李新涉及数字景区方面工作,他通过列举景区建模的例子,提出有一种成熟的数字景区规划方案:通过对整个景区做建模,建立数字孪生系统,将所有的摄像头接入系统,实现数字孪生模型和VR导览相结合的功能,用户在景区可以享受推荐路线、景区知识点视频和音频的综合导览服务,同时也用到了目标检测、人脸识别等应用,这一方面和社会治理有一些业务存在相似和共通性。
孟雷针对讨论做出总结,智慧景区和社会治理都涉及到数字孪生,在总体架构上存在共性。VR导览等本身和社会治理的部分业务也很相似,但在底层会涉及到很多问题,如交互设备之间wifi连接的距离问题,三维场景存在显示卡的问题。
3.下午议程:论坛输出总结
图8.论坛输出总结讨论现场
经过3个小时的闭门论坛讨论,两个议题的讨论完成,接下来进行了论坛输出总结,该总结由议题一与议题二的主持人刘宁和孟雷进行总结发言,随后与会专家进行了热烈讨论,两个议题的观点输出在论坛的第三阶段输出总结讨论中进行碰撞优化,对于数字化助推社会治理的多个议题形成了共识,包括:
(1) 现有数字化社会治理手段亟待解决的痛点问题:一是平台的数据流转和异常反馈依赖网格员手动录入和预设阈值,业务数字化、自动化程度提升空间大;二是三维实景化建设基础设施不全、治理业务全周期的要素和数字模型缺乏,需要探索数字孪生等新技术新概念、以完成治理模式的渐进式改革创新。
(2) 社会治理数字化的技术需求:现有治理业务模式需要业务数字化和实景化建设、稳步实现数字化转型;需要结合人工智能和三维建模技术、打通治理业务自动化和实景化管控的技术瓶颈;需要结合大数据技术、人工智能技术、通信技术实现“强度整合、高度共享、深度应用”的数字化社会治理新理念和新模式,助力社会治理、经济发展和学术科研生态环境建设。
(3) 社会治理数字化转型的主要挑战:包括数据获取的精度、数据传输、数据管理和共享、数据治理建模复杂度、人工智能和业务场景的有机结合等。可以着重把数据治理的过程进行标准化,获取需求并把需求传达给研究人员,从而更好地应用于社会治理数字化转型。
(4) 社会治理场景的数字化建模手段:提出并形成统一的数据评估标准、使用联邦学习挖掘重要数据、通过人机协同方法进行数据模型矫正。
(5) 人工智能技术的使用:社会治理的数字化转型会遇到很多问题,而众多机器学习算法都可以在这个阶段进行助力。但同时要注意问题导向,具体问题具体分析,采用更具体更合适的算法和技术。结合复杂网络和主体博弈技术,能够对社会治理事件进行建模,而且需要对社会治理时间具备充分深入了解才能实现社会治理实践的推演。
(6) 社会治理数字化平台功能架构:需要结合数字化技术提升抗干扰能力强、精度高、通用性强、加速创新等优势,在算力方面比较推荐边缘计算,在满足算力需求的同时整个系统能够具有比较高的时效性。
(7) 实景三维建设:虽然三维模型受系统建设、信赖度不高、要价太高、数据量大、加载慢等现状所限,但在城市化高层建筑场景、地形外貌描述等场景,其应用场景远远大于二维模型,可以通过无人机扫描解决三维信息获取和精度问题,通过将重建模型存储在本地来解决因为数据量大而导致的加载慢问题。建模多种多样,还需要对数据有充分的了解。
(8) 数据隐私:联邦学习技术在保护隐私方面会有很大的作用,通过联邦学习可以让模型在各方数据之中训练更好的大模型,同时保护各方数据的隐私性,而且在社会治理中是有广泛应用场景的,比如警方的反洗钱工作、银行与公安数据互通问题等。
(9) 可信计算:涉及到决策可信问题,可以使用区块链技术,直接抽取规则的离散深度学习模型,决策树,基于示例的方法等,都可以帮助建立可信赖的决策模型,提供决策可信。但仍要注意,算法技术要根据应用而言,具体情况具体分析。