党的二十届三中全会决定“建设和运营国家数据基础设施,促进数据共享。加快建立数据产权归属认定、市场交易、权益分配、利益保护制度,提升数据安全治理监管能力,建立高效便利安全的数据跨境流动机制。” 2024年10月18日,国家数据局向全社会公开征求《可信数据空间发展行动计划(2024—2028年)(征求意见稿)》意见建议,明确提出:“可信数据空间是基于共识规则,联接多方主体,实现数据资源共享共用的数据流通利用基础设施,是数据要素价值共创的应用生态,是支撑构建全国一体化数据市场的重要载体。”。在此背景下,CCF YOCSEF太原于10月20日在太原智创城C座黄大年茶思屋举办了“可信数据空间-如何夯实数据要素流通基础设施”技术论坛(编号:CCF-Yo-24-041),本次论坛由中国计算机学会主办,由CCF YOCSEF太原组织,来自政府、科研院所、高校、企业的40余名相关专家参会,共同围绕国家数据基础设施规划,以及可信数据空间的关键技术原理、核心理念、应用实践和面临的主要问题展开讨论,为夯实数据要素流通基础设施,推动我国数据要素的可信管控、高效流通与价值共创提出了有价值的意见建议。
本次论坛由山西省数字政府服务中心副研究员、CCF YOCSEF太原现任主席张国业和晋中职业技术学院副教授、CCF YOCSEF太原AC委员韩英担任执行主席,山西省投资集团信息技术有限公司智慧监督负责人、CCF YOCSEF太原AC委员许骁哲和太原理工大学讲师、CCF YOCSEF太原委员郭松波担任线上主席。
论坛开场,由执行主席张国业和韩英对建设可信数据空间基础设施的重要意义进行了介绍。可信数据空间是实现数据资源共享共用的数据流通利用基础设施,是数据要素价值共创的应用生态,是支撑构建全国一体化数据市场的重要载体。统一共识、完善相关标准规范显得尤为重要。本次论坛邀请南京大学数据管理创新研究中心教授夏义堃、北京邮电大学计算机学院教授高志鹏、华为云数据要素解决方案总监郑辉进行引导发言。清华大学互联网产业研究院研究员林炜、西安电子科技大学经济与管理学院教授刘爱军、山西浪潮云计算信息科技有限公司总经理王培礼、山西电信云中台二级经理董炳泉针对思辨点进行特邀发言。
引导发言
第一位引导嘉宾是南京大学数据管理创新研究中心教授夏义堃,她以《国内外数据空间政策、研究现状、实践案例与运营模式》为题进行了发言。夏义堃回顾了全球数据空间的发展脉络、实践进展与政策布局,反映了全球对数据共享与互通的高度重视。她指出尽管各国对于数据空间的概念界定略有差异,但核心理念一致,即致力于将数据空间打造成推动数据高效流通的关键基础设施、数据赋能产学研发展的可信数据生态。在实践中,各国通过战略布局、基础架构、共识规则等建立了完备的互操作标准与信任机制、质量保障机制、交易机制,确保数据的高效、安全流动。
夏义堃从技术、生态和价值三个维度对数据空间进行了详细分析。技术维度包括数据管理、分布式系统和人工智能等多领域技术的融合;生态维度则致力于从制度、主体等推动可持续的数据流通利用体系建设;价值维度则强调跨组织的价值链构建与数据运营模式的创新。
图4 为夏义堃教授颁发感谢证书
第二位引导嘉宾是北京邮电大学计算机学院教授、博导,网络与交换技术国家重点实验室教授高志鹏(CCF YOCSEF 2023-2024届主席),他以《可信国家数据基础设施初探》为题,介绍了中国在数据要素领域的政策演进和技术进展。2019年,数据首次被正式纳入生产要素范畴;2020年,中共中央和国务院发布文件明确数据市场化配置的重要性;2022年,“十四五”数字经济规划发布,进一步强调数据作为继农业和工业后的重要经济形态;2023年,国家数据局挂牌并推出首份数据要素三年行动计划;2024年,重点推动“数据要素×工业制造”等行业应用,并明确数字中国建设的年度工作重点。这些政策表明,国家对数据要素的重视和支持不断加大,数据已成为数字经济时代的重要生产要素,并对GDP增长贡献显著。
他强调,国家层面已将数据要素作为生产要素,并不断完善数据治理框架。特别是在去中心化数据流通中,如何提升数据的可靠性、评估数据价值,以及应对数据错用和数据遗忘等问题,是当前的研究重点。志鹏指出,未来数据流通的核心在于如何构建可信的数据生态系统,技术上则需要通过多方协作来提升数据贡献的精确度和可靠性。
第三位引导嘉宾为华为云数据要素解决方案总监郑辉,他以《华为数据空间实践分享》为题,分享了华为在数据空间方面的实践经验。他提到,数据已经从企业作为IT基础的一部分(信息化建设、数据架构)逐步演变为企业的战略资产(数据汇聚、共享、决策支持、安全保障),最终成为推动经济的生产要素(数据主权、数据云生态、社会公平和价值实现)。业务流程方面,通过数据集成实现效率提升,通过数据汇聚促进卓越运营,并通过数据交换创造业务价值。数据集成阶段主要关注数据的聚合与权限控制,数据汇聚通过数据湖优化数据消费和应用,而数据交换则确保组织间的数据共享和使用规范。此流程体现了数据价值从整合到应用再到交换的逐步递进,推动企业数字化转型与创新。
郑辉进一步介绍了华为的《EDS(可控数据主权交换)标准框架》,该框架通过规范化的数据主权控制,确保在数据交换过程中的透明性和安全性。华为在标准框架设计方面积极参与国内外数据流通相关标准的制定工作,旨在推动全球数据生态的协同发展与互联互通。此外,郑辉还展示了华为在国内外数据流通标准制定中的积极参与,强调了全球数据生态协同发展的重要性。图8 为郑辉总监颁发感谢证书
思辨环节
在思辨环节,与会专家围绕“可信数据空间”的技术实现、数据权益隔离与控制、数据要素流通模式等核心议题展开了热烈讨论。
思辨点一:“可信”目标背后的技术支撑及实现方式?
在讨论“可信”数据空间的技术支持和实现方式时,专家们一致认为技术可信性和制度可信性同样重要。山西浪潮云计算信息科技有限公司总经理王培礼作思辨发言,他以浪潮为例,作为数商,在数据交易中心提供了重要支持,但也面临着跨域数据采购、数据采集方式单一、数据可信性等方面的挑战。为了应对这些挑战,王培礼提出构建统一的数字身份体系,以及分布式存储技术来解决跨域数据流通和可信性问题。
图9 山西浪潮云计算信息科技有限公司总经理王培礼作思辨发言
与会专家结合自身研究领域和实践经验纷纷发表见解,主要观点总结如下:跨区域、跨领域的统一身份认证是前置工作,国家层面要统筹推进;数据流通的可信性主要依赖于身份可信和数据质量可信,数据身份管理应在隐私保护的前提下进行授权,确保数据的合规性和安全性;同时,严格把控数据质量,特别是在模型构建和数据分析中,避免不良数据的混入至关重要;特定行业如煤炭和能源,应优先构建数据要素的顶层设计,引入服务类企业,推动数据生态协同发展,并通过隐私计算技术保障数据共享和使用过程中的安全性;数据空间的建设不仅依赖技术的可信,还需要建设方具备足够的组织可信性和技术能力;目前,虽然部分企业技术水平较高,但统一的规则和标准尚未形成,需借鉴碳排放规则,对供给方实施牌照制度,确保数据流通的合规性和安全性;可信性应通过技术手段实现公开、公正、公平的评估,避免定性化,应从数据提供方、使用方、平台方和监管方等角色的需求出发,结合技术和政策框架解决问题;此外,可信体系涉及多维度,不仅包括技术,还涵盖制度、数据来源、机构和项目交易行为;提升全球数据标准的领导力也至关重要,当前中国在全球数据标准建设中的领导力不足,影响了数据和服务的输出;构建数据可信空间时,制度和技术手段的不足是现有问题的主要原因,因此,确保数据确权和合规性,并通过顶层设计推动数据的可信流通至关重要。与会专家达成普遍共识:“可信”是数据要素高效流通的关键基础,是数据基础设施需要解决的核心问题。
思辨点二:“空间”技术如何确保数据权益的隔离与控制?
针对空间技术如何实现数据要素资源互通、共享共用、规则约束、多方参与、权益边界等,做好数据权益的隔离与控制问题。山西电信云中台经理董炳泉进行了思辨发言,他认为,在跨领域交流中,业务协同和数据要素流通需要有一个清晰的角色划分和平台建设。以电信的物联网场景为例,通过双碳管理实现了企业内部碳排放的全面控制,数据流通中的隐私和安全问题,必须通过分区管理、权限控制和第三方认证等手段来保障。
图11 山西电信董炳泉作思辨发言
思辨点三:可信数据空间如何构建数据要素流通模式?
关于可信数据空间通过建立可信管控能力以保障权益、资源交互能力以实现高效流通、价值共创能力促进收益公开透明等,构建数据要素流通模式。清华大学互联网产业研究院研究员林炜认为,数据流通的关键在于供给问题,很多数据无法进入市场流通,这需要通过构建统一的市场和基础设施来解决。他提出了三步构建方案:首先是完善数据的全流程管理,包括从数据进入到销毁的过程;其次是配套工具和产品的开发;最后是引入第三方生态,以确保数据空间内的生态系统完整。西安电子科技大学经济与管理学院教授刘爱军指出,数据要素流通是一项复杂的系统工程,面临四大难题:基础理论不够凝练、管理机制不清、技术运用模式不明确以及工程牵引范式不足。他提出了“企业-行业-跨行业”三步走战略,通过逐步完善数据生态,推动数据服务和流通的高效发展。
图13 清华大学互联网产业研究院林炜作思辨发言
图14 西安电子科技大学刘爱军作思辨发言
与会专家结合自身研究领域和实践经验纷纷发表见解,主要观点总结如下:数据流通模式源于供应链和平台的发展,其区别于传统平台运营,侧重于构建可信的环境保障数据的安全流通;从买方和市场的角度构建数据流通模式至关重要,必须分行业进行、尊重数据所有者并发挥市场价值,才能建立可持续的模式;同时,发掘数据本身的价值,创建新的商业模式来实现数据价值的倍增;在跨企业数据服务管理中,建立规范的数据收集标准和管理框架,有助于提升数据管理水平,实现企业间高效的数据流通与变现;政府内部的数据共享仍存在“不愿、不敢、不会”的问题,主要由于基础设施和标准的不完善,信任问题是核心障碍;国家数据局推动数据空间建设,旨在解决多方数据流通中的不信任问题,需建立规则和技术体系,确保数据的共用、共享和价值创造;可信数据空间在数据流通中起到安全保障的辅助作用,而非主导力量,重点是为各方提供信任支持。价值共创也是核心,运营者需制定透明的规则和数据评估模型,结合地方特色提升透明度与可信度,激励数据产品开发与交易,推动多方协同发展,打破数据孤岛,实现数据的广泛应用与高效流通。与会专家达成普遍共识:构建可信数据空间的核心在于通过建立统一规则和技术体系,解决数据流通中的信任问题,实现多方协同、价值共创、广泛应用与高效流通。
最后,YOCSEF太原现任主席张国业作了总结发言,向清华大学互联网产业研究院研究员林炜、西安电子科技大学经济与管理学院教授刘爱军、山西浪潮云计算信息科技有限公司总经理王培礼、山西电信云中台经理董炳泉4位特邀嘉宾颁发了感谢证书,向本次论坛的重点支持单位数据要素创新与经济决策分析山西省实验室、华为云计算有限公司表示感谢。此次论坛正值国家布局数据基础设施的关键时期,为推动国家和山西省在可信数据空间基础设施方面的建设提供了思路和建议。参会专家们也达成了一定共识,认为数据作为生产要素,其高效流通和可信保障将成为数字经济的重要引擎,而要实现这一目标,不仅需要技术上的创新,还需要制度、政策和生态的共同支撑。
图16 YOCSEF太原主席张国业作总结发言
图17 为思辨嘉宾颁发感谢证书图18 为支持单位颁发感谢证书