YEF2026 圆满收官 | “AI的黑暗森林：欺骗、失控与可信防线”专题论坛精彩落幕 - 论坛 - 中国计算机学会

返回YOCSEF首页

CCF官网 | 站点地图 | 联系我们 | 常见问题

CCF YOCSEF 新闻动态CCF Young Computer Scientists & Engineers Forum

论坛

论坛

Club

其他活动

文化

组织机构

关于论坛

新闻动态 > 论坛 > 论坛

YEF2026 圆满收官 | “AI的黑暗森林：欺骗、失控与可信防线”专题论坛精彩落幕

2026-06-09 阅读量:50 小字

YEF2026在四川绵阳圆满闭幕。大会以“智创未来”为主题，汇聚计算领域青年精英与知名专家，聚焦人工智能、智能体、智能安全等前沿方向，深化产学研交流，激发青年创新活力。

“AI的黑暗森林：欺骗、失控与可信防线”专题论坛也精彩落幕。随着生成式AI、多模态大模型与智能体技术快速发展，人工智能正从内容生成工具演进为能够感知环境、调用工具、执行任务并影响现实世界的智能系统。能力跃迁的同时，AI系统也暴露出更加复杂的安全风险：模型可能出现策略性欺骗，智能体可能产生越权操作与工具滥用，多模态系统也可能在开放世界中遭遇物理攻击、对齐偏差与错误泛化。

本论坛围绕“欺骗、失控与可信防线”三条主线，尝试从感知、认知、决策、执行与治理的完整链路出发，讨论AI安全从“模型输出安全”走向“系统行为可信”的关键路径。论坛由CCF YOCSEF厦门学术候任AC、厦门大学刘弘副教授和CCF YOCSEF合肥学术AC、合肥工业大学胡文波副教授共同担任主席。

论坛报告

本环节围绕“智能体失控、物理世界攻击、多模态可信、移动智能体安全”四个方向展开，帮助参会者建立AI安全的全栈认知地图。

清华大学董胤蓬助理教授作题为《智能体失控风险研究》的报告，指出前沿大模型正在从服从人类指令的工具走向可能具备策略性欺骗和抗拒关闭倾向的自主智能体。

南开大学郭青教授作题为《生成式物理攻击：从2D到3D的感知鲁棒性测试》的报告，指出生成式物理攻击是检验自动驾驶、安防监控和具身智能系统真实世界可靠性的重要压力测试方法。

南京大学吉炜副教授作题为《多模态智能的安全与可信：从对齐到开放世界》的报告，指出多模态可信学习需要从消除伪相关、量化不确定性，进一步走向开放世界中的可靠决策。

vivo AI安全专家王凯作题为《移动智能体的安全体系构建》的报告，指出移动智能体安全必须覆盖输入、规划、执行、接入、隐私与审计等全链路环节。

四场报告从前沿大模型失控、多模态感知攻击、开放世界可靠决策，一直延伸到移动智能体系统安全，展示了AI安全问题正在从单点模型风险演化为覆盖感知、认知、决策、执行与审计的系统挑战。

思辨交流

本环节围绕四个核心思辨议题展开，与会嘉宾和现场观众进行了充分交流。

思辨议题一：欺骗——AI是在理解人类意图，还是在学习通过测试？

本议题主要讨论AI是否真正理解人类意图，还是仅仅在优化奖励、迎合评测与通过测试；同时探讨普通错误、幻觉、对齐失败与策略性欺骗之间如何区分。

思辨议题二：失控——当AI拥有“手脚”，人类还能否及时按下停止键？

本议题主要讨论智能体从回答问题走向调用工具、操作设备和影响现实世界之后，如何定义失控边界，以及是否需要权限沙箱、安全熔断和紧急终止机制。

思辨议题三：可信防线——AI安全是模型问题，还是系统工程问题？

本议题主要讨论AI安全的研究对象是否应从单一模型输出扩展到完整行为链路，以及未来可信AI更依赖更强的安全模型，还是可观察、可审计、可追踪、可终止的系统架构。

思辨议题四：治理与责任——可信AI的终点是不犯错，还是可追责？

本议题主要讨论现实世界中的AI系统是否应以“永不犯错”为目标，还是应更强调风险可控、责任可查、过程透明和后果可追溯。

论坛总结

本次论坛围绕“欺骗、失控与可信防线”展开，从四场技术报告到四轮思辨交流，形成了对AI安全问题的系统性认识：AI安全已不再只是有害输出检测或模型对齐问题，而是覆盖感知鲁棒性、多模态可靠性、智能体行为控制、移动端权限治理、隐私透明、审计追责和社会治理的综合系统工程。

论坛进一步指出，未来可信AI需要完成三个重要转变：

第一，从“输出安全”走向“行为安全”。AI是否可信，不仅取决于它说了什么，更取决于它如何感知、如何推理、如何调用工具、如何执行任务。

第二，从“单模型防御”走向“全链路防线”。面对物理攻击、多模态对齐偏差、开放世界泛化、移动端权限滥用等复杂风险，单点防御远远不够。

第三，从“避免犯错”走向“风险可控与责任可追”。真实世界中的AI系统不可能永远正确，但必须在出错时能够被发现、被阻断、被解释、被追责、被纠正。

面向“智创未来”，AI安全不是创新的阻碍，而是智能系统真正走向现实世界、服务社会发展的基础设施。只有在欺骗可识别、失控可阻断、行为可审计、责任可追溯的前提下，人工智能才能从强大走向可信，从可用走向可托付。

热门动态

CCF YOCSEF 昆明成功举办 “小语种·大未来” 技术论坛

2025-08-11

CCF YOCSEF 昆明成功举办“小语种·大未来”技术论坛聚焦东南亚与...

"科创引领智汇庐州" CCF YOCSEF合肥十五周年庆典圆满落幕

2025-12-02

2025年11月22日，中国计算机学会青年计算机科技论坛（CCF YOCSEF...

CCF YOCSEF合肥顺利举办“三维场景信息建模和传输技术未来发展之路”深度技术论坛

2025-09-29

承担社会责任提升成员能力2025年9月6日，CCF YOCSEF合肥顺利举...

CCF YOCSEF 合肥成功举办技术论坛“车间物理定律VS云端数字理想-如何突破大模型赋能智能制造困局”

2025-08-01

2025年7月12日，CCF YOCSEF 合肥成功举办技术论坛“车间物理定律...

传承进取 | CCF YOCSEF合肥召开第十五届学术委员会第一次会议

2025-07-08

2025年6月28日下午，CCF YOCSEF合肥分论坛第十五届学术委员会第...

CCF YOCSEF 合肥顺利举办技术论坛“从基座模型到终端应用：洞察大模型落地终端应用的产品形态与核心技术”

2024-08-27

2024年8月3日，CCF YOCSEF合肥顺利举办技术论坛“从基座模型到终...

CCF YOCSEF 成都成功举办“AI+Science: 跨界融合、机遇与挑战”技术论坛

2023-05-05

AI为科学提供了强有力的工具和方法，帮助领域学者发现新的知识、...

CCF YOCSEF成都成功举办“国产基础软件的自主可控发展之路在何方？”观点论坛

2023-03-24

2023年3月18日，CCF YOCSEF成都在四川省成都市五岳宫街28号成都...

CCF YOCSEF成都成功举办“城市智慧交通感知分析的窘境和出路”观点论坛

2023-03-02

近十年，我国交通运输事业取得了历史性成就，发生了历史性变革，...

CCF YOCSEF成都举办“峨眉论剑”深度闭门技术论坛可信联邦学习赋能数字经济的实用三角技术路径

2023-01-12

2023年1月7日-8日，CCF YOCSEF成都在四川省峨眉山市峨眉山...

CCF YOCSEF成都学术委员会成功举办“当行为数据分析遇上云边智能”技术论坛

2022-11-13

CCF YOCSEF成都成功举办“当行为数据分析遇上云边智能”技术论坛...

CCF YOCSEF成都学术委员会成功举办22-23 “青城问道”深度观点论坛：数智化时代乡村振兴的道与术

2022-11-03

习近平总书记在二十大报告中指出：全面推进乡村振兴，加快建设农...

YOCSEF深圳举办 “新一代知识图谱技术推动金融业务数字化转型”技术论坛

2022-08-25

2022年8月20日，中国计算机学会（CCF）青年计算机科技论坛（CCF ...

CCF YOCSEF成都学术委员会成功举办22-23 “青椒”育人观点论坛

2022-08-16

2022年8月13日下午，由中国计算机学会（CCF）主办，CCF YOCSEF成...

YOCSEF深圳成功举办量子计算技术论坛

2022-08-16

   7月25日，由CCF主办、YOCSEF深圳承办，国家超级计算深圳中心...

YEF2026 圆满收官 | “AI的黑暗森林：欺骗、失控与可信防线”专题论坛精彩落幕

2026-06-09

YEF2026在四川绵阳圆满闭幕。大会以“智创未来”为主题，汇聚计...

YEF2026专题论坛｜“面向复杂低空场景航行故障检测的智能化发展之路”专题论坛成功举办

2026-06-04

2026年5月23日下午，作为中国计算机学会青年精英大会（YEF2026）...

YEF2026专题论坛｜“具身智能的‘楚门世界’：是重塑物理世界的革命，还是活在算力与资本里的‘幻觉’”

2026-06-03

2026年5月23日下午，作为中国计算机学会青年精英大会（YEF2026）...

YOCSEF济南在CCF YEF 2026上成功举办观点论坛：具身智能数据困局:“模拟炼金"与“现实拓荒”，路在何方?

2026-05-26

当前，具身智能正成为人工智能发展的新范式，而数据获取成本...

CCF YOCSEF总部举办特别论坛“养虾者说：OpenClaw猛于虎也？”

2026-03-18

CCF YOCSEF特别论坛“养虾者说：OpenClaw猛于虎也？”于2026年3月15日在京举办。围绕AI Agent的真实能力边界、技术演进路线及其对社会结构可能产生的重塑影响，与会者展开深入思辨，力图在热潮之下寻求理性的“养虾”之道。

CCF聚焦

CACC创业赛道开启报名

聚焦高质量发展目标——CCF 执行机构负责人会议在吉林市举行

CCF 秘书处召开推动学会高质量发展专题研讨会

中国计算机学会第十三届常务理事会第六次会议在吉林市召开

中国计算机大会（CNCC2026）邀请函

FCES 2026早鸟优惠延长至7月13日，精彩议程全面揭晓！

人工智能通识课，如何从“开起来”走向“开得好”？| FCES 2026分论坛

具身智能普惠开发与深度产业落地 | TF技术前线181期报名

AI时代复杂工程问题如何教？——计算机类专业工程教育认证的新要求与新实践 | FCES 2026分论坛

陈熙霖研究员：计算机学科正迎来“涅槃时刻”？ | FCES 2026大会特邀报告重磅来袭

课堂讲授，在AI时代过时了吗?——智能时代计算机课堂的坚守与重构 | FCES 2026分论坛

智能时代的计算机系统课程重构 | FCES 2026分论坛

潘毅教授：新型研究型大学如何建设？深圳理工大学的创新实践 | FCES 2026观点报告

七月为何赴重庆？来自重庆师范大学的一封FCES 2026参会邀约

胡事民院士：AI通识教育如何真正落地？| FCES 2026大会特邀报告重磅来袭

AI时代的智能体先锋论坛 | TF技术前线180期报名

周傲英教授：数智时代的数字素养和数字技能 | FCES 2026大会特邀报告重磅来袭

2026年度CCF会士提名工作启动

AI正在改写人才标准，计算机专业学生该练什么能力？| FCES 2026分论坛

当AI会写代码，编程课和软工课还怎么教？| FCES 2026分论坛

AI如何重塑计算机核心课程？| FCES 2026分论坛

智能体加速金融创新 | TF技术前线179期报名

CCF关于举办2026 LMCC青少年组认证的报名通知

CCF科技咨询委员会赴济南高校开展计算机学科建设咨询

ADL170《AI Coding》开启报名

CCF中小学大模型教育提纲

CCF科技咨询委员会赴长春高校开展计算机学科与专业建设咨询

祝贺！陈熙霖研究员、冯丹教授等17位CCF会员荣获第四届全国创新争先奖

关于提名2026年度“CCF王选奖”候选人的通知

2026年CCF会员活动中心活动计划发布，助力会员专业发展