2025年11月22日,中国计算机学会(CCF)主办的“应急救援场景下无人机AI视觉模型的创新突围”技术论坛在河北大学顺利召开。论坛由中国计算机学会青年计算机科技论坛(CCF YOCSEF)保定学术委员会组织举办,YOCSEF保定学术秘书彭锦佳(河北大学)、AC委员张少康(河北大学)担任执行主席。来自高校、科研院所及企业等共计二十余个单位的四十余位嘉宾共同探讨无人机AI视觉模型如何助力应急救援。
论坛开始,少康首先介绍了CCF YOCSEF及其文化。随后,锦佳介绍了本次论坛的背景:河北省地处华北平原,地形复杂,受气候变化影响,地震、洪涝、森林火灾等灾害威胁加剧,传统救援方式面临时效性不足、信息覆盖有限等挑战。而无人机凭借高空视角与智能分析能力,已成为破解救援难题的关键工具,但当前技术仍存在多模态交互能力弱、实战与仿真差距大等瓶颈。现有AI视觉模型已经赋能医学、交通、缺陷检测等场景。结合河北省实际需求,汇聚产学研多方力量,探索如何通过多模态融合、云端协同等技术突破,提升无人机在复杂灾害场景中的自主决策与实战效能。
引导发言
在引导发言环节,四位嘉宾分别从无人机下的目标监测和跟踪、无人机图像感知、无人机应急救援应用以及具身智能体规划决策等方面分享了实际需求与技术前沿,为后续的思辨讨论奠定了扎实的专业基础。
刘帅(河北工业大学副教授)在《面向无人机航拍的多目标检测与跟踪技术研究》引导发言中,聚焦无人机航拍下的小目标旋转检测与跟踪。针对目标尺寸小、分布密、方向各异等挑战,提出以旋转框替代水平框,降低重叠率。创新采用极坐标射线法,将角度回归转为距离回归,提升边界定位稳定性;结合注意力机制融合中心与轮廓特征,增强小目标感知;并引入频域表征提升目标区分力。在多目标跟踪方面,采用检测跟踪一体化模型,集成Transformer进行长时序关联,适应无人机运动下的非线性轨迹变化,有效应对遮挡与身份跳变问题,整体提升系统鲁棒性。
白慧慧(北京交通大学教授、博士生导师),在《无人机图像智能感知方法研究》引导发言中,重点对无人机图像感知中面临的目标纹理特征的特殊性、外部环境的高度动态性、无人机视觉数据的局限性三个方面进行介绍。一是针对无人机图像编码存在跨域网络传输不稳定的挑战,提出构建自适应网络的图像编码框架;二是针对在无人机图像增强上多样任务终端难适配的挑战,提出优化跨终端适配的图像视频处理方法,包括通用的多源视觉并行增强架构、基于双注意力机制的视频超分、复杂降质图像的统一增强模型;三是针对无人机视觉分析,提出融合无人机自信息的语义分割与目标检测互优化方法。最后在总结与展望中,提出下一步要完善专用于无人机行业智能感知的图像数据集,开展面向感知的智能数据集互反馈推荐方法研究。
陈虎(北京威斯博科技有限公司CEO)在《AI视觉赋能无人机:应急救援中的感知突破与应用实践》引导发言中,聚焦AI视觉无人机如何破解应急救援中的传统痛点。在灾害预警方面,通过多模态传感器融合与高精度三维建模,实现对桥梁边坡等隐患区的毫米级形变测量,将响应模式从事后升级为灾前。在生命搜救中,针对目标被遮挡、环境复杂等挑战,利用蜂群协同与红外/可见光融合检测技术,穿透遮挡、全域覆盖并智能滤除误报,显著提升“黄金72小时”内的搜救精度与效率。这些应用的核心在于技术突破:无基准自主导航适应极端环境,多模态感知实现精准障碍识别,全流程AI驱动形成“感知-决策-行动”闭环。通过产学研协同与数据迭代,持续提升复杂环境下的适应性,为应急救援提供高效、安全的技术保障。
朱正秋(国防科技大学数智建模与仿真国家级重点实验室)在《面向城市感知的具身智能体规划决策方法》引导发言中,重点探讨人机物协同的智能感知。在任务规划层面,针对应急救援等动态场景,提出了空地协同的异构群体强化学习方法,并创新性地引入大模型进行约束松弛,以自主优化任务分配策略。在任务执行层面,聚焦城市场景的两大挑战:一是突破了现有具身感知问答多局限于室内的现状,提出MOEQA模型,在城市场景问答任务中达到人类60.73%的准确率;二是针对城市无人机视觉搜索的空白,构建了融合动态语义、认知吸引与不确定性的多源地图,为复杂环境下的自主目标搜索提供了新方案。未来工作将重点聚焦于物理模拟器、世界模型等方向,以推动技术进一步发展。
思辨环节
在思辨环节,参会嘉宾围绕无人机AI视觉模型在应急救援中的核心瓶颈、比较应急救援场景与已有技术的差异、构建高效模型的具体路径展开讨论,肖廷乐(北京天弘基业科技发展有限公司)、刘帅奇(河北大学)、翟永杰(华北电力大学)作为特邀嘉宾发言。
议题1:应急救援场景中无人机AI视觉模型应用的核心瓶颈是什么?
当前AI模型的根本局限在于其智能范式与人类认知存在差距。肖廷乐指出,AI依赖海量精确数据,缺乏人类从少量样本中提取本质特征的抽象能力,难以应对目标变形、变色等外观变化。周国亮从电网应用实践出发,也认为提升大模型的泛化、理解和思考能力,实现零样本检测是关键。胡哲东进一步补充,模型需具备对场景和目标的增量学习能力,以快速适应未知情况。
应急救援场景的极端复杂性和不确定性,对模型的鲁棒性提出了极致要求。史青宣系统阐述了环境、目标及感知响应的三重不确定性,强调需求应从精度优先转向稳定可靠和高召回率优先。刘帅奇和刘帅都指出,实际场景的复杂性远超模型现有处理能力,预训练数据难以覆盖所有灾害情况。张畔和齐静则从实战角度证实,每次灾害情况独特、条件苛刻,模型通用性不足且缺乏样本训练。
数据的稀缺性严重制约了模型的训练与泛化。齐静明确指出,灾害样本难以获取是模型训练面临的主要困难。李硕士提出可通过AI生成数据来部分解决,但这又对生成数据的真实性和有效性提出挑战。陈虎则期待新算法的出现,以突破对特定场景数据的过度依赖。
在系统层面,算力、传输与前端智能的平衡是落地应用的现实瓶颈。杨威和王祝都强调了前端视频回传的稳定性以及机载算力的重要性。史青宣指出通信中断要求系统必须具备前端离线感知与决策能力。尹红涛则点出无人化系统结果不可信的核心是准确度问题。
议题2:应急救援场景下对AI视觉模型的要求与已有技术有何不同,差距体现在哪里?
应急救援场景要求模型实现根本性的任务范式升级。刘帅奇指出,需从简单的目标感知转向对复杂环境的整体“态势感知”,识别广泛性优先于精确性。翟永杰和贾楠强调,任务从单一、固定变为动态、多任务切换,要求模型具备强大的自主协同与自适应能力。王珺进一步指出,这已超越单一视觉范畴,需要与飞控、多传感器等进行跨学科协同,实现从“视觉模型”到“决策系统核心”的跃迁。
极端环境对模型的核心能力提出了近乎矛盾的高要求。柳凌燕指出,需在有限算力下保证精度,模型轻量化是刚需。王祝和廷乐认为,需引入视觉语言模型的高层推理能力,并让AI模仿人类的高效学习与逻辑判断,实现“主动视觉”,能自主规划观测角度。徐正夫和陈虎提出,通过多机通信、多源数据(如激光雷达)融合来弥补单一视觉的不足,构建更鲁棒的感知系统。
嘉宾普遍认为,不能简单套用现有通用模型,而需构建应急救援专用技术体系。刘帅奇和白慧慧倡议,应开发针对应急救援的专用模型、评价标准和数据集。刘帅强调,在此场景下“宁可误判不能漏判”,成本非首要考虑,可靠性优先,需创新算法技术。张畔指出,模型应更依赖特征分析而非图像分辨率,以适应恶劣条件下的感知。王珺则区分了通用大模型与专用模型的适用场景,强调应急领域需要“精而专”的解决方案。
议题3:如何多维度构建高效无人机AI视觉模型以赋能应急救援?
部分嘉宾主张采取更务实、高效的路径,基于现有成熟技术进行适应性改进。例如红涛认为,开发全新算法架构周期过长,对成熟算法进行微调能更快适用于应急救援场景,并可结合地面基站算力来弥补无人机自身算力不足。王祝也支持此观点,指出在多数情况下,通过图像增强等传统方法已能解决不少问题,应优先考虑实效性。陈虎从具体技术(如红外识别)出发,说明了在现有算法框架下集成多种感知模态的可行性。
部分嘉宾则强调,必须进行根本性的创新,而非仅对现有技术修修补补。张畔和刘帅明确指出,仅靠微调现有算法可能无法满足高质量要求,需要探索新的算法架构或框架,从根本上提升技术基线以适应新场景的复杂性。翟永杰虽认为“全新”一词过于绝对,但也强调需要探索能够协调多种任务的“新方法”或系统架构,这超越了简单的算法微调。
部分嘉宾提出了超越“二选一”的辩证思路,主张双轨并行。王珺的观点比较具代表性,他指出探索全新架构是前瞻性的科学研究,而为当前场景提供解决方案是实践落地,两者应同时进行。柳凌燕也认为,传统模型与(大模型等)新技术并非替代关系,而是协同关系。翟永杰进一步补充,真正的落地是一个集成创新过程,需要政产学研用多方协同。
论坛总结
论坛在热烈的思辨中落下帷幕,主席王祝对思辨进行了总结。与会嘉宾从“无人机AI视觉模型的核心瓶颈”到“现有AI模型应用到无人机上的差距”,再到“构建高效无人机AI视觉模型”,打开了无人机AI视觉模型发展的多重视角。每一个观点的碰撞,每一次思路的拓展,都在为无人机技术更好地服务社会、赋能未来铺路。
CCF YOCSEF保定分论坛简介
CCF YOCSEF保定分论坛于2018年5月22日成立,以扎根保定,立足河北,辐射京津冀,激活河北CCF生力军,发出河北声音为目标,为大家提供了交流、合作、发声平台。保定分论坛历任主席杨晓晖(河北大学),何志强(河北金融学院),鲁斌(华北电力大学(保定)),赵振兵(华北电力大学(保定)),刘帅奇(河北大学),王珺(河北大学),何振学(河北农业大学),王祝(华北电力大学(保定)),自保定分论坛成立以来共举办论坛、报告会、沙龙等各种形式的活动百余场。
欢迎河北地区高校与企业届加入CCF YOCSEF保定学术委员会!
欢迎企业和媒体朋友与CCF YOCSEF保定接洽,探讨学术交流、媒体报道、活动赞助等相关事宜!
联系人:尹红涛(15810730208)















