分论坛 > 福州 > 新闻动态
CCF YOCSEF福州成功举办《后深度学习时代,计算机视觉技术如何走向未来?》技术论坛
2020-12-27 阅读量:851 小字

背景

  计算机视觉是人工智能的“眼睛”,是感知客观世界的核心技术。进入21世纪以来,计算机视觉领域蓬勃发展,各种理论与方法大量涌现,并在多个核心问题上取得了令人瞩目的成果。深度学习是近年来计算机视觉技术发展的核心,虽然取得了巨大成功,但它具有明显的局限性。与人类视觉系统相比,深度学习在通用性、灵活性和适应性上要差很多,而在遇到复杂的自然图像时,深度学习可能还会遇到机制性困难。随着研究人员开始处理越来越复杂的视觉任务,他们所面临的最严峻的挑战是如何开发能够处理组合性爆炸的算法还是对GPU的规模和计算能力的提升或是对数据规模的依赖呢? 而关于这一问题的深入探讨与交流,正是本次论坛开展的核心目的。

主题一:医学影像AI在应用、数据和算法三者之间

  医学影像识别作为计算机视觉一个重要应用,正不断向着深化、多元化的趋势发展,传统的2D影像也正向3D立体(甚至4D)影像前进,其间AI在图像分析过程发挥的作用日益显著,经过多年的深耕,中国医学影像AI进入了一个理性、健康发展的关键时期。而医学影像AI在应用、数据和算法三者之间又紧密关联。

  论坛第一位分享嘉宾是来自深圳大学医学部生物医学工程学院雷柏英研究员,她为我们带来的主题是《纵向多模态信息用于脑疾病诊断和预测方法研究》的技术讲座。

  雷柏英研究员首先以“多模态多时间点脑疾病诊断和预测方法和应用”为主题展开了演讲。首先,雷博士介绍了脑疾病的影响及机器学习、深度学习和数据挖掘方法在脑疾病诊断方面的研究现状,重点介绍了利用机器学习等计算机视觉方法在阿尔茨海默病、帕金森病、自闭症等脑疾病诊断方面的研究成果;并针对患者特异性高、个体差异性大、神经影像维度高等难点问题,基于特征学习算法和探究脑网络的构建,进一步挖掘脑部功能退化与脑区激活状态之间的内在联系,在大量实验分析得出基于纵向多模态信息方法建立的脑疾病早期诊断模型可以有效提升了脑疾病的诊断与预测准确性。

  论坛第二位分享嘉宾是来自福州大学余轮教授,他为我们带来的主题是《创新应用,把握新时代给与我们的机遇与挑战》的讲座。

  余轮教授接着以“创新应用,把握新时代给与我们的机遇与挑战”为主题展开了演讲。首先,余教授博士介绍了人工智能发展热潮发展带来的机遇与挑战,认为:“尽管深度学习有许多的优势,但是也有许多致命的弱点:黑匣子、不可解释性、脆弱性、需要大量数据标注”,就像叱丹佛大学人工智慧实验室主任李飞飞说法称,AI虽是个“真货”,但也在许多随意和缺乏严谨性的交流或展示中被强烈地夸大,进而影响政、商、投资者。然后,余教授以“人工智能与标注的思考”为引导,指出:“随着近几年深度学习研究和应用的深入,减少人类标注的方法得到普遍重视,趋势。”接着,余教授从人工智能的发展历程到AI不只是深度学习等多角度分析了科技发展没有捷径而言,是日积月累的智慧。最后余教授总结:“当AI迚入新的后深度学习时代,新的起跑线!谁能引领,完全取决亍其创新能力:理论上突破,对我们,更多的是关键技术、应用技术上的突破。”

  在第一个思辨环节中,主持人关于“深度学习“瓶颈”已至,提高算力是否将是计算机视觉突破困局的唯一途径?”问题发出提问,线上来宾踊跃参与,各抒己见。其中:

王荣章:提高算力不是计算机视觉突破困局的唯一途径。由于针对不同瓶颈问题,可以采用有针对性的解决办法。

赵旭:不是唯一的。数据、算法和算力为深度学习三大支柱,需要多方面和多角度的寻找解决计算机视觉行业进步的途径。

魏毅:不是唯一的。困局是当前的,从视觉理解角度分析,不单从算力这一个方面讨论,应该从其他技术角度来解决困局。

赵铁松:不是唯一的。计算机视觉不是依赖深度学习,只是当前处于深度学习发展阶段,那么随着计算机视觉技术的发展,也将脱离算力这个关联深度学习的因素。

卢家伟:提高算力是计算机视觉突破困局的唯一途径。不管在算法还是数据标注方面,算力都将是一个主要的力量支撑,尤其不容忽视的作用,未来算力之争也决定着它将成为突破困境的唯一途径。标准需要按照具体行业和需求进行细分,如:子标准和子协议等。统一标准是工业化的特征,但仍需具体情况、具体分析。

雷柏英研究员在该思辨环节总结道:算力只是一部分,从应用和实际问题出发,来分析算力的影响力,致力于解决难点问题。从技术落地方面分析,同样应考虑应用环境问题,在通过提高算力解决问题的同时应该不懈怠算法和数据的研究。

主题二:深度学习时代计算机视觉技术如何更好地落地?

  视觉算法赋能属性,会紧紧和场景结合在一起,而场景则意味着个性化,用户对于计算机视觉应用的诉求也将根据不同的场景变得越来越个性化和碎片化。由于场景的碎片化,所提供的解决方案也会呈现碎片化,但由于碎片化太严重,真正让计算机视觉应用落地是一个很痛苦的过程。除此之外,其实还有算法的碎片化,大规模应用问题由于算法持续不断的更新,算法更新将成为一个永无止境的过程。    深度学习时代计算机视觉技术如何更好地落地?是不断开拓新的应用领域?还是以应用为导向的算法开发? 

  论坛第三位引导嘉宾是来自福州大学的赵铁松教授给大家做题为《多视点图像聚类与协同分割》的技术讲座。

  铁松以“多视点图像聚类与协同分割”为主题展开了演讲。首先,铁松介绍了通过多视角图像聚类和协同分割两部分内容的结合实现图像分割,并从学习分类和方法的优势引出主题。在“多视角图像聚类”部分,首先阐述了特征提取和聚类的关系及实现,然后对loss function的定义、正则化以及相关参数做了进一步的诠释,最后通过实验分析,对比了K-means、MVCC、AMGL、MLAN、MVKSC、MSC-IAS等方法的性能,得出多视点图像聚类(MVDFC)方法的性能最佳。在“协同分割”部分,分析了在目标特征提取困难时如何突破困局。提出基于背景的特征提取方法实现目标特征的提取,并将单视角扩展到多视角,同样通过实验对比多种方法性能,得出最优方法,更好的实现图像分割与分类。

  论坛第四位引导嘉宾是来自华中农业大学工学院的徐胜勇副教授给大家做题为 《计算机视觉与农业交叉研究探索与实践》的技术讲座。

  胜勇以“计算机视觉与农业交叉研究探索与实践”为主题展开了演讲。首先,胜勇从计算机视觉技术的概念、在农业领域的应用及困难引入了计算机视觉技术在油菜机械装备上的应用情况及发展展望这一主题。胜勇通过作物数字化表型来测量全生长期农作物的农艺性状参数和计算机视觉技术在农业中的16个应用案例进行汇报。首先阐述了作物数字化表型研究目标和趋势,然后详细阐述了(1)高通量油菜籽性状检测装置,利用油菜籽和杂质的颜色特征,使用分类器快速地批量测量油菜籽的粒数、千粒重、颜色与外形特征信息;(2)智能跳帧技术,依据图像像素密度智能选择间隔帧,进行小规模SFM再融合点云,提高3D建模速度等具体农业应用案例。最后给出报告总结:(1)计算机视觉技术作为人眼和脑的延伸,在农业科研和生产领域大有可为。(2)低成本、高易用的“变态”要求,使得计算机视觉技术落地难,尤其是对于农业生产。(3)面向实际需求,不做“屠龙之术”。

  在第二个思辨环节中,主持人关于“后深度学习时代的计算机视觉技术如何更好地落地?是不断开拓新的应用领域?还是以应用为导向的算法开发?”问题发出提问,线上来宾踊跃参与,各抒己见。其中:

张婷:后深度学习时代要以应用为导向才能更好的落地。对于新领域的开拓还需要根据特定场景来解决落地问题,以应用为导向更能从实际成本出发,考虑落地的可行性和花费成本,从中做出决断。

刘耿耿:应该不断开拓新的应用领域。计算机视觉的发展,逐渐成为机器的“眼睛”,从而让机器实现各种检测、判断、识别和测量等功能。相关的算法开发肯定必不可少,但更要注重应用到新的领域。

杨海燕:以应用为导向。计算机视觉在农业方面得到了很好的应用。而这些优势都是根据实际应用需求出发实现了技术的落地。

陈星:应该不断开拓新的应用领域。在新的技术没有出现,或算法没有得到新的发展的前提下,通过数据和算力的不断提升,在新的场景中发挥其作用,将更具有落地的可实现性。

朱予涵:以应用为导向的算法开发。人工智能要想真正发挥赋能作用,需要扎扎实实的落地和应用。用“最有效的算法+最经济的软硬体”解决客户的刚需,更重要的是,算法-软硬件变动更新速度,要快速对接客户的不同需求,形成敏捷而有价值的运营模式。

铁松在该思辨环节总结道:两种方式是不矛盾的,不应该是二选一的。应该发现我们的优势在哪里,需求向前发展的最好方式。或是根据应用需求进行算法开发,或是将好的技术应用到有效的领域当中。

胜勇在该思辨环节总结道:应该面向和满足产业需求,持续研究提升我们技术的竞争力,多领域的结合和优势互补,降低和计算机视觉技术研发的难点和成本。因人而异,因地制宜。如果致力于当下,应该以应用为导向;如果要引领未来,应该不断开拓新的领域。

总结

  经过三个多小时的思辨,本次在线技术论坛充分展示了后深度学习时代,计算机视觉技术的发展状况,探讨了计算机视觉技术的优势与不足,让论坛的参与者们看到计算机视觉技术在发展过程中可能存在的各类问题,推动计算机视觉技术发展任重而道远。





热门动态
2022-06-12
第十二届中国计算机学会青年精英大会 CCF YEF 2022 CCF YOCSEF...
2020-11-29
会议现场人工智能的本质是让机器像人一样感知世界、认知世界...
2019-06-30
新型智慧城市是以为民服务全程全时、城市治理高效有序、数据开放...
CCF聚焦