11月28日下午,中国计算机学会计算机视觉专委会(CCF-CV)走进高校系列报告会第95期活动—“计算机视觉前沿技术及应用”在济南大学第一报告厅举行。本期报告会邀请了北京大学田永鸿教授,电子科技大学王正宁副教授,中国科学院信息工程研究所葛仕明研究员和南京理工大学的张姗姗教授等四位专家做特邀报告,济南大学张勇副校长参加活动并致辞。信息科学与工程学院彭京亮教授担任本次报告会的执行主席。报告会上,专家们围绕“计算机视觉前沿及应用”做了精彩报告。
张勇副校长对四位报告嘉宾的到来表示欢迎和感谢,向大家介绍了济南大学计算机学科发展和人才培养计划,希望以此为契机进一步促进太阳集团tcy8722在计算机视觉领域的学术交流,争取进行更深层次的合作,为计算机视觉领域的发展贡献力量。
北京大学田永鸿教授的报告题目是:“Neuromorphic vision drives new AI: A novel paradigm for computing vision”,指出目前传统的计算机视觉与深度学习结合的模式需要做出改变,列出了基于框架的深度学习表示方法,启发大家重新思考现在长期使用的计算机视觉以追求创新;其次,参考了视觉信息是视网膜系统上的工作原理,提出了尝试使用深度卷积神经网络来模拟人的视觉系统。接下来先是回顾了神经形态视觉的相关工作,随后介绍了目前正在进行的高速识别系统,高速运动对象通过特定的相机所生成的脉冲流输入到简单的模型进行识别的工作。最后,报告指出脉冲神经网络对于复杂视觉提供了新的思路并指出了当前所需要的颠覆性思维带来的挑战与机遇。
电子科技大学王正宁副教授的报告题目是“基于稀疏体素注意力网络的三维目标检测方法”,指出激光雷达在自动驾驶领域的应用,越来越多的研究者关注基于点云的三维目标检测,介绍了几种典型的3D探测方法以及KITTY数据集。其次,详细介绍了SVGA-Net的技术路线,用每个体素内的局部完全图和所有体素的全局KNN图来学习判别特征,再通过注意力机制使得局部和全局特征结合,在3D探测数据集KITTY上取得了较好的三维目标检测结果,并将把该方法应用到Waymo数据集上来测试改进。
中国科学院信息工程研究所葛仕明研究员的报告题目是“低质量视觉物体学习理解”,指出虽然在深度学习在视觉整理、深度网络上、性能上进展显著,但是因为各种原因出现了在实际场景中难以获得海量高质的数据的难题。为了解决这一个问题,通过复用深度模型以及对于求解知识表达、蒸馏、修复和迁移难题的思考,提出了跨质量知识蒸馏框架和系列算法,可以应用于多种场景。随后分别以蒙面人脸检测识别、低分辨率人脸识别以及弱小目标识别为例,介绍了在图像精度不足的数据集中,通过深度模型的蒸馏优化来达到,最后讨论了未来可能的发展方向—低质量数据解析与学习。
南京理工大学张姗姗教授的报告题目是“众里寻他千百度”:基于视觉的人体检测与搜寻,指出在自动驾驶、视频监控、智能机器人等诸多领域中,一方面在复杂多变的实际场景下对于行人检测存在着遮挡、域间差异、光照等问题。提出了遮挡模式建模以及动态表示的办法来解决遮挡问题;为了提高模型的泛化能力,强调数据集的多样性;在夜间照明情况相对较差时,使用特征注意力机制和特征转换的策略来进行行人检测;在能见度相对较低的情况下比如有雾的情况下,提出了Image dehazing network并设置雾密度分类器和多域检测器来进行朦胧的行人检测。另一方面,对于行人搜索领域,介绍了联合行人检测和重新识别的方法、Two-stage methods和One-stage methods,多任务联合方法通常比Two-stage methods更加有效。最后提出了对于未来工作对于遮挡、视角变换所带来的挑战。
此次CCF-CV走进高校系列报告会讲解深入浅出,报告内容精彩。报告会现场气氛热烈,在场的师生们就专家的报告纷纷提出自己感兴趣的问题,现场专家给出了详尽的解答。最后,济南大学彭京亮教授进行活动总结,以本次报告为契机,希望更多的专家学者关注济南大学计算机视觉技术的发展,共同努力推动计算机视觉的研究和应用。