计算机学院俞俊教授团队论文被计算机视觉领域顶级会议CVPR录用

近日,计算机学院俞俊教授团队以杭电为第一单位的论文被计算机视觉领域的顶级会议CVPR 2022CCF A类会议)录用。该项研究由俞俊教授团队与美国NEC实验室合作完成。第一作者为实验室博士后包俊,俞俊教授为本文通讯作者。

该论文ESCNet: Gaze Target Detection with the Understanding of 3D Scenes提出了一种基于单张图像3D重建的视线目标检测模型。视线目标检测任务的目的在于判断自然场景中人物看在哪里,即注意力的位置。视线目标检测广泛应用于多种场景中,如人机交互、辅助驾驶、认知科学研究和医疗诊断。传统方法或只使用2D图像信息,或只使用部分深度信息。本文提出一种基于3D几何信息辅助的模型ESCNet。对于单张图片,先通过深度估计和标的物体得到3D点云,然后获取点云里从每个角度最靠近目标人物的点的**。ESCNet包括几何模块和场景分析模块,前者单从3D几何信息判断人物视线可能到达的物体并得到初始热图,后者通过分析场景其他信息精炼初始热图。本文的方法在GazeFollow数据集上AUC准确率相比现有最好的结果提升显著,并超越了该数据集上人类的水平。

 

 

计算机学院媒体智能实验室(MIL)现有全职教师20人,博士/硕士研究生100余名,围绕人工智能、多媒体、计算机视觉的核心研究方向,近五年实验室发表高水平期刊会议100篇,其中IEEE/ACM 会刊和CCF A类会议40余篇,10余篇入选ESI高被引论文,4次获得IEEE权威期刊/会议最佳论文奖。团队主持国家重点研发计划、国家自然科学基金重点项目、科技创新2030重大项目课题在内的20余项国家级项目。因在相关领域的突出贡献,研究成果分别获2020年度浙江省自然科学一等奖和2018年度教育部自然科学二等奖。