2022年国际计算机视觉顶级会议CVPR录用结果公布,我实验室孙玉齐同学为一作完成的论文《Learning Robust Image-Based Rendering on Sparse Scene Geometry via Depth Completion》被录用。
CVPR(Computer Vision and Pattern Recognition)由IEEE举办,是计算机视觉方向的三大顶级会议之一,业内具有很高的评价,其论文集代表了计算机视觉领域最新的发展方向和水平。2022年,CVPR主办地为美国路易斯安那州,投稿量8161篇,录用文章 2067篇,录用率为 25.33%。
图1. 论文信息
图2. 方法流程对比
图3. 网络结构图
图4. 结果对比
该文章提出了一种利用深度补全进行几何恢复的网络,能够实现在稀疏场景几何下性能鲁棒的基于图像渲染方法。近些年基于图像的渲染(IBR)方法通常采用大量的视图来重构密集的场景几何(图2.b)。然而,在实践中,可用视图的数量是有限的。当只提供少量的视图时,场景的几何信息也变得稀疏,这些方法的性能就会明显下降。因此,在本文中,该文提出了Sparse-IBRNet(SIBRNet),通过深度补全对稀疏的场景几何进行鲁棒的IBR(图3)。SIBRNet有两个阶段(图2.c),几何恢复(GR)阶段和光线混合(LB)阶段。具体来说,GR阶段将稀疏的深度图和RGB作为输入,通过利用两种模态之间的相关性来预测稠密的深度图。由于补全深度图的不准确可能会导致扭曲过程中的投影偏差,因此,LB阶段首先使用偏差校正模块(BCM)来纠正偏差,然后将不同视图中的优化特征聚合起来,生成一个新的视图。大量的实验结果表明,与最近的IBR方法相比,该文的方法在稀疏的场景几何上表现出明显优势(图4),当几何信息密集时,它也能产生更好或相当的结果。