摘要
点云配准是点云数据智能处理的重要问题,也是将点云应用于智慧城市、自动驾驶和智能三维重建等方面的关键。针对现有点云配准方法效率低、鲁棒性差的问题,提出了一种基于核相关神经网络的点云自动配准算法。首先构建点云核用于计算点云中每个点的核相关度,然后通过多层感知机对点云进行特征编码,基于编码特征向量估计点间对应关系并求解变换参数,最后以迭代方式来使待配准点云不断逼近目标点云,完成点云配准。使用斯坦福大学3D扫描模型库中的Bunny、Dragon、Happy、Elephant、Horse点云数据,对该算法以及迭代最近邻点算法(ICP)等多个算法进行对比实验。实验结果表明,所提算法能够对不同物体点云实现精确配准,精度和效率均优于所对比算法,且在点云数据存在噪声和密度不一致的情况下仍具有良好的稳定性和精度。
随着三维激光扫描技术的发展,点云数据被广泛应用于三维重建、自动驾驶、智能机器人等领域。然而由于被测物体几何形状、位置、结构及角度的限制,传感器难以一次获取完整的点云数据,因此需要将得到的多站具有不同坐标系的点云统一到同一参考坐标系下,这个过程称为点云配
目前传统的点云自动配准算法大致可以分为三类:(1)迭代最近邻点算法(iterative closest point,ICP
近年来,随着计算机的硬件性能提升,深度学习技术在三维点云数据处理领域中得到了快速发
总的来说,目前工程中常用的基于标靶布设的点云配准方法耗时耗力,而传统的点云自动配准方法则效率较低,基于深度学习的端到端点云配准虽然在效率上有所提升,但使用多层感知机的特征编码方式未考虑到点云的局部邻域信息,且缺乏对同名对应点关系的显示构建,因而鲁棒性性较差。针对以上问题,本文提出一种基于核相关神经网络的点云自动配准算法(kernel correlation registration, KCR),首先通过构建点云核计算核相关度来获取点的局部邻域信息,然后使用多层感知机对源点云以及目标点云进行特征编码。为提升配准效率,通过对应关系估计层建立两个点云间的同名点对应关系,使用奇异值分解法(singular value decomposition, SVD)求解点云变换参数,最后以迭代的方式来减小配准误差直至符合精度要求。
KCR算法的网络结构主要包含特征提取层、对应关系估计层、SVD位姿求解层三个关键模块,具体步骤如下:
步骤1: 输入待配准的源点云以及目标点云。
步骤2: 使用八叉树算法对无序点云数据进行空间拓扑划分,对每个目标点建立K邻域索引。
步骤3: 建立不同形状的点云核,计算源点云以及目标点云中每个点与所建立点云核之间的相关性,再通过多层感知机(multi-layer perception, MLP)将点云中每个点的特征维度映射到高维空间对点云进行特征编码。
步骤4: 基于两个点云的特征编码使用多层感知机来估计源点云在目标点云中的对应点,然后根据点对间对应关系使用SVD法求解变换矩阵。
步骤5: 计算本次迭代所求得的与之差,若小于阈值或达到最大迭代次数n,则输出变换矩阵,否则将变换后的点云输入网络得到下一次迭代的变换矩阵。
如

图1 KCR算法的网络结构图
Fig. 1 Network structure of KCR algorithm
在点云特征编码中,考虑每个点的邻域信息有助于提升后续任务的精度。类似于2D图像中卷积神经网络使用卷积核提取图像的邻域信息,本文首先使用核相
(1) |
式中:为高斯函数;为均值;为方差,函数的值随两点之间距离的增加呈指数衰减。
原始输入的点云是散乱无序的,为查询每个点的邻域点,首先使用八叉树算法对待配准的点云数据建立邻接拓扑关系,然后通过
(2) |
式中:为点云核; 为待配准点云中一点;为其邻域中一点; 为点云核中的第个点; 为待配准点云中第个点的KNN邻域; 为核函数; 为点与点云核之间相关度,可对两个点云之间的几何相似性进行描述,值越大代表点云之间的相关性越强。
在对输入点云中每个点进行核相关性计算后,为使神经网络学习到点云的高维度特征,使用多个多层感知机网络将点的特征维度映射到1 024维的高维空间,完成对原始点云的特征编码。
在点云配准任务中,基于特征相似性匹配进行同名对应点搜索的方式较为耗时。因而本文通过神经网络直接估计源点云在目标点云中的对应点云,以提升匹配的效率。首先对编码后的目标点云进行最大池化提取到全局特征,将其扩展至与源点云点数量相同的维度,然后与源点云的64维特征以及1 024维特征进行拼接,最后通过多个多层感知机输出对应点云,如
(3) |
式中;为源点云中点在目标点云中的对应点;和分别为源点云的64维特征和1 024维特征;为目标点云经最大池化后的全局特征;MLP为多层感知机网络。
对于给定的两个待配准点云和,其中为源点云,为源点云经过变换后的目标点云,三维点云配准任务为寻找合适的变换参数即旋转矩阵和平移向量,使得配准后的点云在同一坐标系下对齐。在确定点云之间的对应关系后,变换参数可以通过优化以下目标函数来求得:
(4) |
式中;N为点云中点的数量; 和为估计的同名点。
SVD是求解
首先通过
(5) |
(6) |
然后求解点云的协方差矩阵:
(7) |
对协方差矩阵进行SVD分解:
(8) |
最后通过
(9) |
(10) |
解算出初始变换矩阵后,将其应用于源点云得到初始配准结果。由于点云位姿变换的复杂性,神经网络难以一次性地对配准参数进行精确的估计,因此通过一个迭代过程将变换后的源点云与目标点云重新输入网络计算,使得配准误差不断减小,直到达到最大迭代次数或两次产生的矩阵之差小于阈值,完成点云精细配准过程。其中最大迭代次数和矩阵差阈值本文分别设置为10和0.2,在保证效率的前提下能达到较好配准效果,具体数值设置可根据应用进行微调。
实验采用ModelNet4
(12) |
式中;表示均方根误差;为点云个数;和分别代表源点云和目标点云。
所有实验在一台配置Intel Xeon W-2145@ 3.70GHz处理器, 64G内存和NVIDIA TITAN X显卡的工作站上进行,系统为Ubuntun16.04,使用的编程语言为Python。
实验中用于测试的Bunny、Dragon、Happy、Elephant、Horse点云的初始位姿如

图2 点云初始状态
Fig. 2 Initial state of point cloud
各算法在测试点云上的配准效果如由

图3 各算法配准效果
Fig. 3 Registration effect of each algorithm
由
在配准误差的定量对比上,由
由于扫描过程中点云传感器、环境以及人为因素的影响,所获取的点云不可避免地会出现噪声影响。为验证各个算法的抗噪能力,在Elephant点云上施加均值为0,方差为0.05的高斯分布噪声,对比各个算法在噪声环境下的配准精度与效率。
由

图4 各算法在噪声点云下的配准效果
Fig. 4 Registration effect of each algorithm in noisy point cloud
由设备获取的点云数据会出现远处点云密度高而近处密度低的情况,且在实际点云拼接中两个点云的密度通常也不一样,因此进行不同密度下的点云配准实验。对待配准的Elephant点云进行50 %的数据随机丢失,目标点云保持不变,进行算法精度以及效率评价。
各个算法的配准效果与精度如

图5 各算法在不同密度点云下的配准效果
Fig. 5 Registration effect of each algorithm at different densities of point cloud
总结以上实验,可以发现ICP算法完成点云配准对点云的初始位置要求较高,且对点噪声以及缺失较为敏感;CPD和GMM算法均是基于概率模型的点云配准算法,此类算法的鲁棒性较好,但计算量大,效率较低;SVR算法将机器学习中经典的支持向量机算法与高斯混合模型相结合,在不同点云配准任务上表现良好,但在密度不同的点云上配准结果较差;PCRNet算法虽然效率较高,但配准精度受输入点云的位姿和形态影响,且基于全局特征向量求解配准参数的方式鲁棒性较差; KCR算法通过构建直接作用于点云上的迭代神经网络来完成点云配准任务,能够实现在不同场景下点云的精确配准。
本文提出了一种基于核相关神经网络的点云自动配准算法,对输入的两组点云使用深度神经网络进行编码,通过对应关系估计层来匹配同名点并进行变换参数求解,最后以迭代方式对配准结果进行优化。通过实验表明,本文算法能够在各个物体点云上实现端到端的精确配准,效率较传统点云配准算法有明显提升,且在点云数据存在噪声和密度不一致的情况下仍具有良好的稳定性和精度,基本解决了现有点云配准算法效率低、鲁棒性差的问题。但由于网络容量的限制,本文算法仅在小场景点云配准任务上进行实验,对于大场景的点云配准任务仍需对网络结构进行进一步的优化。
作者贡献声明
李健:提出想法,论文撰写。
黄硕文:论文撰写,神经网络设计。
冯凯: 神经网络算法程序设计。
朱琦:点云配准数据收集。
崔昊:点云配准实验分析。
参考文献
杨必胜, 董震. 点云智能研究进展与趋势[J]. 测绘学报, 2019,48(12): 1575. [百度学术]
YANG Bisheng, DONG Zhen. Progress and perspective of point cloud intelligence[J]. Acta Geodaetica et Cartographica Sinica, 2019,48(12): 1575. [百度学术]
王畅, 舒勤, 杨赟秀, 等. 利用结构特征的点云快速配准算法[J]. 光学学报, 2018,38(9): 175. [百度学术]
WANG Chang, SHU Qin, YANG Yunxiu, et al. Quick registration algorithm of point clouds using structure feature[J]. Acta Optica Sinica, 2018,38(9): 175. [百度学术]
BESL P J, MCKAY N D. Method for registration of 3-D shapes[C]//Sensor Fusion IV: Control Paradigms and Data Structures. [S.l.]: Spie, 1992, 1611: 586-606. [百度学术]
王欣, 张明明, 于晓, 等. 应用改进迭代最近点方法的点云数据配准[J]. 光学精密工程, 2012,20(9):2068. [百度学术]
WANG Xin, ZHANG Mingming, YU Xiao, er al . Point cloud registration based on improved iterative closest point method[J]. Infrared and Laser Engineering, 2012,20(9): 2068. [百度学术]
闫利, 谭骏祥, 刘华, 等. 融合遗传算法和ICP的地面与车载激光点云配准[J]. 测绘学报, 2018,47(4):528. [百度学术]
YAN Li, TAN Jiuxiang, LIU Hua, et al. Registration of TLS and MLS point cloud combining genetic algorithm with ICP[J]. Acta Geodaetica et Cartographica Sinica, 2018,47(4): 528. [百度学术]
YANG J, LI H, CAMPBELL D, et al. Go-ICP: A globally optimal solution to 3D ICP point-set registration[J]. IEEE transactions on pattern analysis and machine intelligence, 2015,38(11):2241. [百度学术]
RUSU R B, BLODOW N, BEETZ M. Fast point feature histograms (FPFH) for 3D registration[C]//2009 IEEE international conference on robotics and automation. Kobe: IEEE, 2009: 3212-3217. [百度学术]
LI J, ZHONG R, HU Q, et al. Feature-based laser scan matching and its application for indoor mapping[J]. Sensors, 2016,16(8):1265. [百度学术]
SERAFIN J, OLSON E, GRISETTI G. Fast and robust 3D feature extraction from sparse point clouds[C]//2016 IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS). Daejeon: IEEE, 2016: 4105-4112. [百度学术]
TAKEUCHI E, TSUBOUCHI T. A 3-D scan matching using improved 3-D normal distributions transform for mobile robotic mapping[C]// 2006 IEEE/RSJ International Conference on Intelligent Robots and Systems. Beijing: IEEE, 2006: 3068-3073. [百度学术]
JIAN B, VEMURI B C. Robust point set registration using gaussian mixture models[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2010,33(8):1633. [百度学术]
GUO Y, WANG H, HU Q, et al. Deep learning for 3d point clouds: A survey[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2020, 43(12): 4338. [百度学术]
ZENG A, SONG S, NIEßNER M, et al. 3dmatch: Learning local geometric descriptors from rgb-d reconstructions[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. Honolulu: IEEE, 2017: 199-208. [百度学术]
GOJCIC Z, ZHOU C, WEGNER J D, et al. The perfect match: 3d point cloud matching with smoothed densities[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. Long Beach: IEEE, 2019: 5540-5549. [百度学术]
CHOY C, PARK J, KOLTUN V. Fully convolutional geometric features[C]//Proceedings of the IEEE International Conference on Computer Vision. Seoul: IEEE, 2019: 8957-8965. [百度学术]
舒程珣, 何云涛, 孙庆科. 基于卷积神经网络的点云配准方法[J]. 激光与光电子学进展, 2017,54(3):129. [百度学术]
SHU Chengxu, HE Yuntao, SUN Qingke. Point cloud registration based on convolutional neural network[J]. Laser&Optolectronics Progress, 2017,54(3): 129. [百度学术]
AOKI Y, GOFORTH H, SRIVATSAN R A, et al. Pointnetlk: Robust & efficient point cloud registration using pointnet[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. Long Beach: IEEE, 2019: 7156-7165. [百度学术]
SARODE V, LI X, GOFORTH H, et al. PCRNet: Point cloud registration network using PointNet encoding[EB/OL].[2019-08-21]. https://arxiv.org/. [百度学术]
TSIN Y, KANADE T. A correlation-based approach to robust point set registration[C]//European Conference on Computer Vision. Berlin: Springer, 2004: 558-569. [百度学术]
SHEN Y, FENG C, YANG Y, et al. Mining point cloud local structures by kernel correlation and graph pooling[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. Salt Lake City: IEEE, 2018: 4548-4557. [百度学术]
WU Z, SONG S, KHOSLA A, et al. 3d shapenets: A deep representation for volumetric shapes[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. Boston: IEEE, 2015: 1912-1920. [百度学术]
MYRONENKO A, SONG X, CARREIRA-PERPINÁN M A. Non-rigid point set registration: Coherent point drift[J]. Advances in Neural Information Processing Systems, 2007,19:1009. [百度学术]
CAMPBELL D, PETERSSON L. An adaptive data representation for robust point-set registration and merging[C]//Proceedings of the IEEE International Conference on Computer Vision. Santiago: IEEE, 2015: 4292-4300. [百度学术]