答辩公告
论文题目 |
轻量级单目深度估计算法及其实现研究 |
答辩人 |
屠晓涵 |
指导教师 |
徐成教授 |
答辩委员会 主席 |
李仁发教授 |
学科专业 |
计算机科学与技术 |
学院 |
信息科学与工程学院 |
答辩地点 |
视频答辩 |
答辩时间 |
2021年1月21日 上午10:00
|
学位论文简介
单目深度估计可从单目相机捕获的单个RGB图像中预测出密集的深度图,精确的深度图可以帮助机器人、无人机等各种自主系统更好地了解场景中物体之间的三维关系和结构,从而更好地完成即时定位和建图(SLAM)、避障和导航等各种任务。过去的单目深度估计方法过渡依赖高性能计算平台,以牺牲功耗和计算复杂性为代价来提高精度,未能在准确性和效率之间取得平衡。此外,在加快算法的同时,研究人员通常会忽略它们对嵌入式设备上不同硬件体系结构的匹配性。本文旨在解决这些挑战:
(1) 针对目前深度估计模型中的编码器不能有效地重探索特征,本章设计了可重探索特征的编码器;针对不能很好学习局部特征的解码器,本章设计了可学习局部特征的编码器。提出的编码器和解码器构成了深度估计模型DEM。为使其精度进一步提高,本章设计了损失函数指导DEM的训练。为使深度估计更好地应用于场景重建,本章基于DEM,设计了SLAM系统,实现了更准确的场景重建。
(2) 针对嵌入式平台上深度估计内存利用率和CPU利用率普遍过高的问题,本章设计了轻量级的深度估计模型,并对这个模型进行嵌入式端的优化加速,为降低嵌入式端深度估计的运行时间和功耗提供了辅助决策。
(3) 针对嵌入式平台上深度估计模型运行效率的自适应问题和硬件匹配问题,本章设计了模型剪枝方法,同时使用优化方法使模型适应不同的硬件体系结构,并取得了较好的实验结果。
主要学术成果
[1] Tu, Xiaohan and Xu, Cheng and Liu, Siping and Xie, Guoqi and Li, Renfa. Real-Time Depth Estimation with an Optimized Encoder-Decoder Architecture on Embedded Devices [C]. Proc. IEEE Conf. High Perform. Comput. Commun. 2019: 2141-2149. (CCF C类)
[2] Tu, Xiaohan and Xu, Cheng and Liu, Siping and Xie, Guoqi and Huang, Jing and Li, Renfa and Yuan, Junsong. Learning Depth for Scene Reconstruction Using an Encoder-Decoder Model [J]. IEEE Access, 2020, 8: 89300-89317. (SCI 2区)
[3] Tu, Xiaohan and Xu, Cheng and Liu, Siping and Li, Renfa and Xie, Guoqi and Huang, Jing and Yang, Laurence Tianruo. Efficient Monocular Depth Estimation for Edge Devices in Internet of Things. IEEE Transactions on Industrial Informatics [J], 2020, 17(4):2821-2832. (SCI 1区)
[4] Tu, Xiaohan and Xu, Cheng et al. LiDAR Point Cloud Segmentation for Overhead Catenary System [J]. Sensors 2020, 20(21), 6387. (SCI 3区)
[5] 徐成(导师),屠晓涵, 等. 导师第一作者, 本人第二作者, 适用于嵌入式平台的快速单目深度估计方法: 中国, CN110599533.A. 2019-12-20. (发明专利, 已进入实审)