卢金仪,唐维伟,徐文辉,颜露新,钟 胜,邹 旭.孪生网络跟踪算法并行计算结构研究[J].测控技术,2021,40(3):39-45
孪生网络跟踪算法并行计算结构研究
Parallel Computing Architecture of Siamese Network Algorithm
  
DOI:10.19708/j.ckjs.2021.03.008
中文关键词:  卷积神经网络  目标跟踪算法  定点量化  FPGA硬件加速
英文关键词:convolutional neural network  tracking algorithm  fixed-point quantization  FPGA acceleration
基金项目:国防基础科研计划资助(JCKY2018204B068)
作者单位
卢金仪 华中科技大学 人工智能与自动化学院 华中科技大学 多谱信息处理技术国家级重点实验室 
唐维伟 华中科技大学 人工智能与自动化学院 华中科技大学 多谱信息处理技术国家级重点实验室 
徐文辉 华中科技大学 人工智能与自动化学院 华中科技大学 多谱信息处理技术国家级重点实验室 
颜露新 华中科技大学 人工智能与自动化学院 华中科技大学 多谱信息处理技术国家级重点实验室 
钟 胜 华中科技大学 人工智能与自动化学院 华中科技大学 多谱信息处理技术国家级重点实验室 
邹 旭 华中科技大学 人工智能与自动化学院 华中科技大学 多谱信息处理技术国家级重点实验室 
摘要点击次数: 995
全文下载次数: 273
中文摘要:
      基于嵌入式平台的复杂背景目标跟踪技术在智能视频监控设备、无人机跟踪等领域有重要作用。卷积神经网络在跟踪问题上有准确率高、鲁棒性强的优点,但基于卷积特征的算法计算复杂度高,受嵌入式平台面积和功耗的限制,实时性难以满足嵌入式平台应用场景的需求。针对基于卷积特征的跟踪算法计算复杂度高、存储参数量大的难题,率先提出一种利用FPGA实现基于卷积神经网络的复杂背景目标跟踪硬件加速架构。该方法通过利用KL相对熵对目标跟踪算法Siamese-FC进行定点量化,设计了基于通道并行的卷积层加速架构。实验结果表明,定点量化后跟踪算法相比于原算法的平均精度损失不超过4.57%,FPGA部署后前向推理耗时仅为CPU的16.15%,功耗仅为CPU的13.7%。
英文摘要:
      Complex background target tracking algorithm based on the embedded platform plays an important role in intelligent video surveillance equipment,UAV tracking,etc.Convolutional neural network is accurate and robust on tracking problems,but the algorithm based on convolution features has high computational complexity,and is limited by the area and power consumption of the embedded platform,so the real-time performance is difficult to meet the requirements of embedded platform application scenarios.For the difficulties of high computational complexity and large number of stored parameters of the tracking algorithm based on convolutional features,a hardware acceleration architecture for complex background target tracking based on convolutional neural networks using FPGAs is proposed.A channel-parallel based convolutional layer acceleration architecture is designed by using KL relative entropy for fixed-point quantization of the target tracking algorithm Siamese-FC.The experimental results show that the average accuracy loss of the tracking algorithm after fixed-point quantization is more than 4.57% compared with the original algorithm,the forward inference time consumption after FPGA deployment is only 16.15%,and the power consumption is only 13.7% of CPU.
查看全文  查看/发表评论  下载PDF阅读器
关闭