摘要:随着深度学习技术的发展和图像场景理解需求的提升,基于现场可编程门阵列(field programmable gate array, FPGA)部 署语义分割网络,为用户提供低延迟、高能效的边缘端智能服务成为研究热点。 针对语义分割网络结构中计算和存储密集型特 点,构建基于 FPGA 的定制计算结构是研究的重点问题。 鉴于此,本文在归纳总结语义分割网络基本原理和计算结构特点的基 础上,分别从面向硬件资源约束的模型压缩方法和定制硬件架构设计两个角度阐述基于 FPGA 的语义分割网络加速计算方法, 并重点对硬件架构设计中的计算结构设计和内存访问优化的典型方法进行总结。 最后,展望了语义分割网络 FPGA 加速计算 方法的发展趋势,以期为语义分割、边缘计算、定制高能效计算以及其他相关领域的研究者提供设计参考。