基于FPGA的SAR原始数据实时压缩系统设计与实现
2023-03-09
来源:品趣旅游知识分享网
维普资讯 http://www.cqvip.com 第30卷第7期 合肥工业大学学报(自然科学版) Vo1.30 No.7 2007年7月 JOURNAl OF HEFEI UNIVERSITY OF TECHNOLOGY Ju1.2007 基于FPGA的SAR原始数据 实时压缩系统设计与实现 盛磊, 郑陶冶 , 党红杏, 张长耀 (华东电子工程研究所,安徽合肥230031) 摘要:文章讨论一种基于FPGA,并采用分块自适应量化(BAQ)算法的SAR原始数据实时压缩处理系统的 设计方法,该设计可大大提高实时压缩处理系统的性能,降低数据率,突破卫星下传数据率的限制。BAQ模 块内部采用4路并行处理的逻辑结构来计算数据块的统计特性;优化设计量化电平实时计算乘法器资源、量 化比较逻辑结构;当I/Q两路采用多模块分时复用模型时,可使整个系统压缩处理能力成倍增加。通过测试 表明,BAQ模块的最高运行速度可达到149 MHz,单个模块处理能力已达到1 Gbps以上,其中压缩比8/3时 信号失真噪声 ̄E(SDNR)大于14 dB。 关键词:合成孔径雷达;原始数据压缩;分块自适应量化;FPGA 。 中图分类号:TN957.522 文献标识码:A 文章编号:1003-5060(2007)07—0844-06 Design and implementation of the SAR raw data real—time compression system based on FPGA SHENG Lei, ZHENG Tao-ye,DANG Hong-xing, ZHANG Chang-yao (East China Research Institute of Electronic Engineering,Hefei 230031,China) Abstract:The SAR raw data rate is an important factor in the design of spaceborne SAR systems.In this paper,a design method of the SAR raw data real-time compression system is presented which is based on FPGA and adopts the block adaptive quantization(BAQ)algorithm.By using 1ess hardware logic resource,the SAR raw data rate is decreased,and performance of the real—time compression sys— tem is enhanced greatly,thus the 1imitation of the satellite data transfer rate is overcome.In the BAQ module.four-route paralle1 processing logic architecture is used to dea1 with the statistic characteris— tics of data blocks;the 1ogic architecture of multipliers and comparers is optimized,in which quantiza— tion level real—time computation and quantization comparison are carried out;and when the time-divi- sion multiple BAQ module mode is used in both I and Q channels,the real-time processing ability of the whole compression system is enhanced geminately.Experiment indicates that the highest process— ing speed of the BAQ module is 149 MHz,that the data throughput of single module is great than 1 Gbps,and that when the compression ratio is 8/3,the signa1 distortion noise ratio(SDNR)is great than 14 dB. Key words:synthetic aperture radar(SAR);raw data compression;block adaptive quantization;FPGA 0 引 言 工作能力,使它成为卫星遥感应用中非常重要的 有效载荷,越来越得到世界各国的重视。随着 合成孑L径雷达(sAR)具有全天时、全天候的 SAR技术向高分辨率、多极化、多波段、宽观测带 收稿日期:2007—02—08 作者简介:盛磊(1975一),男,安徽灵壁人,华东电子工程研究所工程师 维普资讯 http://www.cqvip.com 第7期 盛磊,等:基于FPGA的SAR原始数据实时压缩系统设计与实现845 的方向发展,原始数据率不断提高,对卫星数据传 值高斯分布,并且其分布可由标准差d惟一确定。 输能力提出相当高的要求。受到卫星数据存储容 那么,在利用FPGA实现BAQ算法时,选择数据 量和下传速率的限制,必须采取有效的数据压缩 块大小的原则是: 措施,降低数据率。因此,设计出高性能的实时数 (1)块的大小必须保证每一小块中SAR数 据压缩系统显得十分必要。 据的标准差d恒定,同时块又必须保证能有效估 目前,星载SAR的分辨率和观测带宽不断提 计出每一块的标准差d。 高,例如美国的“长曲棍球”SAR分辨率已经小于 (2)块的大小还需要考虑FPGA片内静态存 1 m,可能已达到0.3 m;德国DLR实验室研究的 储器(SRAM)容量大小,存储器长度最好是2 , 高分辨率超宽观测带(HRwS)x波段SAR,分辨 且容量是4 096 bit整数倍,因为4 096 bit正好是 率1.5 m,观测带宽80 km。聚束模式1 m分辨 FPGA内一个RAM存储宏单元的大小,这样有 率时,原始数据率接近2 Gbps,0.3 m时更是高 利于连续寻址和多通道并行处理,单个地址发生 达5 Gbps;HRWS单极化模式的数据率高达到 器就可以完成多个存储器的寻址。 4.7 GbpsE 。文献[2]采用7片数字信号处理器 一般的分块的大小取为32×32或64×64 (ADSP21062)实现压缩。文献[-3-]和文献E4-1也 (方位×距离),然后通过BAQ把每样本 位的 采用FPGA实现压缩比为8/3的BAQ算法,最 信号编码处理为每样本m位( < )的信号,从而 高工作频率分别为66.7MHz和85 MHz,文献 实现原始数据压缩。 E43完成16 384点压缩用时192/2s,数据率仅为 1。2 SAR数据统计特性计算 682 Mbps。 对于零均值高斯分布的SAR原始数据,图1 本文根据BAQ算法基本原理[5],给出实时 中的最优量化器可选取为LJ0yd—Max量化器, 压缩系统的设计方案。并分析实时压缩系统达到 它是基于均方误差最小准则,分析不均匀分布数 的性能。 据源的量化噪声特性所提出的,保证了在已知数 1 BAQ算法FPGA实现原理 据源概率分布的情况下,所选择的量化器的输入 和输出误差对于给定的量化级数其量化噪声最 1.1 SAR数据分块方法 小。为了避免在FPGA中直接计算输入原始数 BAQ(block adaptive quantization)算法采用 据每一块的方差d,改为在FPGA中计算输入信 一个自适应量化器,根据估计出的每一个小块输 号的绝对值均值l z I,通过查表,用l z l直接估 人数据的标准差d和均值来控制最优量化器以实 计出 ,l z l和 的关系式[4 ]为 现对输入信号的有效压缩,原理如图1所示。 一  ̄/27c J r dx(1) 计算数据块L一数据块的 其中,N为量化电平数,即数据块大小;z 为归一 统计特性l I准差和均 化量化器转变点,其关系如图2所示。通过事先计 原始数据块 算好l z l和 的映射表,存储FPGA中的ROM DPRAM RAV 。256x32bit 罴E 单元中,可降低FPGA内运算的复杂度[8]。 图1 BAQ算法原理图 l00 进行数据压缩,必须要分析信号的统计特性。 80 SAR回波信号的实部和虚部的概率密度函数是 翼60 具有零均值和相同方差的高斯分布,其幅度是瑞 4O 利分布,相位是均匀分布,在距离向和方位向的连 20 续采样值是不相关的_6j。考虑到在--4,段时间间 隔内,信号的动态范围远小于整个回波数据集的 绝对幅度均值 动态范围,把具有缓慢时变方差特性的整个回波 图2绝对幅度均值与标准差的关系 数据集沿着方位向和距离向分成若干个小块,从 而可以认为每一小块数据是具有稳态特性的零均 根据统计特性,均匀量化器的输出概率密度 维普资讯 http://www.cqvip.com 846 合肥工业大学学报(自然科学版) 间传送数据。 第3O卷 函数是零均值的高斯分布,通过给定初值,采用迭 代的方法可以求出最佳量化电平和最佳重建电 (4)PC机,运行性能分析程序、成像处理软 件及DSP开发环境Visua1 、P++等,用于读取 平。显然,迭代、积分运算在FPGA内完成是不 现实的,本文采用事先计算好各种压缩比的最佳 量化电平和最佳重建电平,分别把它们存储在星 上实时压缩系统和地面解压处理系统中,作为计 和存储数据、形成压缩码文件,并用解压程序恢复 数据,进行成像处理,测试和分析压缩性能。 2.2 BAQ模块的FPGA设计 2.2.1模块组成与工作流程 算参数调用。在最佳量化参数决定后,在FPGA 内通过大量的比较运算完成最大量化的压缩编码 SAR原始数据压缩的核心部分就是FPGA 过程。 2实时压缩处理板和测试系统 2.1 系统组成 实时压缩处理板是位于SAR接收机I/Q正 交数据采集电路与数据传输子系统之间。采集电 路对相互独立的正交I/Q两路回波信号进行采 集,量化为8bit,I/Q两路可以独立进行BAQ压 缩(如图3所示)。作为一个完整的实时压缩系 统,需要做到以下3点:能够完成实时压缩任务; 与输入输出子系统方便地连接,及时传输压缩数 据;能进行独立地测试与性能分析。为此,整个系 统主要包括以下几个相互关联的部分: G 图3实时压缩处理板与测试系统框图 (1)Altera公司Stratix系列工业级FPGA 芯片EPIS30F102016,其中集成了2组BAQ模 块,分别处理正交I/Q两路数据,实现I/Q两路 的并行压缩,适合接收机同时采集正交I/Q数据 的实际情况。 (2)ADI公司SHARC系列数字信号处理器 ADSP-21060L,管理BAQ模块工作状态,控制 BAQ模块的启动与停止,负责发送和接收FPGA 内BAQ模块的输入与输出测试数据。 (3)ADSP PCI接口仿真器,用于在PC机 DSP开发环境VisualDSP++与ADSP-21060之 内的BAQ模块,它负责完成SAR原始数据的实 时压缩处理,其内部逻辑结构分为4个部分(如图 1所示),其工作流程如下: (1)原始数据块双端口输入缓冲存储模块 DPRAM—RAW(256×32 bit)。由接收机数据采 集电路写入32×32的8 bis数据块,4字节拼接 为一个32位的数据,共计256个存储单元。数据 存储完毕后,控制端(如ADSP)发出BAQ模块使 能信号,BAQ模块就开始压缩运算。 (2)数据块统计特性计算模块。其作用是将 原始数据按照零均值高斯分布进行规范化处理。 先后需要计算原始数据均值,偏差绝对值均值,查 表得到数据块的标准差。 (3)最优量化器。其作用是根据标准差和不 同压缩比要求计算得到相应的量化电平(f-i限), 再根据量化门限对原始数据进行重新量化,得到 压缩码。 (4)已编码数据块双端口输出缓冲存储模块 DPRAM—CODE(256×16)。根据不同压缩比, 把压缩码进行字节组合。压缩运算结束后,BAQ 模块发出压缩完成指示信号(BAQ—DONE=1), 请求卫星数传系统来取出压缩数据和相应数据块 对应的均值和标准差,进行编码打包;同样也可以 由性能测试系统读出压缩码,做压缩性能分析,计 算SDNR,进行成像处理。 2.2.2工作状态控制 为了协调各子模块的时序,设计状态机 (State Machine)使之按照一定的工作状态进行 转移。它是整个BAQ模块的核心控制子模块, 决定当前算法运行在某一特定的工作状态下,控 制中间数据的准备与存储,共设置7种工作状态: 空操作(2个节拍IDLE1/IDLE2);求原始数据均 值(ST—RAW—MEAM);求零均值规范化(ST— SUB—MEAN);查表求标准差(ST—VARI— ANCE);计算量化门限(ST—THRESH0LD);量 化比较(ST—COMPARE)和输出编码(ST—COD- ER)。状态转移过程如图4所示。状态转移方式 维普资讯 http://www.cqvip.com 第7期 盛磊,等:基于FPGA的SAR原始数据实时压缩系统设计与实现847 主要是自循环和顺序转移,其中ST—RAW— MEAM、ST—SUB—MEAN和ST—VARI— 个256×32bit的偏差数据双端口存储器 (DPRAM—SUB)中,另一流向是求DataX的绝对 值、累加、并行加法,求得规范化数据绝对值的均 值(sub—mean)。 ANCE3个状态为数据块的统计特性计算阶段状 态,ST—THRESHOLD、ST—COMP2,RE和ST— CODER3个状态为最大量化器工作阶段。 差 图4 BAQ模块的状态图 2.2.3数据块统计特性计算 在进行BAQ处理时,计算数据块统计特性 依次包括:计算出原始数据均值;对数据块进行零 均值高斯分布的规范化;再计算出规范化后数据 的绝对值均值;通过查表得到数据块标准差。逻 辑结构如图5所示,采用4通道并行处理方式。 翁 原_1一r始aw数 m据/Ie均an值规 D ̄—D范PaR化taA 数MX—据 S UBIA ̄JABS 规范化数据 1支 绝对值均值 / / 千s mean ST RAW MEAN状态 ST SUB MEAN状态 图5统计特性4路并行处理逻辑结构图 (1)原始数据均值计算。在ST—RAW— MEAN状态,由raw—mean—ct1模块的地址发生 器控制从DPRAM—RAW的B端口中读取32 bit (8 bitX4)原始SAR数据,分为4个通道按字节 (8 bit)做并行累加,求和得到数据块总和,再通过 “截短法”得到满足运算精度的数据块均值。 (2)规范化数据绝对值的均值计算。在ST— SUB—MEAN状态,由sub mean-ctl模块的地 址发生器控制再次从DPRAM—RAW的B端口 中读取原始SAR数据。进行4通道并行地流水 操作,先减去均值raw—mean,完成零均值高斯分 布的规范化,得到规范化数据DataX。接下来 DataX分为2个数据流向,一个流向是存储到一 (3)标准差计算。按照公式(1),生成一张 sub—mean与标准差的对应表,预存储于标准差 表(V—ROM,如图6所示)中,而把sub—mean作 为V—ROM的访问地址,存储单元的数据就是对 应的标准差。但是由于sub—mean查表数据精度 为0.5,用二进制表示时,可以在低位增加1 bit, 实现0.5的精度,寻址后可以得到标准表。 图6最优量化器逻辑结构图 2.2.4最优量化器 (1)量化门限计算。把标准差与量化参数相 乘后,就可以得到量化门限。由于每个数据块标 准差都不尽相同,同时考虑运算精度和运算速度 的要求,利用18 bit)<18 bit的“硬件乘法器”实时 计算量化门限。不同压缩比对应不同数量的量化 门限,例如压缩比8/1、8/2、8/3、8/4分别有1、3、 7、15个量化电平,去掉4个零点不用乘法器,共 需要22个乘法器,而Altera Stratix系列FP— GA——EP1S30F102016内部共有48个18 bit)< 18 bit乘法器,只能集成2个BAQ模块。 为了片内集成度,采用2种“复用”措施减少 乘法器数量:先把不同压缩比的乘法器复用,取压 缩比8/4时最多的14个乘法器;再按照“二级分 时复用”,把乘法器数量再减少到7个,正好与压 缩比8/3时7个一致。此时,片内最多可集成6 个BAQ模块,满足I/Q 2路多通道并行压缩需要 2/4/6偶数个BAQ模块的要求,可把单片FPGA 的实时压缩速度性能最大提高3倍。 (2)比较量化。在得到量化门限后,量化过 程的实现是通过比较器完成的。把DPRAM— SUB零均值高斯规范化数据DataX与量化门限 进行比较量化,完成压缩编码。以8/3为例,7个 量化门限C2/B2/A2/0/A1/B1,/C1,把原有8 bit 共256个编码划分为8个区间,得到8个新的 维普资讯 http://www.cqvip.com 848 合肥工业大学学报(自然科学版) 第30卷 3 bit编码,从而实现8 bit一3 bit压缩编码。 由于FPGA内没有“硬件比较器”,当用大量 逻辑资源组成位数较宽(实际使用19 bit)的二进 制比较器时,互连走线过多,致使BAQ模块最高 要进行如下次数时钟节拍的运算操作: (1)256次读DPRAM—RAW操作(求原始 数据均值); (2)256次写DPRAM—SUB操作(求偏差); 运行速度严重下降,影响最终性能。因此,采用 “优先级编码器”的比较方式,并把8/3、8/2比较 器与8/4的逻辑复用——这2种措施来减少比较 (3)256次读DPRAM—SUB操作(量化比 较); (4)小于96次的加法、减法、乘法、延迟寄存 器数量,例如压缩比8/4时,有15个量化门限,16 个编码,最多需要15个“>”比较器,4通道并行 压缩共60个比较器。其中的比较器类型只使用 “>”,不采用“≥”,进一步简化逻辑,通过仿真把 比较量化模块的性能提升到160 MHz以上。另 外,优先级编码比较的重要优点是仅用2个时钟 周期就完成比较编码工作,即第1个时钟完成所 有的比较,第2个时钟完成所有的量化编码,实现 比较与量化的流水操作,节省操作时间。 (3)输出编码模块。由于BAQ模块包括 8/2、8/3、8/4不同压缩比处理能力,且是4通道 并行压缩处理。不同压缩比的压缩结果是不同位 数的压缩码,为了采用统一的格式把压缩码存储 于DPRAM—CODE中,并方便卫星数据传输系 统和性能测试系统进行读取访问,采用低位字节 地址组合,增加位宽提高读取速度。 以8/3为例,即把4个3 bit数据顺序编码为 12 bit,存储于16 bit宽DPRAM—CODE的低12 bit中,并把分别压缩I、Q信号的2个BAQ模块 的16 bit输出数据总线“并置(&)”后,组成32 bit 宽数据,这种设计可方便处理器按32 bit一次性 读出I/Q两通道共8个8/3压缩码,从而提高数 据输出端口的读出速率。 3性能测试与实验 实时压缩处理系统调试完成后,可从2个方 面评价其性能:①硬件的实时处理性能,包括运 算速度和对硬件资源的消耗情况;②实际数据的 压缩性能,包括数据压缩比和解压后数据相对于 原始数据的信号失真噪声比,及成像结果对比。 为此构建的测试系统如图3所示,除了实时 压缩处理系统外,性能评估单元还包括2部分:① 测试硬件平台,由PC机与ADSP仿真器组成;② 测试软件系统,由DSP程序、解压程序、成像程序 及性能评估程序组成。 3.1测试实时处理性能 在BAQ模块中,按照图5和图6的压缩处理 流程,一个32×32—1024点数据块压缩完成,共 等操作。 完成压缩操作需要256×3+96=864个时钟 节拍,考虑数据输入输出在时间上可复用256个 节拍,共需1 120个节拍,逻辑综合表明时钟频率 最高为149 MHz,因此1 024点压缩用时 1 120/149 MHz=7.5 s,16 384点压缩用时为 120 bts,单模块数据吞吐率为1 092 Mbps,2个模 块处理I、Q两路信号的总数据率可达到2 184 Mbps,较之本文参考文献中几个系统的性能都有 明显提高。当采用“4/6个BAQ模块双通道(I/ Q)分时复用模型”(如图7所示),实时处理能力 可再提高2/3倍,达到4 Gbps/6 Gbps。 采用Altera公司FPGA-EP1S30F1020I6进 行逻辑综合结果表明,单个BAQ模块占用了较 少的硬件逻辑资源,其中逻辑单元LE为3421,仅 占11 ;9 bit乘法器为14个,占15 ;存储器资 源消耗32 768 bit,小于1 。因而,一个 EPIS30F102016中内最多集成6个BAQ模块, 占用66 逻辑单元,84个9 bit乘法器和196 608 bit的存储资源,实现了以较少的硬件资源获得更 高实时压缩性能的研究目标。 FPGA EP l S 30Fl020 I6 I通道数据 BAQ—Il 压 Q通道数据 缩 BAQ_Ql 码 图7 4个BAQ双通道(I/Q)分时复用模型 3.2实际数据压缩性能测试 把实际SAR原始数据写入BAQ模块,经过 实时压缩,由ADSP21060读回生成压缩文件,解 压后,进行距离一多普勒(RD)算法成像处理和信 号失真噪声比(SDNR)分析评估压缩性能。SD- NR采用如下定义: sDNR--lOlglo Sig nalo 维普资讯 http://www.cqvip.com 第7期 盛磊,等:基于FPGA的SAR原始数据实时压缩系统设计与实现几乎没有差别。 849 Signal 0 是SAR原始数据信号电平;Signal1i是解 压缩数据的信号电平。 针对图8a所示的一块SAR原始数据,利用 本文所述实时压缩处理系统分别进行8/1、8/2、 这正好说明BAQ的压缩比为8/3、8/4时压 缩效果较好,以较低的数据量达到与原始数据量 的几乎相同的成像清晰度,实现了原始数据压缩 8/3、8/4 4种压缩比处理,解压后信号失真噪声 降低数据率,同时保证成像质量的目的。 比,结果如表1所示,其中8/3的SDNR已经达 到14.5 dB。 表1 同一块数据不同压缩比SDNR对比dB 经过RD算法成像后得到图8b、图8c、图8d、 图8e,通过比较图像的整体效果,及部分细节,如 道路、小河的清晰程度,可以看出8/1、8/2的成像 结果较差,而8/3、8/4成像结果与原始成像结果 (a)原始数据成像 l (b)8/1 f/. ̄像 _ (c)8/2g ̄像 (d)8/3g ̄像 (e)8,4_皖像 图8 同一块数据不同压缩比成像结果对比 4结 论 参考文献 通过对实际系统的性能测试与实验结果的分 析,表明本文所述基于FPGA的BAQ模块设计 [1]Fischer C A high resolution wide swath SAR[C]//6th Eu— 与优化方法,包括数据块统计特性的4路并行处 ropean Conference on SAR,2006. 理逻辑结构、最优量化器中乘法器和比较器逻辑 1-21牛晓丽.用ADSP实现多极化原始数据压缩算法EJ].现代 雷达,2002,24(2):33—35. 资源的优化方法及多模块I/Q双通道分时复用 [33周梅.星载SAR原始数据压缩模块的FPGA实现[J]. 模型,使得BAQ实时压缩处理模块具有数据吞 现代雷达,2006,28(2):42—45. 吐率高、占用硬件资源少、可扩充性能优良的特 E41高俊峰.分块自适应量化算法的FPGA实现[J].数据采集 点,对于进一步提高系统的实时压缩处理能力是 与处理,2006,21(1):1O3—107. 有效的。解压缩后成像的结果,验证了SDNR与 E53 Kwok R.Johnson W T K.Bloek ad@five quantisation of Magellan SAR dataEJ].IEEE Trans on Geosci and Remote 压缩比及成像质量的关系,说明采用本文所述方 Sensing,1989,27(4):375--383. 法研制的实时压缩系统实现了预期的压缩效果。 [6]郑伟强.星载合成孔径雷达数据压缩[J].电讯技术,1996, 基于本实时压缩系统达到的性能及其可扩充 36(6):7—13 性,可以应用于多种高数据率星载SAR系统的实 E73 Bei C D,Gray R M.An improvement of the minimum dis— 时数据压缩分系统中。当然,由于本系统仅是在 tOrtion encodign algorithm for vector quantization[J]. IEEE Transactions on Communications, 1985,33: 工业级FPGA芯片中获得成功应用与测试,那么 1132—1133. 如何能使之适合于星载环境要求,将是下一步研 [8]崔嵬.3 bit块自适应量化算法的FPGA实NEJ].北京理 究和突破的重点。 工大学学报,2005,25(2):139—142. (责任编辑朱华新)