首页 理论教育 DSP的独特特点的分析介绍

DSP的独特特点的分析介绍

时间:2023-06-20 理论教育 版权反馈
【摘要】:DSP是专门设计用来进行高速数字信号处理的微处理器。例如,TMS320C54xDSP系列中的FIRS和LMS指令,专门用于完成系数对称的FIR滤波器和LMS算法。此外,浮点DSP则提供了更大的数据表达的动态范围,提高了运算精度。DSP是一种特殊的微处理器,不仅具有可编程性,而且在数据的运算处理能力上远远超过通用微处理器,其特殊的内部结构、强大的信息处理能力及较高的运行速度,是DSP最重要的特点。

DSP的独特特点的分析介绍

DSP是专门设计用来进行高速数字信号处理的微处理器。与通用的CPU和微控制器(MCU)相比,DSP在结构上采用了许多专门的技术和措施,来提高处理速度。尽管不同的厂商所采用的技术和措施不尽相同,但往往有许多共同的特点。以下介绍的就是它们的共同点。

1.哈佛结构和改进的哈佛结构

DSP普遍采用数据总线和程序总线分离的哈佛结构或改进的哈佛结构,比通用微处理器的冯·诺依曼结构有更快的指令执行速度。

(1)冯·诺依曼结构(Von Neumann Architecture)

奔腾为代表的通用微处理器,其程序代码和数据共用一个公共的存储空间和单一的地址和数据总线,取指令和取操作数都是通过一条总线分时进行的,这样的结构称为冯·诺依曼结构,如图1-1a所示。当进行高速运算时,取指令和取操作数是分时操作的,这样很容易造成数据传输通道的瓶颈现象,其工作速度较慢。

(2)哈佛结构(Harvard Architecture)和改进的哈佛结构(Modified Harvard Architecture)

DSP将程序代码和数据的存储空间分开,各空间有自己独立地址总线和数据总线,可独立编址和独立访问,可对程序和数据进行独立传输,这就是所谓的哈佛结构,如图1-1b所示。采用哈佛结构可同时取指令和取操作数,并行地进行指令和数据的处理,从而可以大大地提高运算的速度,非常适合于实时的数字信号处理。为了进一步提高信号处理效率,人们在哈佛结构的基础上又加以改进,使得程序代码和数据存储空间之间也可以进行数据的传送,称为改进的哈佛结构,如图1-1c所示。例如,在做数字滤波处理时,将滤波器的参数存放在程序代码空间里,而将待处理的样本存放在数据空间里,这样,处理器就可以同时提取滤波器参数和待处理的样本,进行乘和累加运算。

978-7-111-35536-6-Chapter01-1.jpg

图1-1 微处理器的结构

a)冯·诺依曼结构 b)哈佛结构 c)改进的哈佛结构

2.多总线结构

许多DSP内部都采用多总线结构,这样保证在一个机器周期内可以多次访问程序空间和数据空间,大大提高了DSP的运行速度。例如TMS320C54xDSP系列内部有P、C、D、E4条总线,每条总线中都有地址总线和数据总线,这样在一个机器周期内可以完成如下操作:

1)从程序存储器中取一条指令。

2)从数据存储器中读两个操作数。

3)向数据存储器写一个操作数。

因此,对于DSP来说,内部总线是十分重要的资源,总线越多,可以完成的功能就越复杂。

3.流水线技术(pipeline)

计算机在执行一条指令时,总要经过取指、译码、取数、执行运算等步骤,需要若干个指令周期才能完成。流水线技术是将各指令的各个步骤重叠起来执行,而不是一条指令执行完成之后,才开始执行下一条指令,即第一条指令取指后,在译码时,第二条指令就取指;第一条指令取数时,第二条指令译码,而第三条指令就开始取指,……,依次类推,如图1-2所示。使用流水线技术后,尽管每一条指令的执行仍然要经过这些步骤,需要同样的指令周期数,但从总体统计平均上来看,其中的每一条指令的执行就都是在一个指令周期内完成的。DSP所采用的将程序存储空间和数据存储空间的地址与数据总线分开的哈佛结构,为采用流水线技术提供了很大的方便。

利用这种流水线结构,加上执行重复操作,就能保证数字信号处理中用的最多的乘法累加运算(www.xing528.com)

978-7-111-35536-6-Chapter01-2.jpg

可以在单个指令周期内完成。

978-7-111-35536-6-Chapter01-3.jpg

图1-2 流水线技术示意图

4.多处理单元

DSP内部一般都包括多个处理单元,如算术逻辑运算单元(ALU)、辅助寄存器运算单元(ARAU)、累加器(ACC)及硬件乘法器(MUL)等。它们可以在一个指令周期内同时进行运算。例如,在执行一次乘法和累加运算的同时,辅助寄存器运算单元已经完成了下一个地址的寻址工作,为下一次乘法和累加运算做好了准备。因此,DSP在进行连续的乘加运算时,每一次乘加运算都是单周期的。DSP的这种多处理单元结构,特别适用于大量乘加操作的矩阵运算、滤波、FFT、Viterbi译码等。许多DSP的处理单元结构还可以将一些特殊的算法,如FFT的位倒序寻址和取模运算等,在处理器内部用硬件实现,从而提高运行速度。

5.特殊的DSP指令

在DSP的指令系统中,设计了一些完成特殊功能的指令,以便更好地满足数字信号处理的需要。例如,TMS320C54xDSP系列中的FIRS和LMS指令,专门用于完成系数对称的FIR滤波器和LMS算法。

为了实现FFT、卷积等运算,当前的DSP大多在指令系统中设置了“循环寻址”(Circularaddressing)及“位倒序寻址”(Bit-reversed)指令和其他特殊指令,使得在进行这些运算时,其寻址、排序及计算速度大大地提高。

6.指令周期短

早期的DSP指令周期约400ns,采用4μm NMOS制造工艺,其运算速度为5MIPS(Millions of Instructions Per Second)。随着集成电路工艺的发展,DSP广泛地采用亚微米CMOS制造工艺,其运算速度越来越快。例如,TMS320C54x运算速度可达100MIPS,即100百万条/秒;TMS320C6203时钟频率可达300MHz,运行速度可达2400MIPS;TMS320C6416时钟频率超过1GHz,运行速度可达8000MIPS;而DaVinci系列中的TMS320DM6446更是接近5000MMACS。

7.运算精度高

早期的DSP字长为8位,后来逐步提高到16位、24位、32位。为了防止溢出,累加器长达40位。此外,浮点DSP则提供了更大的数据表达的动态范围,提高了运算精度。

8.硬件配置强

新一代DSP的接口功能越来越强,片上外设丰富,如串行口、主机接口(HPI)、DMA控制器、软件可编程等待状态发生产生器、锁相环时钟产生器以及实现片内仿真的符合IEEE1149.1标准的测试访问口,更易于完成系统设计。许多DSP都可以工作在省电模式,使得系统功耗降低。

DSP是一种特殊的微处理器,不仅具有可编程性,而且在数据的运算处理能力上远远超过通用微处理器,其特殊的内部结构、强大的信息处理能力及较高的运行速度,是DSP最重要的特点。

DSP是高性能系统的核心。它接收模拟信号(如光和声),将它们转换成为数字信号,实时地对大量数据进行数字信号处理。这种实时处理使DSP在声音处理、图像处理等不允许时间延迟的领域的应用十分理想,成为全球70%数字电话的“心脏”,同时DSP在网络领域也有广泛的应用。DSP的上述特点,使其在各个领域得到越来越广泛的应用。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈