在系统设计开发中如果已经决定选用DSP,但不确定选用哪款DSP最适合应用时,那么首先就要先了解DSP的各系列产品。
当前通用DSP的代表性产品包括TI公司的TMS320系列、ADI公司的ADSP21xx系列、Motorola公司的DSP56xx系列和DSP96xx系列、AT&T公司的DSP16/16A和DSP32/32C等单片器件,其中以美国德州仪器(TI)公司的产品所占市场份额最大。同时TI公司针对DSP产品开发和外设设计提供了全方位的技术支持,产品升级也很方便,能够实现各种各样的设计方案。本节仅对TI公司的DSP系列进行介绍。
TI公司为各种应用开发提供了多种数字信号处理(DSP)平台,其中包括TMS320C2000系列、TMS320C5000系列、TMS320C6000系列、DaVinci数字媒体处理器和OMAP应用处理器。
1.TMS320C2000系列
TMS320C2000系列DSP又称为数字信号控制器(Digital Signal Controller,DSC),它为数字控制系统提供了DSP性能与MCU外设集成度的优化组合。TMS320C2000系列作为一种低价格、高性能的DSP,适用于控制领域,如工业自动化、汽车电子、电动机控制、家用电器和消费电子等领域。该系列DSP目前主要由TMS320C24x和TMS320C28x组成,所有TMS320C2000平台控制器均实现了全面的软件兼容性。
(1)TMS320C24x
TMS320C24x为16位的定点DSP,工作速率高达40MIPS,片内集成有16~64KB的FLASH存储器,500ns的闪烁式高速的10位A/D转换器,另外还有8个或16个复用输入通道。有些新的处理器还有自动排序的能力,按顺序做16个变化,有一个独立的采样/保持(S/H)预定标器,通过支持不同的输入阻抗给用户带来极大的灵活性。TMS320C24x具有事件管理器,提供脉冲宽度调制(PWM),其I/O特性可以驱动各种电动机及看门狗定时器、SPI、SCI、CAN等。特别值得注意的是,片上FLASH存储器的引入,使其能够快速设计原型机及升级,不使用片外的EPROM,提高速度又降低成本。这类处理器一般用于家用电器、工业自动化、电源转换、检查、办公室设备、传感系统、电力交换系统、变频设备和空调设备。该类处理器的代表器件是TMS320LF2407。
(2)TMS320C28x
TMS320C28x是目前为止用于数字控制领域性能最好的DSP。这类处理器具有32位的DSP核,其中定点DSP采用32位的定点DSP核,最高速度可达400MIPS。浮点DSP采用30位的浮点DSP核,最高速度可达300MFLOPS。具有增强的电动机控制外设,高性能的模/数转换能力和改进的通信接口,具有8G字节的线性地址空间,采样低电压供电(3.3V外设/1.8V核),与TMS320C24x源代码兼容。
TMS320C28x处理器种类众多,包括TMS320F280x、TMS320F281x、TMS320F282x、TMS320F283x、TMS320F2802x/F2803x/F2806xPiccolo等多个子系列。它们的代表器件分别是TMS320F2809、TMS320F2812、TMS320F28232、TMS320F2832、TMS320F28069PZ。同时该类处理器的新品仍正在陆续开发之中。其中TMS320F282x和TMS320F283x是业界最先推出的浮点型数字信号处理控制器,用以实现高速下的高精度控制应用。
TMS320C28x是在浮点与定点之间唯一实现全面软件兼容的处理器,所有TMS320C28x控制器均符合AECQ-100标准,适应于高标准的汽车应用领域,广泛应用于太阳能、风能、燃料电池等绿色电源,家用电器、工业驱动、医疗设备等数字电动机控制,电信、无线基站、UPS等数字电源,以及电动助力转向系统、驾驶辅助雷达、刮水器等汽车领域。
2.TMS320C5000系列
TMS320C5000系列DSP是为实现低功耗、高性能而专门设计的定点DSP。该系列针对消费类数字产品、通信电子、便携式等产品进行了优化,能够充分满足无线和有线通信系统以及数字音乐播放器、3G移动电话、GPS接收器、便携式医疗设备、VoIP和便携式设备等新兴应用,涵盖了从低档到中高档的应用领域。该系列使用最广泛的是TMS320C54x和TMS320C55x两大类。这两类处理器软件完全兼容。
(1)TMS320C54x
TMS320C54x是世界上最受欢迎的DSP之一。这类处理器是16位定点DSP,适应远程通信等实时嵌入式应用的需要,具有高度的操作灵活性和运行速度,其结构采用改进的哈佛结构,具有专用逻辑硬件CPU、片内存储器、片内外设以及一个效率很高的指令集。该类处理器的代表器件是TMS320VC5402、TMS320VC5416、TMS320VC5441。
本书将以TMS320C54x为例介绍DSP应用技术,详细内容见后续章节。
(2)TMS320C55x
TMS320C55x是目前功耗最低的一种DSP,它以TMS320C54x为基础构建,但在TMS320C54x的基础上又有了较大的提高,具备了低功耗、低造价和高性能的特点。
TMS320C55x的核具有双MAC以及相应的并行指令,还增加了累加器、ALU和数据寄存器,其指令集是TMS320C54x指令集的超集,以便和扩展了的总线结构和新增加的硬件执行单元相适应。与TMS320C54x一样,TMS320C55x保持了代码密度高的优势,以便降低系统成本,其指令长度从8~48位可变,由此可控制代码的大小,比TMS320C54x降低了40%。减小代码的长度,也就意味着降低对存储器的要求,从而降低系统的成本。与TMS320C54x相比,其综合性能提高了5倍,而功耗仅为TMS320C54x的1/6。
TMS320C55x广泛应用于2G、2.5G、3G手机和基站、数字音频播放器、数码相机、电子书籍、语音识别、GPS接收器、指纹/模式识别、无线调制解调器、耳机、生物辨识等应用领域。该类处理器的代表器件是TMS320VC5510、TMS320VC5509、TMS320VC5502。
3.TMS320C6000系列
TMS320C6000系列DSP是TI公司推出的高性能DSP。采用TI的专利技术VeloiTI和新的超长指令字结构,使该系列DSP的性能达到很高的水平。该系列主要面向图像、视频、网络和无线宽带通信等需要大规模数据处理的应用领域,例如,视频会议系统、高清晰数字电视、无线局域网、安防视频监控和核磁共振(MRI)等。TMS320C6000系列主要包括TMS320C62x、TMS320C64x、TMS320C67x三大类。
(1)TMS320C62x
TMS320C62x是32位定点DSP,该处理器的内部结构与以前的DSP不同,内部集成了多个功能单元,可同时执行8条指令,其主要特点有:
1)运行速度快。指令周期为3.3~6.7ns,运算能力为1200~2400MIPS。
2)内部结构不同于一般DSP。内部同时集成了2个乘法器和6个算术运算单元,且它们之间是高度正交的,使得在一个指令周期内最多能支持8条32位的指令。
3)指令集不同。为充分发挥其内部集成的各执行单元的独立运行能力,TI公司使用了VelociTI超长指令字(VLIW)结构。它在一条指令中组合了几个执行单元,结合其独特的内部结构,可在一个时钟周期内并行执行几个指令。
4)大容量的片内存储器和大范围的寻址能力。片内集成了64~384K字程序存储器和64~512K字数据存储器,并拥有32位的外部存储器界面。
5)智能外设。内部集成了4个DMA接口,2~3个多通道缓存串口,2个32位计时器。
6)低成本。在一个无线基站的应用中,每片TMS320C62x能同时完成30路的语音编解码,每路成本为3美元,而以前的DSP系列最大只能完成5路,每路的成本为7美元。
这类处理器适合于无线基站、无线PDA、组合Modem、GPS导航等需要大运算能力的应用场合。该类处理器的代表器件是TMS320C6211、TMS320C6201。
(2)TMS320C67x
TMS320C67x是TI公司继定点TMS320C62x系列后开发的一种新型浮点DSP处理器,这类处理器的内部结构在TMS320C62x的基础上加以改进,内部同样集成了多个功能单元,可同时执行8条指令,其主要特点有:
1)运行速度快。指令周期为2.86~6.7ns,运算能力为1200~2100MFLOPS。(www.xing528.com)
2)硬件支持IEEE格式的32位单精度与64位双精度浮点操作。
3)集成了32×32位的乘法器,其结果可为32位或64位。
4)TMS320C67x指令集在TMS320C62x指令集的基础上增加了浮点执行能力,可以看做是TMS320C62x指令集的超集。TMS320C62x指令集在TMS320C67x上运行时无须任何改变。
这类处理器适用于对运算能力和存储量有高要求的应用场合,如专用音响、乐器、广播音响与商用音频应用,并可应用于工业生物、控制与医疗等方面。该类处理器的代表器件是TMS320C6711、TMS320C6713、TMS320C6727。
(3)TMS320C64x
TMS320C64x是TMS320C6000系列DSP中最新的32位高性能定点处理器,其软件与TMS320C62x完全兼容。TMS320C64x采用VelociTI1.2结构的DSP核,增强的并行机制可以在单个周期内完成4个16×16位或8个8×8位的乘累加操作。采用两级缓冲存储器(Cache)机制,第一级中程序和数据各有16KB,而第二级中程序和数据共用128KB。增强的32通道DMA控制器具有高效的数据传输引擎,可以提供超过2GB/s的持续带宽。与TMS320C62x相比,TMS320C64x的总性能提高了10倍。
这类处理器是目前计算高密度型视频/图像应用领域的理想选择。它代表了DSP领域的最高性能水平,到目前为止已经形成了相当丰富的产品线,并在TMS320C64x的基础上派生出了针对无线音/视频应用和3G通信的DaVinci系列。该类处理器的代表器件是TMS320C6416、TMS320C6424、TMS320C6455(1.2GHz)。
4.DaVinci系列
TI公司于2005年末首次推出了新一代高性能DSP TMS320DM6443、TMS320DM6446,并命名为达·芬奇(DaVinci)数字媒体处理器。该系列的处理器一般采用TMS320C64x DSP+ARM9的结构设计方案,并在此基础上增加了视频处理子系统(Video Processing Sub-System,VPSS)和视频图像协处理器(Video ImageCo-Processor,VICP)以及配套的RTOS和音/视频编解码等软件,极大地增强了处理器的处理性能和开发便利性。DaVinci系列主要针对高清晰度视频处理应用,为设备制造商提供集成的处理器、软件和工具来简化设计流程、加速创新的数字视频应用。低端一些的可应用在车用视觉系统(车道偏离、避免碰撞)以及机器视觉系统、机器人技术、网络摄像机、数码相机等应用领域,而高端的处理器则主要应用在多格式视频安全设备、视频电话、高清数字电视广播通信系统等应用领域。目前,DaVinci系列处理器根据不同的应用目的而推出3个子系列。
1)TMS320C64x/TMS320C643x DSP+VICP:4000~7200MMACS,代表器件是TMS320DM647、TMS320DM648、TMS320DM6435、TMS320DM6437。
2)TMS320C644x/TMS320C646x DSP+ARM9+VICP:4700MMACS(DSP)+300MHz(ARM9),代表器件是TMS320DM6441、TMS320DM6446、TMS320DM6467。
3)ARM9+VICP:270MHz,代表器件是TMS320DM335、TMS320DM355。
DaVinci系列处理器的3个子系列针对不同的应用目标和成本要求。TMS320C64x/TMS320C643x DSP+VICP子系列没有采用ARM核,能以较低的成本实现音/视频的各种编解码处理;TMS320C644x/TMS320C646x DSP+ARM9+VICP子系列是实现高清晰音/视频编解码的最佳选择;而ARM9+VICP没有采用通用的DSP核,其借助VICP实现MPEG4和JPEG等低成本处理。
DaVinci处理器的主要特点是:
1)整体性能高。采用SoC技术,将高性能TMS320C64x DSP与高端ARM内核相结合,前者提供强大的音/视频数字信号处理能力,后者提供丰富的外设接口,使得芯片的整体处理性能高效和完备。
2)音/视频信号处理速度快。由于采用高性能的TMS320C64x DSP和VPSS、VICP硬件子系统相结合,图像和视频的缩放、图形字符叠加以及H.264、MPEG4、H.263、WMV9、VC1、MPEG2、JPEG、AAC、WMA9、WMA8、G.711、G.728、G.723.1、G.729等各种音/视频信号编解码速度很快。
3)片上外设丰富。除了音/视频I/O接口外,还具有10/100以太网媒体接入控制器(MAC)、UART、I2C、SPI、GPIO、McBSP和PWM等,使得处理器的外部通信控制能力得到了有力保障。
4)丰富的开发工具与环境。DaVinci系列处理器的应用软件开发环境有Linux、WinCE操作系统、CCS3.2集成开发环境,而开发工具有XDS560仿真器、DVEVM以及音/视频处理API等。这些开发环境和工具使得应用系统的开发变得相当容易。
DaVinci系列处理器代表着TI公司的最新技术,推出的时间并不长,但已经有了针对不同性能和成本要求的3大子系列产品。随着3G移动通信时代的到来、高清晰数字广播电视的推广以及各类音/视频手持消费电子产品的不断推出,该系列的产品将会得到更多的应用并逐渐体现出其价值。
5.OMAP系列
TI公司的OMAP系列平台提供了各种高性能应用处理器,被称为开放式媒体应用平台,通过ARM处理器(适用于协调命令与控制)与DSP(适合计算密集型信号处理任务)相结合,对具体应用中的实时密集型计算处理及控制功能进行分配,把不同的任务交给适合的处理器来处理,以发挥整个OMAP系列处理器的最佳性能。OMAP系列处理器的推出主要针对数字媒体、生物特征识别、定位服务、增强型游戏及远程通信等商业及工业应用领域,并已经在2.5G/3G手持无线通信终端及PDA市场上表现出强劲的发展势头。OMAP系列处理器大体可以分为以下3个子系列。
1)TMS320C55x DSP+ARM9:400MIPS(DSP)+150MHz(ARM9),代表器件是OMAP5910、OMAP5912、OMAP1610、OMAP1612。
2)TMS320C55x DSP+ARM11:440MIPS(DSP)+330MHz(ARM11),代表器件是OMAP2420。
3)ARM+协处理器:200~600MHz(ARM9、ARM11、ARMCortex),GPRS/ISP/IVA/PowerVR,代表器件是OMAP750、OMAP2430、OMAP2431、OMAP3503。
尽管TI公司曾经设计过TMS320VC5470、TMS320VC5471这类DSP+ARM结构双核处理器芯片,但真正意义上的DSP+ARM双核OMAP处理器是在2002年推出的OMAP5910,当然,TI公司的OMAP系列处理器中有些是纯粹基于ARM核的,一般会带有一个用于图像和视频编解码或者GPRS/GSM的协处理器。例如,2008年发布的OMAP35x系列处理器是基于ARMCortexA8的,其带有一个2D/3D图形加速协处理器。
OMAP系列处理器的主要特点是:
1)处理效率高。采用DSP+ARM双核结构或者带有图像视频协处理器的RISC结构,大量的复杂数据运算处理和通信、控制处理得到合理的分配,使整个处理器的处理效率和性能得到了极大提升。
2)有效的开发环境。支持Microsoft Windows CE、Linux、Wind River VxWorks等领先的操作系统及TI公司的DSP/BIOS实时可扩展内核。通过优化的处理器间通信机制,使用熟悉的工具、标准应用编程接口(API)以及无缝的DSP接口,设计者可以更快速地向市场推出创新型产品。内置式处理器间的通信机制消除了开发商单独对DSP及RISC进行编程的必要,极大地缩短了编程时间,同时显著降低了编程的复杂性。
3)丰富的外设。配备有多种极佳外设的片上系统功能,包括192KB RAM、USB1.1主机与客户机、MMC/SD卡接口、多通道缓冲串行端口、实时时钟、GPIO与UART、LCD接口、SPI等。
OMAP系列处理器的发展起步虽然较晚,但作为2.5G/3G时代无线多媒体移动终端的主流处理器芯片,其正在快速发展。目前的OMAP系列处理器品种较多,如OMAP35x子系列,其中包含的4个处理器均以ARM CortexA8为核心,其中的两个处理器OMAP3525、OMAP3530还具有TMS320C64x DSP核,而另外两个OMAP3503、OMAP3515则没有。
表2-1列出了TI公司主推的以上5大系列DSP产品的主要应用领域。
表2-1 TI公司主推的DSP系列产品的主要应用领域
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。