首页 | 新闻 | 新品 | 文库 | 方案 | 视频 | 下载 | 商城 | 开发板 | 数据中心 | 座谈新版 | 培训 | 工具 | 博客 | 论坛 | 百科 | GEC | 活动 | 主题月 | 电子展
返回列表 回复 发帖

低功耗高性能多核DSP满足高性能计算

低功耗高性能多核DSP满足高性能计算

关键字:TMS320C6678   TMS320TCI6609   高性能计算  
日前, 德州仪器( T I ) 宣布推出TMS320C66x 系列最新产品TMS320C6678与TMS320TCI6609多核数字信号处理器(DSP)。这两款产品号称是业界性能最高、功耗最低的DSP,非常适合诸如油气勘探、金融建模以及分子动力学等需要超高性能、低功耗以及简单可编程性的计算应用。
TI 基于C66x KeyStone的多核DSP支持16 GFLOPs/W最高性能浮点DSP内核,有望改变高性能计算(HPC)开发人员满足性能、功耗及易用性等需求的方式。

据称,TMS320C6678是目前业界性能最高且已量产的多核DSP,它具有8个1.25GHz DSP内核,可在10W功耗下实现160 GFLOP的性能。而TMS320TCI6609多内核DSP将为开发人员带来4倍于TMS320C6678多核DSP的性能,它可在32W功耗下实现512 GFLOP的性能。TMS320TCI6609的代码与TMS320C6678兼容,允许开发人员重复使用现有软件,节约投资。

全球电信计算刀片及多核处理器平台制造商Advantech开发了DSPC-8681多媒体处理引擎(MPE),该款半长PCIe卡可在50W的极低功耗下实现超过500 GFLOP的性能。DSPC-8681 PCIe卡包含4个TMS320C6678多核DSP,而更新版本的PCIe卡则包含8个TMS320C6678多核DSP(可实现1万亿次浮点运算)或4个TMS320TCI6609多核DSP(可实现2万亿次浮点运算),为HPC应用带来更高效率、更快速度的解决方案。

TI最新TMS320C66x系列DSP的开发基础是Keystone架构,它能够为多核器件中的每一个核提供全面的处理功能,从而为开发人员提供一系列稳健的高性能、低功耗多核器件。基于Keystone架构的器件针对高性能市场进行了优化,可充分满足无线基站、任务关键型应用、测试与自动化、医疗影像以及高性能计算等市场需求。

据TI半导体技术(上海)有限公司通用DSP业务发展经理郑小龙介绍,芯片的功耗在很大程度上由内核电压来决定,而内核电压受实际运算性能的影响。如果没有自动调整的机制,就需要把电压始终设定在较高的电位上,而这会导致整个系统功耗增大。通过SmartReflex技术,内核可根据计算中所占用的资源来自动调整电压,从而使得主频每兆赫兹以及千兆的运算单元和千兆的浮点运算能力得到最佳匹配。正是因为这样的技术,多核系统才能更好地满足产品需要,在任何评测中均遥遥领先。

郑小龙认为,这两款新产品预示着全新HPC时代的到来。除了产品本身的超高性能与超低功耗特性外,TI可为HPC提供免费优化库,无需花费时间优化代码,此外,还支持C与OpenMP等标准编程语言,便于开发人员进行移植应用。他同时透露,TI已和德州大学奥斯汀分校合作,成功将该校科学计算高密度线性代数库(libflame库)移植至TITMS320C6678,成为多内核创新的又一里程碑。该移植可带来所有libflame功能,能够为众多HPC应用提供基本软件构件组块。这一成果不仅展示了TMS320C6678多核DSP可高效实施这些算法的基本特性,也展示了这些库移植至TI DSP的便捷性。

谈及在DSP领域的核心竞争力,郑小龙表示, TI主要在低端和高端DSP两个方面寻求突破,深挖全处理器平台的能力。TI努力使低端DSP实现超低价格和超低功耗,而对于高端DSP,则在多核DSP方面大力投入,致力于提高处理器的核心处理能力,同时降低功耗。除此之外,TI还拥有一系列多核软件、工具以及低成本评估板(EVM),不但可简化开发,而且还可帮助开发人员进一步发挥TMS320C66x多核 DSP的全部性能优势。
返回列表