Block RAM性能
片上存储器的性能对于获得更高系统性能来说也非常关键,因为广泛用来存储算法过程之间的数据。无论是基于LUT的分布式存储器、Block RAM或FIFO,片上存储器用于相对较小的缓存存储。不同的应用需要不同的存储器大小以及存取时间。选择正确的存储器层级以及完全利用片上存储器可以大大地提高系统性能。例如,分布式LUT RAM非常适合于更小尺寸(<4Kb)和快速的时钟到数据输出,而Block RAM可以提供更大缓存,频率高达550MHz。 采用65纳米,Block RAM时钟速度增长10%,达到550MHz。然而,为获得当前绝大多数应用期望的性能,Block RAM不能仅仅更快-还需要更大。Block RAM的大小倍增到36KB。这种更大的块(包含两个18Kb的存储器)将支持简单双端口模式的72比特的数据字,这样Block RAM带宽倍增。而且,新的架构提供了专门的连接,使设计师能将两个相邻的36KB Block RAM在Block RAM对列中层叠起来,这样来实现72KB的存储器,运行在最大550MHz速度下。 DSP性能
很多图像、信号和数据处理应用需要能在更高速度下实现数学算法的增强并行特性的专用逻辑。某些最新的FPGA产品使设计师能配置DSP片段来实现复用器、计数器、乘法累加器、加法器和很多其它功能,这些都不需要占用逻辑结构资源。 为了满足对DSP性能似乎无止尽的需求,65纳米DSP模块的性能得到增加,在时钟速度和精度上提高,时钟速度增加到550MHz,与90纳米相比,精度从18×18比特增加到25×18比特。DSP48也针对加法器链的实现进行了优化,一种非常强大的功能使得效率非常高的高性能滤波器的创新得以实现。 每个DSP48的输入输出上的专用布线资源允许任意数量的片段在队列中被“链接在一起”。这种专用的布线资源能确保在链条中的每一个DSP48片段在不占用任何的结构布线或逻辑资源的条件下全速运行,就像其它FPGA所要求的一样。这些改善减少了一半的实现普通高精度功能所需要的资源。例如,在90纳米的FPGA中,实现35×25比特乘法需要四个DSP48,但是对于65纳米FPGA中更宽的DSP48模块,则只需要两个。 图1:在65纳米工艺中6-LUT架构提供了关键路径延时与裸片面积的最优折衷
|