首页 | 新闻 | 新品 | 文库 | 方案 | 视频 | 下载 | 商城 | 开发板 | 数据中心 | 座谈新版 | 培训 | 工具 | 博客 | 论坛 | 百科 | GEC | 活动 | 主题月 | 电子展
返回列表 回复 发帖

在 KeyStone 器件上实现高效的 LTE 上行基带前端处理

在 KeyStone 器件上实现高效的 LTE 上行基带前端处理

摘要
LTE 上行基带前端处理包括为 PUSCH、PUCCH、SRS 信道执行的 FFT,以及为 PRACH信道执行的时频转换。这些操作处理的是原始时域天线数据,数据量大,对计算资源和存储资源的需求都较高。文本针对 TI 的 KeyStone 器件给出了完整的 LTE 上行基带前端处理设计,目标是尽可能减少核的干预,消耗尽可能少的资源。本文还详细列出了该设计对各种硬件资源的需求,以及 c66x 核上任务的实测负载。
1、引言
LTE(Long Term Evolution)是由 3GPP 组织制定的 3G 演进标准,在物理层采用 OFDM和MIMO 技术。LTE 分为 FDD 和 TDD 两种双工模式。目前,LTE-FDD 在 20MHz 频谱带宽下的实际速率大约能达到下行 100Mbps、上行 50Mbps。LTE-TDD(国内通常称为 TD-LTE)的实际速率会随上、下行子帧的配比关系而变化。
[1][2][3][4]是主要的几个 LTE 物理层协议文本。[1]描述了上、下行发射机从星座点调制到基带信号上变频之间的处理步骤,通常称为符号级处理。[2]描述了星座点调制之前的处理步骤,通常称为比特级处理。[3]描述了各种物理层过程。[4]描述了各种物理层测量。
LTE 的上行物理信道信道包括用来传输数据和物理层随路控制信令的 PUSCH,专门用来传输物理层控制信令的 PUCCH,用于随机接入的 PRACH,以及用于上行信道探测的 SRS。下行物理信道包括用来传输数据的 PDSCH,用来传输各种物理层控制信令的控制信道 PCFICH、PHICH和 PDCCH。
本文描述的是 LTE 上行基带前端处理。如图 1 所示,LTE 上行基带前端处理包括从天线接口接收时域数据,以及随后的时频变换。LTE 中所有上行信道接收机的第一步都是把信号从时域变到频域,这是上行基带前端处理最主要的任务。PRACH 采用和其它上行物理信道不同的时频结构,因此,前端时频变换需要做两次,一次用于 PRACH,一次用于其它上行物理信道。本文把前者称为“PRACH 前端时频转换”,把后者称为“上行前端 FFT”。



TI 推出了一系列用于 LTE 基站基带处理的 SoC(System On Chip)。这些 SoC 基于 TI 的KeyStone 架构,该架构目前已演进了两代——KeyStone I 和 KeyStone II。KeyStone I 家族基于40nm 工艺,包括如下基带 SoC 器件型号:
• TCI6616,详细资料参见[5]
• TCI6618,详细资料参见[6]
• TCI6614 和 TCI6612,详细资料参见[7]和[8]
• TMS320C6670,详细资料参见[9]
KeyStone II 家族基于 28nm 工艺,包括如下基带 SoC 器件型号:
• TCI6636K2H,详细资料参见[10]
• TCI6634K2K,详细资料参见[11]
• TCI6638K2K,详细资料参见[12]
• TCI6630K2L,详细资料参见[13]
所有这些器件都具有多模能力,支持 GSM/EDGE、WCDMA、TD-SCDMA、WiMAX、LTE 的单模实现或混模实现。所有这些器件使用的 DSP 核都是 c66x,但个数不同。TCI6614 和 TCI6612带一颗 ARM Cortex A8,TCI6636K2H 和 TCI6638K2K 带 4 颗 ARM Cortex A15,TCI6630K2L带 2 颗 A15,它们除支持物理层以外,还支持高层(层 2,层 3)和传输处理。这些器件也可用于基于 OFDM的无线回传(wireless backhaul),如 LTE relay 站。
本文介绍如何在上述 KeyStone 器件上实现高效的 LTE 上行基带前端处理。上述 KeyStone 器件中,只有 TCI6630K2L 包含中频处理模块,称为 DFE 模块,该模块通过 IQNet 模块和系统总线相连。图 1 中的天线接口对 TCI6630K2L 来说指的是 IQNet,对其它器件来说指的是 AIF2。IQNet和 AIF2 都使用 PktDMA 作为对内接口,行为方式类似。本文用 AIF 统一指代 IQNet 和 AIF2,描述的前端处理方法同时适用于两者。关于 KeyStone I 和 II 的 AIF2,请参考[14]和[15]。关于PktDMA,请参考[16]。天线接口一旦配置完毕,在实时运行过程中不需要软件干预,不产生实时负载。本文重点描述时频转换。对天线接口,仅描述其与时频转换交互的部分。
基带前端工作在基带时域采样率上,对 20MHz 载波通常为 30.72Msps,而系统中通常存在多个这样的数据流,对应多天线和/或多载波。对这样高速的数据流做处理,效率至关重要,应尽量减少对处理资源、存储资源、总线资源的占用。上行基带前端的处理效率是基带整体效率的重要组成部分。本文给出了在 KeyStone 器件上用 FFTC 硬件加速器完成尽可能多的时频转换,并将天线接口和两类时频转换用 EDMA 进行直连的方法。该方法使相关的软件负载降至最低,并且尽可能地降低对内存和总线的占用。本文还给出了由 c66x 和 FFTC 共同完成 PRACH 时频转换的方法,并给出了实测负载。该方法减少了对 FFTC、内存、总线的占用,但增加了 c66x 负载。用户可根据自身系统的资源消耗情况选择不同的 PRACH 时频转换方法。关于 EDMA,请参考[17]。关于FFTC,请参考[18]。
本文中的“符号”默认指的是 OFDM符号。
2、上行前端 FFT
图 2 以单片 TCI6634K2K 或 TCI6638K2K 实现 2 个 8 天线 TD-LTE 载扇为例,描述了上行前端FFT 的设计,包括对 Tx/Rx 通道、flow、Q(本文用 Q 表示硬件队列)、Tx 和 Rx 描述符、Acc(本文用 Acc 表示 Accumulator)等物理资源的使用,以及描述符的传递路径。相关的原理和更多的细节参见以下各节。
虽然这里以单片 TCI6634K2K/TCI6638K2K 实现 8 天线 TDD 双载扇为例,本文描述的设计实际上适用于在所有 KeyStone 器件上实现各种部署场景。注意,对于 TCI6634K2K/TCI6638K2K,当不要求所有载扇同时达到最高规格(比如在所有 RB 上执行带信道估计时域内插的 MU-MIMO IRC均衡,下行每载扇瞬时数据流量 300Mbps,每载扇 400 个激活用户等)且经过充分优化时,单片可支持 8 天线 TDD 三载扇。
该设计以一个载扇为基本设计单位。多载扇时,每个载扇使用相同的设计,但可以配置不同的硬件资源。考虑到一个 FFTC 可以在一个符号周期内完成 8 次带 1/2 子载波频偏校正的 2048 点 FFT,为简单起见,要求一个载扇的上行前端 FFT 处理由一个 FFTC 完成。
返回列表