北京太速科技的个人空间 https://www.eechina.com/space-uid-114143.html [收藏] [复制] [分享] [RSS]

博客

八核浮点型DSP的双千兆网接口设计方案

已有 2365 次阅读2016-9-5 15:41 |个人分类:板卡| TMS320C6678, C6678, C6678板卡, DSP, XC6VSX315T

 千兆网络接口具有数据传输速率快、连接方便、可以即插即用的优点,使得其应用较为广泛。随着电子技术和处理器的发展,很多应用场合的数据通信速率超过千兆网口的实际传输速率。例如,在A/D采样中,需要直接存储A/D转换的采样数据,如果A/D转换位数为16位,工作在100MHz,则实际数据量为1.6Gbps。为了实现高速传输,必须采用更高传输速率的接口,例如PCIe或者RapidIO接口。但这些接口不具有即插即用功能,与很多工业既有设备不能直接连接,限制了其应用场合。

  DSP(数字信号处理器)具有较高的工作频率,其内部集成硬件网络MAC接口,外接一个物理层芯片就可以方便地实现千兆网络通信。多核DSP芯片可以连接多个千兆网口,使得其可以应用到高速数据传输场合。本文介绍一种基于多核数字信号处理器TMS320C6678的嵌入式双千兆网络接口,实现单个芯片连接两个千兆网口,这两个网口可以各自独立传输数据,也可以联合传输数据,提高了实际的数据传输速率。

  1. C6678及其结构

  TMS320C6678是TI公司多核处理器中的一款8核浮点型DSP,每个核最高工作频率可达1.25GHz,每个核可以提供40GMAC定点计算或者20GFLOP浮点计算能力,单个芯片可以提供320GMAC或者160GFLOP计算能力。TMS320C6678的片内结构如图1所示。

  TMS320C6678的每个核具有32KB的程序、32KB的数据以及512KB的2级Cache存储空间,芯片片内具有一个4MB的共享SRAM。TMS320C6678具有DDR3控制器接口,可以外接DDR3,直接寻址范围达到8GB。TMS320C6678的片内外设有RapidIO、PCIe、EMIF、SPI、I2 C总线等接口。这些接口通过片内的高速互联总线和各个处理器交互数据。

  和网络相关的片内设备如图1右下角灰色模块所示,主要包括两个对外的SGMII接口、以太交换和网络交换模块,以及用于数据管理的安全加速器和包加速器,可以快速检测数据的校验以及协议是否遵循网络标准,对于错误的数据直接丢弃,降低CPU 的负担。为了加快网络和CPU的数据交换,片内的队列管理器用于管理网络包或者网络帧的缓存、分发等功能。这些数据都采用数据包DMA读写,不需要CPU参与。

  图1 TMS320C6678内部结构图

  图1 TMS320C6678内部结构图

  TMS320C6678的其他片内设备包括PLL、仿真口、信号量、电源管理和复位管理等模块。其中PLL配置CPU和外设的工作时钟;仿真口用于连接仿真器,实现对软件运行的监控;信号量实现对DSP/BIOS操作系统中信号量的控制;电源管理实现整个芯片电流电压的控制;复位管理配置启动的方式,硬复位进行全启动,软复位进行部分启动。

  2. 88E1111及其结构

  网络物理层芯片很多,一般都兼容MII、RMII以及SGMII等接口标准之一或者多个。但TMS320C6678只提供了SGMII接口,所以和TMS320C6678连接的物理层芯片必须具有SGMII接口。本文使用两片Marvell公司的88E1111 物理层芯片进行双千兆网络的连接。88E1111的片内结构如图2所示。

  图2 88E1111内部结构图

  图2 88E1111内部结构图

  网络RJ45接口发送过来的带有调制数据的模拟信号经过A/D转换变成数字信号,然后依次经过均衡、整形滤波和译码后由接收单元传输到MAC芯片,实现数据的接收。MAC发送的数据经过整形滤波后由D/A转换成模拟信号发送到RJ45接口。为了降低误码率,88E1111内部具有锁相环(PLL)、自动增益控制(AGC)、时序/相位控制、回音抵消等模块,这些模块都是为了提高数据传输的可靠性,在不同环境或者不同外接设备下,都可以高速可靠地通信。图2中的LED控制模块实现数据传输时的灯光显示,MDIO模块实现链接建立和状态监测,时钟模块提供工作时钟。

  3. 硬件设计

  硬件设计主要包括TMS320C6678和两个88E1111的接口、88E1111和RJ45的接口、88E1111的硬件配置设计等几个部分。

  TMS320C6678的网络模块结构如图3所示。片内集成了一个3口的以太交换机,负责将两个千兆网口的数据交换到主机,同时提供交换中断到主机,主机通过中断可以实时接收和发送数据。主机通过总线配置或者监控外部的物理层芯片,配置和监控数据通过MDIO接口连接到物理层芯片。

  图3 TMS320C6678网络模块结构

  图3 TMS320C6678网络模块结构

  图4 TMS320C6678和88E1111的接口TMS320C6678和两片88E1111的接口电路如图4所示。TMS320C6678 采用SGMII(Serial Gigabit Media Independent Interface)接口,兼容10/100/1000M 工作方式。SGMII为串行数据收发方式,具有较少的引脚连接。从图4中可以看出,实际上只有两对收发的差分线,分别连接到对应的88E1111引脚上。读写时钟隐含在数据上传输,由硬件自动识别,无须软件参与。

  图4 TMS320C6678和88E1111的接口

  图4 TMS320C6678和88E1111的接口

  MDIO和MDCLK 为TMS320C6678内部MDIO 模块的数据和时钟,用于TMS320C6678和88E1111建立连接,TMS320C6678可以通过该接口配置88E1111,或者读取88E1111的信息。由于88E1111的MDIO模块接口电平为2.5V,而TMS320C6678的MDIO模块接口电平采用1.8V电压,所以两者之间需要增加电压转换芯片,本设计采用PCA9306实现电压转换,接口电路如图5所示。

  图5 MDIO接口的电压转换电路

  图5 MDIO接口的电压转换电路

  需要注意的是,由于存在两个88E111芯片,MDIO和MDCLK引脚直接连接到两个芯片上,MDIO可以最多控制32个物理层芯片,物理层芯片地址分别为1~32.88E1111的地址配置如图6所示。

  图6 88E1111的硬件配置

  图6 88E1111的硬件配置

  表1为对应的配置信息,根据图6和表1,可以看出88E111的地址分别为4和8。

  表1 配置引脚设置

  表1 配置引脚设置

  4. 软件设计

  系统软件设计包括硬件初始化、网络配置以及数据通信流程等。TMS320C6678复位后的工作流程如图7所示。首先配置第一个网口,记录其状态后配置第二个网口。只要两个网口有一个配置成功,将配置TMS320C6678的EMAC模块,为成功配置的网口设置收发缓冲和收发任务。这些配置好后,就可以实现网络的数据收发。需要注意的是,在用户应用程序中,需要考虑到网口配置失败的情况。例如,用户应用程序通过双网口实时传输1.2Gbps的数据,如果一个网口配置失败,则应用程序应有相应的机制将实时传输速率降低到0.8Gbps以下(单网口实际传输速率可能低于0.8Gbps)。本文硬件系统在没有其他任务开销情况下,实测可以传输1.5Gbps的数据(传输过程中不考虑错误,不进行重发)。

  图7 数据通信流程

  图7 数据通信流程

  结语

  超过1Gbps传输速率的通信接口一般采用光纤、PCE、PCIe等接口方式。本文采用双网口方式可以降低设备要求,和既有设备方便连接。使用多核DSP提高处理器工作能力,在保证大容量数据传输过程中,处理器仍然具有对数据的计算能力。双网口设计方案可以弥补单网口的传输速率不足,又可以降低其他接口的硬件复杂度,是介于两者之间的有益补充。在嵌入式设备中具有一定的应用价值。

 

北京太速科技有限公司

基于双TMS320C6678+双XC6VSX315T的6U VPX高速数据处理平台

VSX315T,C6678,VPX板卡,SAR成像,TMS320C6678,FPGA,Xilinx,信号处理板,高速图像处理,软件无线电,基带信号处理,无线仿真平台,高速图像采集,8路AD8路DA MIMO验证,VPX规范,IPMB规范,5G移动通信,智能硬件

 

一、板卡概述

  板卡由我公司自主研发,基于VPX架构,主体芯片为两片 TI DSP TMS320C6678,两片Virtex-6 XC6VSX315T-ff1156 FPGA,1个RapidIO Switch。FPGA连接FMC子卡。FPGA片外挂接2簇32bit DDRIII SDRAM,最大容量支持2GB。每片FPGA还通过EMIF总线连接一片TMS320C6678型8核心DSP。所有信号处理FPGA与DSP均通过SRIO 4X连接板上一片8端口SRIO 4X交换芯片。DSP芯片外挂最大容量支持2GB的DDRIII SDRAM。两片DSP之间通过HyperLink进行高速直接互联。两片FPGA之间通过8X GTX以及若干LVDS信号互联。 
   可用于软件无线电系统,基带信号处理,无线仿真平台,高速图像采集、处理等。支持热插拔,设计芯片可以满足工业级要求。

VSX315T,C6678,VPX板卡,SAR成像,TMS320C6678,FPGA,Xilinx,信号处理板,高速图像处理,软件无线电,基带信号处理,无线仿真平台,高速图像采集,8路AD8路DA MIMO验证,VPX规范,IPMB规范,5G移动通信,智能硬件

二、处理板技术指标

  1. SRIO 4X交换网络连接两片DSP以及两片Virtex-6 FPGA
  2. SRIO 4X交换网络连接4组SRIO 4X至VPX P1;
  3. 具备一个SRIO 4X交换芯片;
  4. 具备高速RocketIO数据传输链路;
  5. 具备I2C接口,实现系统功耗、状态管理;
  6. 可以接入VPX P0参考时钟进行工作;
  7. 通过VPX P0接口定义板卡编号GA[5:0],并设置网络MAC,DSP 网络均可配置交换功能。
  8. 提供2个FMC子卡接口,每个FMC子卡接口与一片Virtex-6 XC6VSX315T FPGA连接;
  9. 支持热插拔,工业级设计。

    FPGA芯片

  1. 具备2片FPGA Virtex-6 XC6VSX315T;
  2. 两片Virtex-6 FPGA直接通过40bit LVDS以及8X GTX互联
  3. 每片Virtex-6 FPGA与一片DSP连接EMIF总线与中断资源
  4. 每片Virtex-6 FPGA对VPX连接28bit LVDS
  5. 每片Virtex-6 FPGA对VPX连接12bit LVCMOS-18
  6. 每片Virtex-6 FPGA对VPX连接8X GTX
  7. 每片Virtex-6 FPGA通过60bit LVDS连接一个FMC-HPC子卡接口
  8. 每片Virtex-6 FPGA外挂两簇32bit最高1GB DDRIII SDRAM
  9. 每片Virtex-6 FPGA外挂一片NOR FLASH用于BPI模式加载
  10. 每片Virtex-6 FPGA对外挂一片SPI接口FRAM

 

DSP芯片

  1. 内建两片TI DSP TMS320C6678型8核心DSP芯片;
  2. 两片DSP通过片内千兆以太网交换网络互联;
  3. 一片DSP的千兆以太网1000 BASE-T连接至板端RJ45;
  4. 一片DSP的千兆以太网1000 BASE-T连接至VPX P2;

、软件系统 
   1) 支持PCIe驱动。 
   2) 支持千兆网络传输,移植LWIP协议栈,支持ping,TCP、UDP、IP传输协议。 
   3) 支持Flash 、PCI Boot引导方式。 
   4) 支持RapidIO X4 EDMA 中断 数据传输。 
   5) FPGA 完整的 DDR2控制、网络数据收发传输。 
   6) FPGA Rocket 光纤数据传输测试程序。 
   7) DSP与FPGA的RapidIO口 EDMA,同步中断传输,满足理论速度10Gbps。 
   8) 支持FPGA程序采用 Flash、DSP引导加载。 

、子卡配用:

 

 
子卡类别
板卡名称
板卡标识码
AD/DA子卡
FMC125-基于FMC接口的两路125Msps AD,两路160Msps DA子卡模块06ADDA000125
FMC145-四路16位125Msps AD FMC子卡模块06ADDA000145
FMC150-基于FMC接口的2路250Msps AD、2路800Msps DA FMC接口子卡模块06ADDA000150
FMC141-4路 250Msps/16bits ADC, FMC板卡06ADDA000141
FMC144-八路14位250MSPS AD FMC-HPC模拟数字转换器板06ADDA000144
FMC160-两路14位400Msps AD,两路16位1.2Gsps DA FMC子卡模块06ADDA000160
FMC209-基于FMC的4路125MAD输入、2路1GDA输出子卡06ADDA000209
FMC210-1路1Gsps AD、2路2.5Gsps DA的FMC子卡06ADDA000210
图像子卡
基于FMC接口的2路CameraLink输入子卡模块06CamLink088
基于FMC接口的2路CameraLink输出子卡模块06CamLink095
基于FMC的8路光纤SFP的子卡模块06FMCSFP0154
基于FMC的2路万兆光纤SFP+子卡模块06XFP000165
基于FMC接口的8路LVDS输入 1路DVI输出子卡
06DVILVDS0215
基于FMC接口的1路full Camera Link输入 1路HDMI(DVI)输出子卡
06CamLink216
DSP子卡
基于FMC接口的TI DSP TMS320C6455子卡模块06TI6455099
基于FMC接口的TI DSP TMS320C6748子卡模块06C67480162

 

、物理特性:
   尺寸:6U CPCI板卡,大小为160X233.35mm。 
   工作温度:0℃~ +55℃ ,支持工业级 -40℃~ +85℃ 
   工作湿度:10%~80%

六、供电要求: 
   双直流电源供电。整板功耗 50W。 
   电压:+5V 5A ,+3.3V 6A。 
   纹波:≤10%

七、应用领域
  软件无线电系统,基带信号处理,无线仿真平台,高速图像采集、处理等。

 

 

北京太速科技有限公司
在线客服:QQ:448468544 
公司网站:www.orihard.com
联系电话:15084122580

欢迎关注 北京太速科技 微信公众号 啊智能时代


路过

鸡蛋

鲜花

握手

雷人

评论 (0 个评论)

facelist

您需要登录后才可以评论 登录 | 立即注册

关于我们  -  服务条款  -  使用指南  -  站点地图  -  友情链接  -  联系我们
电子工程网 © 版权所有   京ICP备16069177号 | 京公网安备11010502021702
返回顶部