基于ARM+FPGA架构的三维图形加速系统

2009年12月24日 11:12    bakedham
关键词: arm , FPGA , 图形加速
引言

在传统的嵌入式系统上,三维图形处理通常由嵌入式CPU独自在软件上完成。但随着三维图形应用程序功能的不断强大,面对图形处理的巨额运算量,CPU变得不堪重负。此时,需要使用特定的硬件设备来为嵌入式CPU承担图形处理的任务。

具有三维图形硬件加速能力的ARM+FPGA架构嵌入式图形系统就是其中一种解决方案。其中,ARM处理器负责运行嵌入式操作系统、执行上层图形应用程序,而三维图形处理所需的大量运算则由FPGA实现的GPU(图形处理单元)进行。

图形API简介

在图形系统中预先定义了一组图形API,作为一个抽象层将图形应用程序和图形系统的具体实现隔离开来。具体的图形应用程序都将通过这些图形API来完成所有与绘制图形相关的工作。这样,同样的应用程序就可以在不同的目标图形系统上运行。

目前应用较为广泛的标准图形API主要有Direct3D和OpenGL。OpenGL定义了与具体硬件实现无关的软件接口,并且不受制于具体的窗体系统。

本文选用23条OpenGL中最常用的API作为本系统的图形API。在执行应用程序时,具体的图形API被转换成GPU可以处理的渲染列表数据格式,从而将计算任务转交由GPU完成,实现对三维图形处理的硬件加速。

系统硬件设计

系统硬件结构

本文设计的嵌入式图形系统由基于ARM处理器的最小系统、FPGA实现的图形加速、LCD控制器等功能模块,以及常用外设接口电路组成,如图1所示。

1.gif

图1 系统硬件结构

基于ARM处理器的最小系统是本系统的核心模块,主要由嵌入式处理器、系统内存SDRAM和FLASH存储器组成。SDRAM为处理器运行操作系统和执行应用程序提供内存空间,FLASH用来存放系统引导代码、操作系统内核和应用程序。

图形加速模块是使用FPGA实现的嵌入式GPU,是系统能够实现硬件加速的关键部件。它通过内部图形处理流水线处理CPU生成的渲染列表,并最终形成像素数据写入帧缓冲SRAM中供LCD进行显示。该模块在三维图形处理中使用固定功能的图形处理流水线,如图2所示。

2.gif

图2 图形处理流水线示意图

图形加速模块在一片SRAM中生成完整帧数据后将其控制权交给LCD控制器,并使用另一片SRAM继续下一帧数据的计算。在新的一帧数据完成后便再次与 LCD控制器交换控制权。LCD控制器通过SRAM仲裁模块从当前显示的帧缓存中读出帧数据,生成符合LCD显示屏要求的时序,完成三维数据的显示。

系统中存在两组LCD总线。一组是ARM处理器提供的LCD总线,用来显示嵌入式操作系统的图形用户界面;另一组是进行三维图像显示的LCD控制器的LCD总线。总线切换模块负责两类总线的切换,将合适的LCD总线挂接到LCD屏上进行显示。

系统硬件实现

本文选用S3C2410嵌入式处理器和Cyclone II系列FPGA实现图形加速以及其他功能模块,辅以LCD屏、串口等外围电路实现整个图形系统。硬件电路如图3所示。

3.gif

图3 系统硬件电路

电源设计

本系统需要多个不同电压值的直流电源供电,包括5V、3.3V、1.8V和1.2V。其中5V电源从外部直流电源直接引入,而其他电压值则由5V电压变换得到。

S3C2410的内核电压为1.8V,外部I/O和存储器电压为3.3V。系统选用低压差稳压器AS1117实现这两种电压的转换,固定输出时只需三个引脚,如图4所示。

4.gif

图4 1.8V电源电路

本文使用TPS70345为FPGA提供1.2V内核电压和3.3V IO电压。

ARM与FPGA接口电路

生成三维图形时,嵌入式微处理器上运行的图形应用程序生成三维图形的渲染列表,并将渲染列表写入到FPGA的渲染列表缓冲区中,等待图形加速模块的处理。 ARM与FPGA接口电路既要保证可以完成渲染列表的写操作,又要能够对FPGA中总线接口模块、图形加速模块、LCD控制器等的内部寄存器进行读写操作。接口电路如图5所示。

5.gif

图5 ARM与FPGA接口电路

系统软件设计

系统软件架构

本文使用FPGA实现整个三维图形处理流水线,由硬件完成三维图形生成和处理。运行在操作系统上的图形应用程序通过调用图形API实现具体应用,而驱动程序将图形API的调用转换成渲染列表,从而将具体的三维图形处理任务交给硬件完成,如图6所示。

6.gif

图6 系统软件架构

考虑到嵌入式图形系统除了进行三维图形处理之外,还应当能够为用户提供友好的用户图形操作界面,本文采用了Windows CE操作系统。

驱动程序设计

设备驱动程序在操作系统和硬件设备之间建立了一个桥梁,让操作系统能够识别设备并为应用程序提供设备服务。

本文中FPGA实现的图形加速模块作为一个设备挂接在系统中。系统在软件上只需要将渲染列表写到该设备的地址空间,因此本文使用了简单的流式接口驱动,所有的流接口驱动程序都使用相同的一组流接口函数。

渲染列表的传递是不需要反馈的,系统将渲染列表写入设备(GPU)后并不需要从设备中获取数据,因此流接口函数GPU_Read()并不需要实现具体功能,只在GPU_Write()中将渲染列表写入到设备中。另外,系统在普通图形界面和三维显示两种显示模式下使用的是不同的LCD控制器。前者使用 S3C2410中集成的LCD控制器,而后者使用的是FPGA模块中实现的LCD控制器,两种模式下通过LCD总线切换模块进行切换。

结语

本文设计了基于ARM和FPGA的嵌入式图形系统,使用FPGA在硬件上实现三维图形处理,缓解嵌入式CPU在处理三维图形时因计算量过大而导致系统效率降低的问题。图像显示符合人眼对图像连续性的要求。另外,作为嵌入式图形系统,本文选用通用的图形应用程序接口标准OpenGL作为图形API,使得系统具有较好的通用性和实用价值。

参考文献

1. 汪小澄,池诚. 基于S3C2410嵌入式系统的网络接口设计[J]. 微计算机信息,2007,23(5-2),131~133
2. 蔡弘,戴胜华. 基于ARM+FPGA的高速信号采集系统设计[J]. 仪器仪表标准化与计量,2007(6),38~40

作者:南京航空航天大学信息科学与技术学院 夏小为 吴宁 刘静    来源:电子设计应用2009年第12期
欢迎分享本文,转载请保留出处:http://www.eechina.com/thread-6922-1-1.html     【打印本页】
您需要登录后才可以发表评论 登录 | 立即注册

相关文章

相关视频演示

厂商推荐


关于我们  -  服务条款  -  使用指南  -  站点地图  -  友情链接  -  联系我们
电子工程网 © 版权所有   京ICP备11013910号 | 京公网安备11010502021702
回顶部