阵列处理器系统芯片的发展

发布时间:2010-3-1 14:29    发布者:贾延安
关键词: 处理器 , 发展 , 系统 , 芯片 , 阵列
1971年发明的处理器芯片起着定义计算机的作用,从此,计算机是按照处理器芯片的发展而演变的,是芯片上的计算机,处理器芯片的 ISA(Instruction Set Architecture,指令集架构)已是国外的一统天下。1987年人们提出了系统芯片(SoC)的概念,研究如何将计算机的系统设计都转移到系统芯片设计上来,将起到换代的作用。系统芯片已有总线互连的MP(Multi-Processor,多处理器)系统芯片与网络互连的AP(Array Processor,阵列处理器)系统芯片,但AP系统芯片还没有发展到成熟的阶段,给我国的芯片设计提供了一次竞争的机会。因此,我们对MPP(Massively Parallel Processing,大规模并行处理)系统芯片体系结构进行了研究[1]。现在,又从数据流动的计算模式、并行计算的阵列芯片、应用演变的数学技术、以及硅基芯片的制造技术等4个方面的统一,研究了阵列处理器系统芯片的发展问题,提出了如何设计一种统一体系结构的阵列处理器系统芯片,简称APU(Array Processing for Unification architecture,统一体系结构的阵列处理器)系统芯片。

数据流动的计算模式的统一

1935年的图灵抽象机定义了控制数据流动而完成计算的计算模式,现在已形成了指令流、数据流与构令流三种控制数据流动的计算模式。现在流行的控制数据流动的计算模式主要是冯·诺依曼的指令流计算模式,有SISD、SIMD、MISD与MIMD四种体系结构的指令流计算模式。但现在的单核/多核/众核芯片,只实现了SISD的指令流计算模式,以及MMX[SIMD],流水线[MISD],VLIW[MIMD]等低并行计算度的指令流计算模式。由于SIMD的指令流计算模式最适合图像处理算法,SIMD体系结构的处理器与计算机早已得到了发展。数据流计算模式是采用电路设计的ASIC/ASSP芯片,或者是静态重构的FPGA芯片实现的,而构令流计算模式是通过可重构的RC Device(Re Configurable Device)芯片实现的,它们的计算效率高,应用的设计门槛也高,没有程序设计的灵活性,芯片的品种多。因此,我们研究并实现了MISD/MIMD的指令流计算模式,它不仅具有数据流/构令流计算模式的计算高效性,而且具有程序设计的灵活性,应用的设计门槛低,芯片的品种少等。计算模式的统一就是用MISD/MIMD的指令流计算模式,取代没有程序设计灵活性的数据流/构令流计算模式,使所有计算统一成指令流计算模式。

并行计算的阵列芯片的统一

从并行计算来看,有任务级并行计算、数据级并行计算、操作级并行计算与指令级并行计算的阵列芯片。现在的MPP计算机主要是按任务级并行 (TLP,Task Level Parallel)完成计算的;是采用单核/多核/众核芯片实现的。单核/多核/众核芯片正在向TLP计算的MP系统芯片与AP系统芯片演变[2,3],TLP计算是将任务(进程/线程)映射到核(处理器)上完成计算的,是一种MPMD的计算。由于任务(进程/线程)之间存在同步与互斥问题,TLP计算的效率低、编程复杂。数据级并行(DLP,Data Level Parallel)计算是按SIMD模式完成的计算,主要是采用指令流计算模式中的SIMD体系结构实现的,已有GPU等系统芯片[4,5],以及GPU或者是CPU+GPU的MPP计算机。操作级并行(OLP,Operation Level Parallel)计算是在数据流计算模式的ASIC/ASSP/FPGA阵列芯片,与构令流计算模式的RC Device的阵列芯片上完成并行计算的,没有程序设计(改变)的灵活性。科学和艺术都是用来探索4维的时空关系的,APU系统芯片是采用PE(Processing Element)之间的邻接(abutting)技术,探索4维的时空并行计算关系的,实现DLP计算与指令级并行(ILP,Instruction Level Parallel)计算的。阵列芯片的统一就是SIMD的DLP计算与MISD/MIMD的ILP计算,是采用处理元之间邻接互连(Abutting)的 APU系统芯片统一实现的。

应用演变的数学技术的统一

计算科学是源于数学思维与工程思维的“数学技术”,它改变了人们的思维方式。芯片集成度按照摩尔预言速度上升的结果,在高性能计算、网络化计算与嵌入式计算的应用演变中,数学技术促进了计算机的新发展。高性能计算机主要是通过模拟帮助人类了解世界与创造世界的,有地球模拟机、蓝色风暴、宇宙计算机、密码破译机与武器模拟机等。这些计算机的名称就说明了它们的应用演变,都需要通过数学技术建立很复杂的数学模型,以及实验或观测的数据库。模拟的核心就是建立一个与真实或者虚拟系统相关的数学模型,通过数学模型与数据库探讨对高性能计算机体系结构的影响。网络化计算的通信作用是非常成功的,从根本上改变了世界的信息基础设施。现在,随应用演变的数学技术,使计算机网络的作用已从通信作用,发展到资源共享的服务作用,叫做网络计算(Net- Centric Computing)/网格计算(Grid Computing)与网络存储。在高性能并行计算与大容量存储系统的支持下,云计算与SaaS(Software as a Service, Storage as a Service,软件即服务,存储即服务)或HaaS( Hardware as a Service,硬件即服务)等数学技术使下一代数据中心将扮演“数据电厂”与“数据银行”的服务角色。

嵌入式计算是一种计算技术与物理世界相结合的服务模式,有人叫做具体化与物理化应用,模拟了人类与物理世界交互的形式,成了有传感器(模拟人的视觉、听觉与感觉等)与执行机构(模拟人的四肢)的计算机,并通过随应用演变的数学技术,让工业机器能像人一样自主工作。虽然现在人工智能的数学技术只使机器人有了逻辑思维能力、部分形象思维能力,基本没有创造思维能力,但为机器人研究带来了有创见的方法。从形状来说,有人形机器人与非人形机器人。而美国国防部的变形机器人就是要通过随应用演变的数学技术,使机器人具有自组装能力,可保证机器人能成功地登上星球表面。从功能实现方法来说,有人工方法与自然的仿生方法。人工方法的机器人有手术机器人、自动驾驶机器人等。仿生方法的机器人有气流发音的机器人、重力行走机器人、化学机器人、神经元机器人、情感机器人、模拟生物进化过程的机器人、以及分子机器人等,仿生方法使随应用演变的数学技术的计算日益自然化。计算技术的飞速发展,也体现在编程语言的演变上,从最早的Basic到Algol,再到Fortran,以及现在的接近汇编语言的C语言。数学技术最后是通过汇编语言映射到计算机上完成计算的。汇编语言的优点是程序质量高,缺点是可读性差,没有兼容性,是不统一的。因此,APU系统芯片的ISA不是用助记忆符的汇编语言描述的,而是采用了一种面向数学技术也面向指令定义的映射语言描述ISA的,简称M语言 (Mapping/Middle Language)。数学技术是统一到映射语言上,以提高程序的复用性的。

硅基芯片的制造技术的统一

量子计算与生物计算还处于探索阶段,现在的计算机是采用硅基芯片制造技术实现的。人们预计硅基芯片的制造技术到2016年将接近其发展极限,需要寻找新的技术突破。例如,通过扩大芯片面积是提高芯片集成度的一种新途径,就是圆片规模集成(WSI,Wafer Scale Integration)技术。又例如,混合集成电路是一种小型化、高性能和高可靠的互连封装手段,国内将其称为二次集成技术。1993年美国佐治亚理工学院提出了将SoC芯片、MEMS芯片、以及无源元件二次集成在一起的SoP(System on Package,系统级封装)的概念。按摩尔定律发展的IC芯片仅占一个系统的10%的体积,而SoP则解决了系统中90%的体积。特别是2007年 Intel公司率先具备了45nm硅基芯片的生产能力,使半导体产业进入了“材料推动革命”的时代。集成度高达近20亿晶体管的32nm芯片接近实用。

为了解决深亚微米技术的“红墙”问题与嵌入式应用的小型化问题,硅基芯片的TSV三维集成制造技术得到了发展。IBM、Intel与 Samsung等都采用了TSV(Through-Silicon-Via,硅穿孔封装)的三维集成技术。据IBM称,TSV技术能使芯片数据所需要的传输距离缩短1000倍,连线数目增加100倍,功耗低达20%。IBM将把TSV技术应用到无线通信芯片、电源处理器、Blue Gene超级计算机芯片和高带宽内存中。我国2006年全国科学大会提出的“十六专项”体现了芯片设计、制造与应用的产业链特点。在“十六专项”的战略任务的牵引下,有望使我国的芯片技术跟上“摩尔预言”的发展步伐。制造技术的统一就是指三维集成的TSV技术的统一,以实现嵌入式计算机小型化与解决深亚微米的Red brick Wall(红墙)问题;也是提高我国芯片制造能力的必经之路。从设计上讲,APU系统芯片的阵列体系结构,以及传感器、显示器与存储器等芯片都是阵列的,是正好适合于TSV技术的应用的。

结语

APU系统芯片是基于三维集成的TSV制造技术的统一,随应用演变的数学技术的统一、邻接互连的阵列芯片的统一、以及SIMD与MISD/MIMD的指令流计算模式的统一设计的。因为计算机的ISA是随应用演变的数学技术与硅基芯片的制造技术的发展而不断创新的,APU系统芯片设计主要体现在统一改变的并行计算ISA模型上,即DLP计算与ILP计算统一后的双指令格式的ISA模型上。

APU系统芯片的应用需求:精度(字长)、速度(主频,阵列大小)、存储容量、可靠性与功耗等是ISA设计的先导,来源于随应用演变的数学技术,因此,需要为系统设计者提供ISA设计的平台。在APU系统芯片的统一语言的支持下,ISA设计平台也是可以统一的,使它成为不同应用领域的系统设计者的协作工具。

参考文献:

  [1]Shen X B.Evolution of MPP SoC architecture techniques, Sci China Ser F-lnf Sci.2008,51(6):756-764

  [2]Johns C R, Brokenshire D A.Introduction to the Cell Broadband Engine Architecture. IBM Journal of Research and Development,2007,51(5):503-519

  [3]GARA A,et al.Overview of the Blue Gene/L system architecture. IBM journal of research and development, 2005(49): 195-212

  [4]NVIDIA Corp., NVIDIA GeForce 8800 Architecture Technical Brief.2006

  [5]Emil P,ATI Radeon HD 2000 programming guide.AMD Graphics Products Report[R],2007

  [6]Shen X B.The AP SoC for Unification Architecture.待发表

  [7]沈绪榜.嵌入式阵列处理器的发展(J).电子产品世界, 2008,15(10):74-80

  [8]沈绪榜. 航天时代的嵌入式图像处理技术(J).电子产品世界, 2007,14(1):40-42

  [9]沈绪榜.星载嵌入式计算机的技术展望(J).电子产品世界, 2008(1):41

作者:沈绪榜 西安微电子研究所  来源:电子产品世界 2010-2
本文地址:https://www.eechina.com/thread-8629-1-1.html     【打印本页】

本站部分文章为转载或网友发布,目的在于传递和分享信息,并不代表本网赞同其观点和对其真实性负责;文章版权归原作者及原出处所有,如涉及作品内容、版权和其它问题,我们将根据著作权人的要求,第一时间更正或删除。
您需要登录后才可以发表评论 登录 | 立即注册

厂商推荐

相关在线工具

相关视频

关于我们  -  服务条款  -  使用指南  -  站点地图  -  友情链接  -  联系我们
电子工程网 © 版权所有   京ICP备16069177号 | 京公网安备11010502021702
快速回复 返回顶部 返回列表