英特尔FPGA:加速建设智能互联世界

发布时间:2017年09月28日 15:09    作者:eechina
关键词: FPGA , 智能互联 , 因特尔
2017年9月19日,英特尔在京召开了PSG IFTD媒体见面会。英特尔可编程解决方案事业部副总裁兼客户体验事业部总经理Rina Raman女士做了“英特尔FPGA:加速建设智能互联世界”的演讲,介绍了FPGA技术、FPGA技术的主要应用、英特尔FPGA技术特色等事项。Raman女士的演讲内容丰富详尽,形式也很正式,这里就全文登出演讲实录,请读者就自己感兴趣的内容选择浏览。

Rina Raman:谢谢大家!我是来自英特尔公司的可编程解决方案事业部。我工作的地址在圣何塞。今天主要内容给大家介绍一下FPGA,FPGA怎么样帮助我们加速实现一个智慧的互联的世界。

可以看到,在互联的世界,数据的需求呈现出一个指数型的增长,预测估计在2020年一个平均的互联网用户每天会产生1.5GB的数据,无人驾驶车辆每天会产生4TB,联网的飞机每天会产生5TB的数据量,智慧工厂每天是1PB的数据量,云视频的提供商会产生750PB的数据量。可以看到在一个联网的世界,我们数据量的需求会急剧增长。

1.jpg


根据预测,到2020年,将会有500亿个终端联网,现在我们联网的终端数量是80亿个,未来联网的这些终端数量比现在所需要的带宽每一个都要高。思科预测到2020年IP的流量会达到2300EB量级每年,数据中心会和这些终端连接起来,这些终端又会和数据中心实现连接,这样我们就称为一个良性的循环,这个循环开始随着物联网的发展会加速,意味着网络就必须要在更高的速度上处理更多的数据,数据中心也必须要做更复杂的计算,处理更大的数据集,即使嵌入式的终端和设备也要做很多本地的计算。

除此之外,数据中心还会应对一些更加具有挑战性的工作负载。比如说要进行大数据的分析,还有机器学习,最后可以看到在整个循环当中我们会出现一些瓶颈和计算的热点,这个是CPU单独无法应对的,所以说这个时候就需要FPGA。

我们可以看到这个幻灯片上列出来了我们FPGA针对现在应用最早、转型最厉害的六个全球的市场,一个是5G无线通讯,另外一个是雷达和航天,还有网络的转型、云计算、智慧城市和无人驾驶车辆。无论是哪个市场,实际上它们都面临着同样的挑战,就是连接的数量在急剧增长,计算的复杂度也在不断地增长,这就会带来瓶颈和热点。这个时候,FPGA就可以帮助我们很好地应对这些挑战。它利用FPGA,你的系统的设计不会被锁定,开发时间没有那么长,而且相比这些专用的硬件来说,它更具有灵活性。

2.jpg


现在我们都知道我们在朝着5G无线通讯的时代在迈进,我们可以看到5G未来需要更大的带宽,需要更复杂的数字信号处理能力,但是现在5G的标准没有最终确定,所以我们不知道5G把消费者和物联网的这些终端连接到云以后会出现什么样的用力。现在英特尔处在一个非常独特的位置上,能够帮助我们应对5G所带来的挑战,比如说像固定功能和软件、硬件、可编程的终端,还有端到端的解决方案,在整个良性循环中的每一个点,我们都能提供我们的解决方案。

特别是在5G网络上面,我们的FPGA可以有以下一些能力,比如说加速MIMO天线的计算和基带的信号的处理,安全,还有其他一些可能会制约发展的网络的功能。

另外在航空领域,特别是像雷达处理到安全的通讯,的确也面临着一系列的挑战。包括像波速形成和过滤和更多的像机器学习的算法等等方面的挑战,传统的方法是我们要使用更快的CPU和DSP芯片阵列或者是ASIC专用的集成电路来应对,但是,通过使用FPGA,我们可以加速数字的处理,加速处理机器学习的一些任务,这样的话让我们整个架构会更加简单,而且开发的环境也更加统一。

在网络方面,我们可以看到加速的良性循环和物联网的不断发展,要求我们网络要进行根本性的转型,无论是在本地网还是在城域网,还是在互联网骨干,甚至在数据中心,都要进行转型。可以看到其中转型的一个最关键的核心就是网络功能虚拟化NFV,就是把我们一些关键的功能,像切换、交换、安全和流量、成型,从我们专用的硬件转移到数据中心中的一些软件硬件上面来处理。

另外,这个转型可能也会带来流量方面的一些瓶颈和计算的热点,所以,在这样一个充满了不确定性和快速变化的环境当中,FPGA就给我们提供了一个很好的解决办法,因为它能够加速一些关键数据包的交换、数据包的检测以及安全任务的处理。

在无人驾驶汽车领域,我们可以看到大家都在这方面有很多的投入,这也很好地说明了FPGA能够加速我们刚才所谈到的良性的循环。可以看到,随着无人驾驶汽车的发展,对性能将会有一个极大的要求,再加上对算法和用力方面有很大的不确定性,所以,我们看到可能会出现计算的孤岛,每个孤岛都可能有自己本身的硬件和开发环境,这对制造商来说可能是不可持续的。FPGA实际上在以下两个领域能够发挥非常关键的作用,一个是本地计算,比如说传感器、融合,还有深度学习的推算方面,实际上这些都是要在汽车上本地实时的进行的。

另外,还有安全可靠的5G连接,把汽车和另外其他的车辆和高速公路的基础设施和云实现连接。

另外,看到在智慧城市的领域,现代化的当中有很多的计算孤岛正在出现,包括像我们的交通管理系统和照明管理系统,泊车管理系统和安全的摄像头,实际上他们都是各自为政,这些众多不同的系统由众多不同的厂家来生产,有不同的架构,有不同的开发环境,更重要的是这些不同的系统之间没有办法实现数据的共享,所以,作为城市管理者来说,很难获得一个对城市正在发生的情况的全面的了解。

英特尔的CPU加上FPGA就能取代这些专有的架构,可以提供一些像本地计算、连接和分析的能力,只需要通过加速几个关键的功能就能实现。

另外,我们也可以把这些众多的孤岛放到一个单一的英特尔架构上面,再加上FPGA的环境,再加上5G的网络,实际上可以让我们整个开发的成本实现很好的降低,降低错误率,另外还可以让我们具备数据分析和机器学习的能力,这样的话,我们就可以了解网络产生数据到底能给我们带来什么,这样的话,我们可以做出更明智的决定。

另外,最后一个应用领域就是云计算。在云的环境中,工作负载会出现动态的变化,甚至这些工作负载的构成也会出现快速的变化。有一些工作负载可能所需要的性能即使CPU在合理的功耗水平之下也是难以实现的,所以可能这个服务器卡上需要一些特别的芯片或者是配上一个GPU,专门处理并行的运算,或者是装上网络加速器,处理协议和安全的流量分流。

另外,还有视频的解码器,或者是配上ASIC专用的集成电路,用于搜索的加速和深度学习。但是,事实上在服务器上面并没有空间,也没有足够的功率里支持所有这些芯片都放进去,所以,有一些云的服务提供商和数据中心的架构师就开始转向使用英特尔最先进的FPGA的产品,就是和英特尔Xeon的CPU能够实现很好地连接,提供搜索、计算、加密、分组处理和机器学习的硬件的加速。

随着这种变化的变化和工作负载的变化,你也可以对FPGA进行重新的配置,以满足这些新的需求。

另外,从这三个例子上大家可以看到我们面临着三方面的挑战,一个是处理大量数据的增长,另外我们还要应对快速变化的新技术带来的计算环境的变化,另外就是CPU的功耗是非常重要的。你仅仅靠计算平台同质的扩展,可能没有办法满足所有这些需求,所以就意味着我们需要异构的计算,今天我们可以看到硬件平台包括CPU,包括FPGA,还包括专用的加速器,CPU仍然是我们处理能力的一个核心引擎,再加上一些专用的加速器,比如说加上ASSP和ASIC,就可以实施一些专用的功能,实现最好的计算的效率。

3.jpg


现在我们可以看到FPGA也越来越发挥着重要的作用,特别是在需要灵活加速的时候,因为算法也在不断地发展,而且我们所处的环境当中加速的工作负载也在动态地变化,所以FPGA有以下的好处,相当于一个软件定义的硬件,可以满足性能和计算方面的要求。另外,还有一定的灵活性,能够支持未来的计算和商业需求不断地变化。

这张幻灯片给大家介绍了FPGA实际上对异构计算或者是异构的架构是至关重要的。如果你们对FPGA不熟悉,大家可以把FPGA想象成一种先进的多功能的加速器,一方面能够带来最大的编程的灵活性,支持高度差异化的产品,你还可以在现场进行重新配置,虚拟加速任何数字的算法。另外,他们也是支持并行运算的,所以,他们特别适合未来计算的世界,更重要的是他们的性能从吞吐量,从实施的速度和能耗的角度来说,比CPU或者是GPU要优上十倍。

4.jpg


另外可以看到它可以以更低的时延处理更大的数据,比传统的在硬件产品上跑的基于软件的产品更快。就是因为FPGA有以上这些好处,FPGA相当于具有硬件的性能,又具有软件的可编程的能力,所以说对异构计算的环境或者是架构来说变得尤为重要。

我们这张幻灯片上举了一些FPGA是怎么样使用的例子,它可以支持我们称为LookAside和inline的加速,旁路加速可以让我们把一些重度计算的数据功能转移到FPGA上面,这样可以释放处理器去处理其他一些功能。如果时延比较重要,我们就可以进行内联加速。LookAside旁路加速就可以让我们把一些重度计算的数据功能转移到FPGA上面,这样可以释放处理器去处理其他一些功能。如果时延比较重要,我们就可以进行内联Inline加速。这样通过FPGA的多功能性,可以带来更好的网络的存储和计算的加速。

5.jpg


下面我会给大家介绍一些FPGA在现实生活当中实际的案例。

这张幻灯片给大家展示了我们FPGA带数据库加速当中的应用。数据中心的加速和混合云是非常重要的,但是我们来看一下我们PGA是怎么应对现实生活中一些挑战的?

第一个就是数据库的加速。现在关系数据库实际上是无处不在的,数据分析就变得至关重要了,无论是对电子商务还是广告,对所有人来说数据分析就是最重要的事情。Swarm64是我们英特尔的一个合作伙伴,它就使用了我们最新的FPGA大量处理一些并行的数据,实现了很好的吞吐量,也有比较好的能耗和更高的性能。

6.jpg


Swarm64这个可扩展的数据加速器是一个无缝的插件,能够让我们常用的一些数据库可以处理一些高速的大数据,无论是在云里面,还是在现场,它都可以支持任何的配置。另外,这也是一个很好的内联加速的例子,我们可以把数据存储在数据库之前先进行压缩和处理。可以看到分析的能力是以前的5倍,数据仓库的能力是以前的2倍,存储压缩的能力是以前的3倍。

另外,这个例子是基因测序,可以看到这个数据量非常大,也非常复杂,基本上是分析能力跟不上,所以说很多的研究项目被迫推迟,可能会影响整个医疗界在这方面取得大家都非常需要的医疗的突破。英特尔和Broad Institute合作,希望能够在基因测序这方面取得一些突破。我们共同开发出了一个叫基因分析的工具,GATK,这是一个用于基因分析的软件工具包,Broad Institute开发出来,主要是用于分析大吞吐量测序的数据。

7.jpg


在数据处理的三个阶段当中,FPGA对变体分析的阶段进行了加速,这个阶段也是最影响性能的一个阶段。我们可以看到这种旁路加速可以把计算密集性的任务分流到FPGA,FPGA直接给CPU提供结果。我们可以看到这个工具包的软件和参考设计使用了OpenCL,可以说加速整个改变了基因测序和分析的行业。研究人员现在可以在过去三分之一的时间能够获得5倍的数据量,相当于15倍的提升。所以,通过这样的合作关系,英特尔也帮助了Broad Institute加速了它的Pair-HMM提高了50倍,整个通道能力提高了2.2倍,所以说帮助实现了DNA测序方面取得了很大的突破。

这张幻灯片给大家展示了Attala的系统公司。这家公司想要重造云基础设施,主要是希望能够利用英特尔的FPGA重新设计和开发出来新一代的储存和网络的基础设施。

NVMe代表的是非易失性储存器的规范。它是针对NVND的闪存和下一代固态的储存技术,这也是一个内件加速的例子,不是在软件里面进行处理,数据是在硬件里面通过FPGA来进行处理和加速的,然后再进入到Ethernet Fabric,这个基于FPGA的解决方案相比我们之前的解决方案,可以在读写速度的时延方面降低57-72%。所以,可以看到Attala的解决方案节省了所有软件的开支,这种很好的硬件和软件的解决方案有很强的适应能力,提高了性能,也为云的服务提供商降低了运行成本。而且,还包括企业级的端到端的数据的保护,无论上行还是下行数据的交换,有双重的冗余保护。

8.jpg


这张幻灯片给大家展示了我们几个客户对我们的评价。我就援引中兴和阿里巴巴的评价。中兴说通过利用它制定的拓扑结构,中兴取得了一项新的记录,它的面部识别功能每秒能够识别1000张图片,实现了以前理论上最过的准确性,所以,英特尔 Arria 10的FPGA将原始的设计性能提高了10倍,同时又保证了高准确性。这是中兴对我们FPGA的评价。

另外一个是阿里云,主要是帮助云中的客户访问大量的服务,基于FPGA全新的加速服务,意味着客户能够访问云中丰富的资源,而且无需构建自己的基础设施。

还有京东的评价,我就不读出来了。

这个是我们英特尔提供的一系列的产品,像Stratix 10最新的产品有样片了。另外像Arria 10的终端系列产品已经在全面生产了。像Cyclone 10和Max 10已经大量出货。

9.jpg


刚才跟大家介绍了我们现在已经发货的产品,下面给大家介绍一下我们下一代的FPGA的产品,英文名字叫做Falcon Mesa,这是我们下一代基于10纳米制程的新的Falcon Mesa的产品。可以看到它是使用了英特尔10纳米的制程技术,基于世界上最先进的一个FinFET制程的技术,这是我们第二代使用HyperFlex架构产品,也是第二代基于EMIB的异构的SIP。EMIB实际上是英特尔接口的规范。

还有我们新的产品也会支持下一代的HBM,现在Stratix 10也支持HBM,可以看到它的转换速率可以达到112G。另外我们还支持PC/IE兼4×16的支持,就意味着支持的带宽能够达到16TB。

刚才我也说了,这实际上是我们在并入英特尔以后开发出来的第一代使用了英特尔10纳米制程技术开发出来的产品,我们希望能够继续推动摩尔定律的实现,希望能够给大家带来业界领先的性能和能效。

另外可以看到和英特尔整合之后实际上给我们公司带来了很多的更强的能力,在Stratix 10上面大家也可以看到,我们作为它的企业,也获得了英特尔领先业界3年的制程技术,意味着给我们带来了更大的容量和更快的速度,大家都知道英特尔的制程技术是全球最创新的、最领先的技术,我们也是把它的制程技术用于我们Falcon Mesa的生产和制造。晶体管的数量每两年会增加一倍,那就意味着单位面积的成本会增加,但是,晶体管数量翻一倍意味着性能的改善,从而使每个晶体管的成本降下来了。

我们英特尔也是遵循了这样一个模式,两年一个节奏,从14纳米到10纳米,再通过像(51:26)的一些改善,我们可以看到die的面积可以实现0.46到0.43倍的扩展,晶体管的密度会有2.7倍的提升,在10纳米的时候,这就意味着更好的性能和更低的功耗,在这种我们称之为自排列的双重图( self-aligned double pattern),在这个制程方面,英特尔一直都是领先的。通常在生产硅的过程中,一般都是一层会铺一层研磨,但是,铺两层研磨就意味着这个晶体管有更紧密的封装,那就意味着我们的排列必须更加准确,这种可能会带来的好处是我们制程的控制会更加严格,从而带来密度方面的提升。

10.jpg


另外,刚才给大家介绍了EMIB这个技术,EMIB是英特尔一个桥接、连通的技术,过去你可以通过硅通孔和转接板的技术来实现连接,EMIB实际上提供了一个很好的带与带之间和带桥之间的很好的连接,这个相比于过去的技术,给我们提供了一个更好的解决办法。

这个地方提供的加速堆栈实际上是更多地帮助我们开发者的。之前介绍了很多硬件方面的内容。在软件方面,实际上英特尔给我们带来了更好的新的资源,能够让我们的FPGA让更多的软件开发者能获得。包括我们提供的FPGA的加速数据库,针对至强处理器的,另外还可以为人工智能、数据分析数据压缩提供硬件的加速。

可以看到这张幻灯片是我们展示了一个机器学习的解决方案的堆栈,大家可以看到,这是一个相当于针对FPGA优化的数据库,它实际上可以在一些最通用的常见的网络拓扑上,比如说AlexNet和GoogleNet上面进行实施,高级用户可能会想利用这个堆栈,使用预先定义好的数据库的内核,直接在API的层面进行编程,或者也可以使用英特尔深度学习部署的工具包。

通常一个用户可能会想要利用最常用的深度学习的框架,比如说TensorFow、Caffe来开发出自己机器学习的应用,这个也是支持的。

大家可以看到实际上英特尔给我们带来的这些能力包括强大的封装能力,制程的技术和光学方面的技术,包括我们可以获得它开发的工具、处理器和它的合作伙伴的生态系统,这个实际上我们也可以帮助实现硬件和软件编程的统一。

11.jpg


可以看到,如果再挖深一点,我觉得我们面临着三个方面的转型,一个就是我们可以连接到网络处理器和存储器方面能带来最高的性能,以及最高的FPGA的Fabric的性能。另外,我们可以通过一些先进的制程技术、先进的冷却技术和异构的整合,带来很好的功耗方面的降低。另外,我们也使传统的FPGA设计工具的生产力有很大的提高,让更多的软件开发者可以获得,了解我们相关的一些框架和内容。

12.jpg


总结一下,今天介绍的主要内容包括我们都知道现在的数据像洪水一般的涌来,它就会推动计算网络和存储需求不断增长。第二,我们看到异构计算的平台还有混合云基础设施的发展对于FPGA来说,FPGA未来能够在这些领域发挥更重要的作用。第三,我们看到FPGA是可以满足以下工作负载不断增加的需求,在这个过程当中,FPGA能够帮助很多行业解决他们面临的一些问题和挑战。最后,可以看到英特尔有一个良好的记录,不断地创造着行业的标准和标杆,他们也致力于让我们的FPGA对开发者更易于使用。

最后我想说的是,我们面临的挑战是非常复杂的,面对这样的复杂性,可能需要不同的解决方案来应对挑战。英特尔认为FPGA实际上能够帮助我们加速计算,帮助我们更好地应对今天以及未来数据的需求。


欢迎分享本文,转载请保留出处:http://www.eechina.com/thread-517407-1-1.html     【打印本页】
您需要登录后才可以发表评论 登录 | 立即注册

相关文章

相关视频演示

关于我们  -  服务条款  -  使用指南  -  站点地图  -  友情链接  -  联系我们
电子工程网 © 版权所有   京ICP备16069177号 | 京公网安备11010502021702
回顶部