中兴通讯采用英特尔FPGA 在深度学习上取得性能突破

发布时间:2017-1-26 11:03    发布者:eechina
关键词: Arria , FPGA , 深度学习 , 神经网络
英特尔和技术领先的电信设备和系统公司中兴通讯携手奠定深度学习和卷积神经网络 (CNN) 新基准。互联网搜索和人工智能领域众多公司都致力于提升该技术,例如图片搜索和匹配。

“拥有识别图像中的人脸等感知能力是中兴通讯 5G 系统的基本目标之一”,中兴通讯无线研究院副院长段向阳表示,“深度学习技术非常重要,因为移动边缘计算系统可凭借这项技术实现此类感知能力,进而提升中兴通讯 5G 系统的智能化水平。”

中兴通讯在中国南京的一批工程师利用英特尔的中端 Arria 10 FPGA 产品,对一款采用 CNN 算法的云推理应用进行了测试。

中兴通讯创造了一项新纪录---人脸识别速度超过每秒一千张图像---并达到其特定拓扑的理论精确度。英特尔 Arria 10 FPGA 使原始设计性能提速十倍以上同时保持算法精确度。

Arria 10 FPGA 拥有高达 1.5 TFLOP(1.5 万亿次浮点运算)的单精度浮点运算性能,115 万个逻辑元件,以及超过 1 Tb/秒的高速连接性。 此类深度学习设计可以从 Arria 10 FPGA 系列无缝迁移至高端英特尔 Stratix 10 FPGA 系列,用户可以期望得到多达 9 倍的性能提升。

除了性能的大幅提升之外,中兴通讯无线研究院的研究小组还能够利用 OpenCL 编程语言缩短设计时间。

“借助英特尔参考设计,并利用面向 OpenCL 的英特尔 SDK 编程 FPGA,大大缩短了我们的开发时间。”中兴通讯无线研究院总工程师熊先奎表示,“我们非常高兴基准测试取得了好成绩,并且非常感谢英特尔可编程解决方案事业部对我们项目的大力支持。”

来源:
计算及存储解决方案 - https://www.altera.com/solutions ... orage/overview.html
英特尔Arria 10 FPGA – https://www.altera.com/products/ ... ia-10/overview.html
使用FPGA进行机器学习 - https://www.altera.com/solutions ... chine-learning.html

测试配置:
本次基准测试使用的是一台搭载 4S 英特尔至强 E5-2670v3 处理器(运行频率 2.30GHz)和 128GB DDR4 内存的服务器;测试还使用了包含一块 10AGX115 FPGA、4GB DDR4 SODIMM、Intel Quartus Prime 软件以及 OpenCL SDK v16.1 的英特尔 PSG Arria 10 FPGA 开发套件。

本文地址:https://www.eechina.com/thread-296172-1-1.html     【打印本页】

本站部分文章为转载或网友发布,目的在于传递和分享信息,并不代表本网赞同其观点和对其真实性负责;文章版权归原作者及原出处所有,如涉及作品内容、版权和其它问题,我们将根据著作权人的要求,第一时间更正或删除。
您需要登录后才可以发表评论 登录 | 立即注册

厂商推荐

相关视频

关于我们  -  服务条款  -  使用指南  -  站点地图  -  友情链接  -  联系我们
电子工程网 © 版权所有   京ICP备16069177号 | 京公网安备11010502021702
快速回复 返回顶部 返回列表