物联网

  • 主页
  • 物联网
  • 解密平头哥芯片三剑!阿里巴巴芯片产业生态玩

解密平头哥芯片三剑!阿里巴巴芯片产业生态玩

发布时间:2019-09-28 14:11:29 所属栏目:物联网 阅读:

阿里的武侠情结,已经延续到芯片中。

阿里巴巴2019云栖大会开幕首日,平头哥发布阿里巴巴第一款芯片含光800,,

含光,正是《列子·汤问》中孔周三大神剑之一。

至此,平头哥集齐AI芯片(含光800)、高性能处理器IP(玄铁系列)和一站式芯片设计平台(无剑SoC平台),端云一体全栈芯片产品家族的雏形已然显现

阿里巴巴CTO张建锋说,含光芯片是万里长征的第一步,阿里今后会成为一家真正软硬件一体化协同发展的科技公司。

不过,主论坛仅简介含光芯片的性能,芯片的详细参数、顶层架构设计图、阿里关于芯片布局的思考等细节,都在当日下午的分论坛上一一揭晓。

在云栖大会首日下午的平头哥生态论坛上,不仅大秀产品进展,官宣IP联盟和发布《云端设计白皮书》,还携手清微智能、云天励飞、炬芯、奉加微、联盛德、艾派克、博雅鸿图等公司连发7款基于玄铁处理器的芯片。当日,将用于即将推出的天猫精灵音箱中。

会后,平头哥研究员孟建熠,平头哥AI芯片负责人骄旸,清微智能首席科学家、清华大学微电子所副所长尹首一教授,云天励飞研发副总裁李爱军,炬芯科技董事长&CEO周正宇等接受智东西等媒体的采访,对含光芯片的核心优势,它在微架构设计上做的创新,平头哥三大产品系列的进展、未来计划和生态构建等问题一一予以解答。

造芯,头件大事就是起名字。

国外有英特尔青睐周边的山川河流,AMD曾钟情于F1赛道;国内华为对高山和古籍情有独钟,紫光展锐看上了动植物所承载的意象,而平头哥则继承了马云对武侠文化的热爱,玄铁、无剑、含光三芯片产品连发,每款都是传说中的利剑。

解密平头哥芯片三剑!阿里巴巴芯片产业生态玩

含光,上古三大神剑之一。《列子·汤问》中,孔周称其“视之不可见,运之不知有。其所触也,泯然无际,经物而物不觉。”即看不见、感觉不到,划过身体也不疼,正如含光800带来的无形却强劲的算力。

至于为何从800开始命名,平头哥AI芯片负责人骄旸说,其实他们最开始想给芯片取名v1.0,后来参考业内其他产品的命名逻辑,800、900代表高端系列,600代表中端系列,200、300代表低端系列。以后平头哥也会做中端和低端芯片产品。

据阿里巴巴CTO张建锋介绍,这款芯片从设计、验证到流片,仅用一年半的时间。

含光800采用台积电12nm制程工艺,含170亿晶体管,支持PCIe 4.0和单机多卡,今年第四季度开始量产。

在芯片测试标准平台Resnet 50上,含光800的具体分数为:

解密平头哥芯片三剑!阿里巴巴芯片产业生态玩

与业界几款领先的云端推理芯片相比,含光800的性能大约是第二名的4-5倍,其能效比约是第二名的3.3倍。

目前含光800

在杭州城市大脑的图像处理业务测试中,

解密平头哥芯片三剑!阿里巴巴芯片产业生态玩

根据现场演示,杭州城市大脑实时处理主城区交通,需用40颗传统GPU,延时为300ms,单路视频功耗2.8W;而使用含光800仅需4颗,延时降至150ms,单路视频功耗1W,有效节约了硬件和时间成本。

解密平头哥芯片三剑!阿里巴巴芯片产业生态玩

再比如,拍立淘商品库每天新增10亿商品图片,使用传统GPU算力识别需1小时,而使用含光800可将时间缩至5分钟,搜索效率提升12倍。

此外,相比传统GPU算力,性价比提升100%。

这意味着,受限于算力瓶颈的企业可通过阿里云,在含光800上更高效地运行更复杂、更先进的算法。

那么,含光800如何实现如此高的图像处理能力,高性能的背后又有哪些创新?

骄旸告诉智东西,阿里巴巴算法团队将算法中的一些通用特征提取出来,帮助含光800芯片实现架构的创新。

过去一年,平头哥团队不断探索芯片和场景的融合,针对场景深度定制了芯片的软硬件,包括自研架构、软件编译器、框架、工具链等;后期,平头哥也针对INT8数据类型做了大量优化,最终在性能、良率、功耗等指标上均表现良好。

含光800采用平头哥自研芯片架构,集成达摩院算法,配以自动化开发工具。其顶层架构采用四核设计,任一NPU Core坏死,都不会影响芯片工作。

解密平头哥芯片三剑!阿里巴巴芯片产业生态玩

具体而言,含光芯片在架构设计中主要做了如下优化方向: