阿里造芯这一年
其后9月云栖大会,阿里宣布成立平头哥,并且先将“狠话”放下,正在打造一款NPU,架构设计上,性能成果就要比业内最好的AI处理器强大40倍。
此言一出,语惊四座。
然而一年之后的现在——成绩单时刻——阿里平头哥确实没有食言。含光800,性能46倍于P4,甚至比最新一代英伟达T4,也有15倍领先。
虽然过程并非完全顺风顺水,但过去一年,“含光”团队不仅完成了从无到有的跨越,更是超越了所有人的预期。
整个过程中,含光800团队在软硬件设计上都做了大量工作,例如做架构创新,软件编译器、框架、工具链等,后期还针对INT8数据类型进行了大量优化。
含光800芯片负责人骄旸透露,这款芯片采用自研架构,针对深度学习中使用的大量权重参数和张量数据,在支持稀疏压缩与量化处理的基础上,通过独特设计的数据访存与流水线处理技术,大大减低了I/O需求和数据的搬移。
芯片同时深度优化了卷积、矩阵乘、向量计算和各种激活函数,通过高有效的硬件资源调度和全并行的数据流处理,把AI运算的性能和能效双双推向极致。
另外,还集成了达摩院算法。针对CNN及视觉类算法深度优化计算、存储密度,可实现大网络模型在一颗NPU上完成计算。
更难能可贵的是,平头哥团队攻克了一系列挑战。
例如如何兼顾性能、良率、功耗等。平头哥在软硬件上充分考虑了这些问题,用最短的时间完成了芯片的设计、流片整个过程,7个月完成前端设计,之后仅了3个月就成功流片。
骄旸感慨,从传统造芯角度来看,几乎是一个不可能完成的任务。但最终,阿里AI芯片团队,还是创下纪录,完成挑战,把不可能变为可能。
这其中,自然有“007”们日日夜夜的苦功,不过也不容忽视乘风起势的大趋势作用。
正所谓时来天地同协力,AI时代的专芯专用需求,阿里业务场景加持优势,都是不得不说的核心原因。
版权申明:本内容来自于互联网,属第三方汇集推荐平台。本文的版权归原作者所有,文章言论不代表链门户的观点,链门户不承担任何法律责任。如有侵权请联系QQ:3341927519进行反馈。