首页 > 头条 > 正文
2019云栖大会上,平头哥研发的全球最高性能AI推理芯片问世
09-25 12:26:14 来源:上游新闻

binary_middle.jpg

9月25日,在杭州举行的2019阿里云栖大会上,阿里CTO兼阿里智能总裁张建锋宣布,平头哥发布首款人工智能芯片“含光800”,该芯片可用于公共交通、电商等领域。不久前,阿里云已推出首款嵌入式CPU“玄铁”和系统芯片平台“无剑”。

其实,关于含光800芯片,早在一年前的云栖大会上就已经有预告。当时阿里创立半层导体公司平头哥。张建锋就透露,阿里的首款人工智能芯片将在2019年下半年问世。果然,今年的云栖大会上,平头哥没有失约。

据介绍,含光800是一款AI芯片,偏重推理。由于人工智能芯片的差异化设计主要体现在硬件架构和软件算法上,二者需要高度适配才能发挥芯片的最大价值。从目前来看,传统CPU、GPU在深度学习推理任务上并没有完全发挥硬件能力,例如GPU架构主要针对图像处理设计,其硬件结构、软件生态几乎固化,因此对AI任务很难有深度优化。

含光800性能的突破得益于软硬件的协同创新,芯片架构方面,含光800采用创新的架构,针对深度学习中使用的大量权重参数和张量数据,在支持稀疏压缩与量化处理的基础上,通过独特设计的数据访存与流水线处理技术,大大减低了I/O需求和数据的搬移。NPU同时深度优化了卷积,矩阵乘,向量计算和各种激活函数,通过高有效的硬件资源调度和全并行的数据流处理,把AI运算的性能和能效双双推向极致。

据张建锋介绍,“含光800”的峰值性能78563IPS,峰值能效500IPS/W,1个“含光800”的算力等于10个GPU(图形处理器)。在城市大脑中实时处理杭州主城区交通视频,需要40颗传统GPU,延时为300ms,使用“含光800”仅需4颗,延时降至150ms。拍立淘商品库每天新增10亿商品图片,使用传统GPU算力识别需要1小时,使用“含光800”后可缩减至5分钟。

算法方面,阿里巴巴达摩院机器智能实验室过去两年构建了完整的算法体系,涵盖语音智能、语言技术、机器视觉、决策智能等方向,并且取得多个世界领先水平的成果;硬件方面,阿里巴巴此前已在服务器、FPGA以及存储等领域拥有多年研发经验,此外,平头哥团队在体系结构、编译技术等领域拥有深厚的技术储备。

上游新闻记者 杨野

【免责声明】上游新闻客户端未标有“来源:上游新闻-重庆晨报”或“上游新闻LOGO、水印的文字、图片、音频视频等稿件均为转载稿。如转载稿涉及版权等问题,请与上游新闻联系。

  • 头条
  • 重庆
  • 悦读
  • 人物
  • 财富
点击进入频道
点击进入频道

本周热榜

汽车

教育

美家

楼市

视频