最易懂的AI芯片报告！人才技术趋势都在这里

发布时间：2018-12-01 17:30:48 所属栏目：移动来源：智东西内参

导读：副标题#e# 2010 年以来，由于大数据产业的发展，数据量呈现爆炸性增长态势，而传统的计算架构又无法支撑深度学习的大规模并行计算需求，于是研究界对 AI 芯片进行了新一轮的技术研发与应用研究。 AI 芯片是人工智能时代的技术核心之一，决定了平台的基础

无论是家居机器人还是商用服务机器人均需要专用软件+芯片的人工智能解决方案，这方面典型公司有由前百度深度学习实验室负责人余凯创办的地平线机器人，当然地平线机器人除此之外，还提供 ADAS、智能家居等其他嵌入式人工智能解决方案。

2、AI芯片国内外代表性企业

本篇将介绍目前人工智能芯片技术领域的国内外代表性企业。文中排名不分先后。人工智能芯片技术领域的国内代表性企业包括中科寒武纪、中星微、地平线机器人、深鉴科技、灵汐科技、启英泰伦、百度、华为等，国外包括英伟达、 AMD、 Google、高通、Nervana Systems、 Movidius、 IBM、 ARM、 CEVA、 MIT/Eyeriss、苹果、三星等。

中科寒武纪。寒武纪科技成立于 2016 年，总部在北京，创始人是中科院计算所的陈天石、陈云霁兄弟，公司致力于打造各类智能云服务器、智能终端以及智能机器人的核心处理器芯片。阿里巴巴创投、联想创投、国科投资、中科图灵、元禾原点、涌铧投资联合投资，为全球 AI芯片领域第一个独角兽初创公司。

寒武纪是全球第一个成功流片并拥有成熟产品的 AI 芯片公司，拥有终端 AI 处理器 IP和云端高性能 AI 芯片两条产品线。 2016 年发布的寒武纪 1A 处理器（Cambricon-1A）是世界首款商用深度学习专用处理器，面向智能手机、安防监控、无人机、可穿戴设备以及智能驾驶等各类终端设备，在运行主流智能算法时性能功耗比全面超越传统处理器。

中星微。1999 年，由多位来自硅谷的博士企业家在北京中关村科技园区创建了中星微电子有限公司，启动并承担了国家战略项目——“星光中国芯工程”,致力于数字多媒体芯片的开发、设计和产业化。

2016 年初，中星微推出了全球首款集成了神经网络处理器（NPU）的 SVAC 视频编解码 SoC，使得智能分析结果可以与视频数据同时编码，形成结构化的视频码流。该技术被广泛应用于视频监控摄像头，开启了安防监控智能化的新时代。自主设计的嵌入式神经网络处理器（NPU）采用了“数据驱动并行计算” 架构，专门针对深度学习算法进行了优化，具备高性能、低功耗、高集成度、小尺寸等特点，特别适合物联网前端智能的需求。

▲集成了 NPU 的神经网络处理器 VC0616 的内部结构

地平线机器人（Horizon Robotics）。地平线机器人成立于 2015 年，总部在北京，创始人是前百度深度学习研究院负责人余凯。BPU（BrainProcessing Unit）是地平线机器人自主设计研发的高效人工智能处理器架构IP，支持 ARM/GPU/FPGA/ASIC 实现，专注于自动驾驶、人脸图像辨识等专用领域。 2017年，地平线发布基于高斯架构的嵌入式人工智能解决方案，将在智能驾驶、智能生活、公共安防三个领域进行应用，第一代 BPU芯片“盘古” 目前已进入流片阶段，预计在 2018年下半年推出，能支持 1080P 的高清图像输入，每秒钟处理 30 帧，检测跟踪数百个目标。地平线的第一代 BPU 采用 TSMC 的 40nm工艺，相对于传统 CPU/GPU，能效可以提升 2~3 个数量级（100~1,000 倍左右）。

深鉴科技。深鉴科技成立于 2016 年，总部在北京。由清华大学与斯坦福大学的世界顶尖深度学习硬件研究者创立。深鉴科技于 2018 年 7 月被赛灵思收购。深鉴科技将其开发的基于 FPGA 的神经网络处理器称为 DPU。到目前为止，深鉴公开发布了两款 DPU：亚里士多德架构和笛卡尔架构，其中，亚里士多德架构是针对卷积神经网络 CNN 而设计；笛卡尔架构专为处理 DNN/RNN 网络而设计，可对经过结构压缩后的稀疏神经网络进行极致高效的硬件加速。相对于 Intel XeonCPU 与 Nvidia TitanX GPU，应用笛卡尔架构的处理器在计算速度上分别提高 189 倍与 13 倍，具有 24,000 倍与 3,000 倍的更高能效。

灵汐科技。灵汐科技于 2018 年 1 月在北京成立，联合创始人包括清华大学的世界顶尖类脑计算研究者。公司致力于新一代神经网络处理器（Tianjic）开发，特点在于既能够高效支撑现有流行的机器学习算法（包括 CNN， MLP， LSTM 等网络架构），也能够支撑更仿脑的、更具成长潜力的脉冲神经网络算法；使芯片具有高计算力、高多任务并行度和较低功耗等优点。软件工具链方面支持由 Caffe、 TensorFlow 等算法平台直接进行神经网络的映射编译，开发友善的用户交互界面。 Tianjic 可用于云端计算和终端应用场景，助力人工智能的落地和推广。

启英泰伦。启英泰伦于2015年 11月在成都成立，是一家语音识别芯片研发商。启英泰伦的 CI1006是基于 ASIC 架构的人工智能语音识别芯片，包含了脑神经网络处理硬件单元，能够完美支持 DNN 运算架构，进行高性能的数据并行计算，可极大的提高人工智能深度学习语音技术对大量数据的处理效率。

百度。百度 2017 年 8 月 Hot Chips 大会上发布了 XPU，这是一款 256 核、基于 FPGA 的云计算加速芯片。合作伙伴是赛思灵（Xilinx）。 XPU 采用新一代 AI 处理架构，拥有 GPU 的通用性和 FPGA 的高效率和低能耗，对百度的深度学习平台 PaddlePaddle 做了高度的优化和加速。据介绍， XPU 关注计算密集型、基于规则的多样化计算任务，希望提高效率和性能，并带来类似 CPU 的灵活性。

华为。麒麟 970 搭载的神经网络处理器 NPU 采用了寒武纪 IP，如图 12 所示。麒麟 970 采用了 TSMC 10nm 工艺制程，拥有 55 亿个晶体管，功耗相比上一代芯片降低 20%。 CPU 架构方面为 4 核 A73+4 核 A53 组成 8 核心，能耗同比上一代芯片得到 20%的提升； GPU 方面采用了 12 核 Mali G72 MP12GPU，在图形处理以及能效两项关键指标方面分别提升 20%和50%； NPU 采用 HiAI移动计算架构，在 FP16 下提供的运算性能可以达到 1.92 TFLOPs，相比四个 Cortex-A73 核心，处理同样的 AI 任务，有大约具备 50 倍能效和 25 倍性能优势。

（编辑：PHP编程网 - 金华站长网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!

6/9

首页

尾页

6000块的旗舰老出问题	小米MIX FOLD 2折叠屏
iQOO 10 Pro上线手机快	华硕官方泄露ZenFone