九章智驾官网
会员中心
搜索
九章智驾官网
文章详情
副标题
寒武纪行歌 - 智能驾驶大算力芯片入局者
陈康成
2021-11-05
来源:
引言
10
月
12
日,
中国电动车百人会
在南京举办的
“推动车用半导体产业可持续发展”的峰会
上,
寒武纪行歌
执行总裁
-王平发表了
主题为
“单车智能突破,云边端车协同”的演讲。
演讲中提到:
“寒武纪行歌在
正在研发
一款基于
7nm制程的、算力
大于
2
00
TOPS的SoC产品,
未来还会通过
各种车规
认证,在车上实现
SOP。”
寒武纪行歌刚成立,首款产品就是
7nm制程,算力
大于
2
00
TOPS智能驾驶AI芯片。带着很多的疑问,九章智驾
近日
专访了寒武纪行歌
执行总裁
王平先生。
正文:
九章智驾:
寒武纪本身是做云边端芯片相关业务的,又是出于什么样的考虑,成立子公司寒武纪行歌入局车载领域,开始去做智能驾驶
AI芯片的?
寒武纪行歌
:首先,我们认为车载领域是一个很有前景的市场。汽车产业
体量
很大
,自动驾驶领域
是
AI的很好的一个落地场景;
从人工智能的产业应用来
讲
的话,
自动驾驶是一个
不可或缺的市场
。
这个领域对于
国家和社会
的战略
意义是不一样的,
智能汽车
不仅仅是一个消费品
,还会涉及到数据安全、
社会安全
等
方面的因素,因此智能驾驶的大算力、先进制程芯片
很
有必要
国产化
。
最后,
主要
从
寒武纪
自身
来讲,
在寒武纪
没有上市之前,
主要
还是专注于把云边端的
A
I
芯片做出来
。成立行歌
科技
入局这个领域,是因为无论从
知识的积累,人才的积累
,还是
财力的积累上,都已经达到了
能够支撑我们进入该领域的条件,所以我们
觉得是
在合适
的时间
做了一个正确的选择。
九章智驾
:车载领域
AI芯片从
体量
来讲,相比手机芯片要小不少
,
市场上已有多家有实力的厂商,
并且一些
OEM
又打算
自研
AI
芯片,
行歌直接入局车载领域会不会有些冒险,您
是如何
考虑这个事情或者
去评估这种风险的?
寒武纪行歌
:
第一点:我认为
车载领域
芯片市场,
如果单
从片数来讲,
也许
比不过手机市场的。
但是单车上芯片所占的价值量每年都是在增长的,这是一个
很大的
增量市场。比如,
高端的
大算力芯片
-
英伟达的
Orin
X
,
几百
美元
一
颗
,
蔚来
ET7
单车就要装配
4颗
这样的
智能驾驶
芯片。
智能
驾驶主控芯片这个市场还是非常可观的一个市场,全球新车一年销量差不多
9000万辆左右吧,中国销量接近3000万辆,未来
智能
驾驶
AI芯片
应该
会
是标配,所以渗透率
会
越来越高。
第二点
,我认为主机厂自研
AI芯片
这件事情
并不容易
。虽然说特斯拉现在已经自研出
AI芯片了
,
但毕竟是专供自己使用的,相对整个汽车行业的规模而言,占比还是很小的。
未来能够像特斯拉这样
把芯片
自研
出来,并且成功运用的
OEM
,我认为
会很少
。
因为芯片也需要人才和相关技术的积累,这个是需要很长时间的。
我觉得
应该
是
由
专业的人
去
做专业的事儿,产业链有分工
才
更有利于整个汽车行业的发展。
九章智驾:
寒武纪行歌的定位是去做通用、大算力芯片;大算力好理解,那么通用化是怎么理解的?通用到什么程度,有哪些通用性特征?
寒武纪行歌
:
说我们的车载智能驾驶芯片是通用芯片,严格来讲这个也是不准确的。准确来讲,应该叫
车载
SoC
芯片
,它是一个异构芯片,不仅包括
AI模块,还包括CPU、GPU、DSP以及ISP等其它处理模块。
我们讲所谓的通用性,指得是
SoC上AI模块的通用性;它具有一个通用的AI软件栈或者说基础软件平台,可以让
OEM
车厂或者算法公司在上面比较灵活的、方便
地
移植或者开发他们自己的算法。也就是说,它的灵活性和兼容性比较好。
反之,所谓的专用
AI模块,它的软件平台不具有通用性。它的软件栈是专门针对某一种芯片或者说某种算法进行了专门的定制优化,虽然可以在一定程度上降低功耗,提升性能,但是它也会导致一个不好的后果。
因为它是专用的,所以能够适配的算法
受到局限
,这就导致当
OEM或者算法公司要去移植或者是开发其他算法的时候,需要重新花大量的时间和精力去做适配工作,投入到软件开发的工作量会非常大
,甚至无法实现
。
比如
Mobileye的芯片即使开放AI部分给OEM厂商,也很难有人能把感知算法在它上面跑起来
。
九章智驾:
寒武纪行歌在车载领域这块起步较晚,国内一些芯片公司,有的现在已经具有量产装车经验,并且也在打造生态,行歌有哪些需要追赶的地方,或者说会面临哪些挑战?
寒武纪行歌
:第一点,
虽然我们真正开始做车载芯片
在时间上是晚一些
,
但是寒武纪之前是做云边端芯片的,很多能力是可以迁移到车端上去应用,也就是说我们是具备一定的技术基础的。说
起步早
或
起步晚,其实只是相对的,或者说只是针对不同的模块来说的。
第二点,我认为车载智能驾驶
AI芯片这个赛道
很长,
从辅助驾驶到真正的无人驾驶还有很长的路要走,
我们预计至少
1
0-
2
0年
甚至更长
的
时间
。
刚才问
寒武纪行歌
现在的
差距是什么?
首先,关于大算力、通用性
AI
架构设计能力,我们可以基于母公司的云端及边缘端芯片架构设计能力直接搭建。其次,在基础
软件这部分,我们的积累也是够的。
现在唯一不足的地方,
我觉得
是在
车规
级要求、
可靠性和功能安全方面
。
这块是一个新的课题,
需要我们抓紧时间去提升。虽然说做云端和做车端对能力的要求是不太一样的,难度是有的,但是
我们有信心去克服这样的一个挑战。
九章智驾
:
刚才您也讲了,寒武纪
行歌做车载
AI
芯片,母公司寒武纪
做云边端
AI
芯片的一些能力是可以直接迁移过来复用的,能具体讲一讲,具体都有哪
些能力
能
迁移过来
复用么
?
寒武纪行歌
:
实际上
,我们
可以把车规芯片
的设计
分
三
大部分来看:第一部分
:
芯片架构设计
;
第二部分
:基础
软件
平台设计;
第三部分:
车规级设计要求。
我们一开始的定位
就是做一
款大尺寸、
大算力
的智能驾驶
芯片
。
大尺寸
和
大算力芯片的架构设计
能力
,以及
基础
软件开发
这两部分的能力是寒武纪之前就具备的,这两部分能力我们大多可以直接迁移过来复用。
当然了
,母公司
之前的产品主要是针对工业产品来设计的,或者说高端的工业产品,工业级规格
;
车规
级芯片
有更高的一个要求,
比如在
可靠性
和功能安全等方面
,它是
需要
根据
车规级要求
具体去调整和优化的,但核心的基础模块是一样的。
九章智驾
:
前面您说了,寒武纪行歌的车载智能驾驶
AI芯片的通用性主要是体现在AI模块,那么把AI模块做成通用型的技术壁垒和挑战是什么?
寒武纪行歌
:首先,
需要大量的软件人员,寒武纪现在
约
1
500
人,大概
60%的人是软件人员,为什么?因为做一套
通用的
AI硬件架构
去适应不同的网络,就需要对
不同的算子去做适配
,
所有做通用
A
I
处理
器
的都
要面对
这个问题
。
关于视觉感知的
算
子
是大概有
1000个,
如果做成通用的,
这
1000个算子
便
都需要投入人力去做适配
,这
需要很大的工作量。如果
是做专用的
AI感知模块
,
就无需这么麻烦
,因为
它
只
使用
一部分网络,
也许
只用
到了几十
种
算子
,
那么只需要针对这几十种算子做适配
就好了,其他的
900
多
种都不用管。
做
AI模块本身的技术
原理很简单,难的是怎么把那些千奇百怪的算法
适配
到
我们的
硬件上来。
把
通用性
和网络利用率做好的同时,还能兼顾低功耗
,这是关键
,也是困难的部分。
这个通用型,考验两方面的能力,一方面是处理器架构能力,如何用一个处理器架构
支持好不同类型的众多算法和算子。另外一个就是算法工具链的能力,如何做一个好用易用的
SDK,快速适配新的算法算子。
其次是工艺,
要把算力做大,性能
做
强,最主要
的
就是工艺
方面的
限制
。
高制程的芯片,不仅制造工艺难,而且设计也比成熟制程难得多。以
7nm制程为例,
需要芯片设计公司和
晶
圆
厂家协作把所有
7nm相关的、所能用到的IP全部都得验证一遍。每前进一个工艺节点是需要花费很长时间努力以及大量人力、财力等资源的投入。
九章智驾
:
提升
AI芯片算力的方案,除了工艺手段,通过采用先进制程
能提升算力
外
,
通过改进架构是否能够提升算力?目前的芯片架构大多还是
冯若依曼架构,
未来会不会出现一种新的架构
会颠覆这种
传统
架构
?比如说存算一体芯片,未来的前景如何?
寒武纪行歌
:从
本质
上讲,
提升算力的方法就是增加
晶体
管数量,增加里面乘法器的
和累
加器的数量
;在传统的架构下,无论如何改进软件架构,只能提升硬件利用率,提升不了实际算力。
硬件不会随着的软件变化而变化,芯片
流片
出来
就固定了
,里面有多少个
乘加器
,有多少个晶体管是可以数出来的
。
从宏观的角度看,想要大幅度
提升算力就
一个办法
,
就是
提升工艺。除非不用
深度学习
,不用
CNN网络,那是另外一个概念了
;
改变
AI处理器
架构只是改变
了
对不同网络的适应程度
;
有可能出现新的架构,不过至
少目前
还
没有看到批量应用或者是实际产品落地的
。
传统的
架构
处理器
跟存储器分离
,
中间
需要通过
总线来
通信
,性能受到限制
;所谓的存算一体,就是要把计算单元
和
存储器
一体化的
。也就是说
同一个
处理
单元
既
可以做计算
,又
可以存储
;这种设计相比之前,
整个
架构将会产生很大的一个变化。
这不是一个简单的事情
,
所有的上
层
的软件
以及
系统都得跟着
改变和调整
。
九章智驾
:
对于乘用车来说,
L4有点遥遥无期,中短期内车上的智能驾驶配置还会是以L2级为主,对于该级别来讲,
14
nm
或者
16
nm制程的高性价比芯片基本
已经
满足需求了。为什么行歌还要选择从
7nm制程的大算力芯片入局?行歌在7nm制程上的优势在L2级别这个市场会不会反而成了成本上的劣势?
寒武纪行歌
:首先,之所以我们从做大算力芯片开始,是因为
我们看到
OEM
对大
算
力
芯片
有比较强烈的需求
。尤其是新能源车,由于它
的电池和电动机
是
用
液
冷,大算力
域
控制器的散热问题相对来说要好解决;其次,电动车上用
“数字发动机”-大算力芯片代替了燃油车的发动机”,OEM
都需要
在这个地方下功夫去
实现差异化,
给消费者更好的驾乘体验
。
第三
,从做大算力开始,可以
更好
抢得
市场
,更快塑造我们的品牌力。
很明显
,当前做
低算力的
芯片厂商相对较多,市场竞争也比较激烈,
做大算力、先进制程这种技术壁垒更高的
智能驾驶
芯片更符合我们
品牌
的定位,也更容易切入车载领域市场。
在
L2这个级别上,用7nm制程的话,
成本上的劣势
也许会
比较明显,所以
我们
也
会
准备
好低一些的工艺制程
的。
只是我
们
的产品计划是一步一步来的,先
从做大
算力
芯片开始,然后再往下探
。
小结:
未来很长一段时间内,算力的比拼将是智能汽车重点比拼的性能参数之一;大算力
AI芯片的需求也会越来越高;
针对车用半导体及其供应链痛点
,需要整个产业同心协力,分工合作,让国内的大算力、先进制程的
AI芯片在未来也能尽早的
实现国产化
。
企业观察
深度文章
芯片/计算平台
阅读原文
分享
下一篇:
这是最后一篇
上一篇:
这是第一篇
发表评论
登录评论
匿名评论
提交
提交