深入解读禾多科技自研的域控制器——HoloArk

陈康成
2022-12-14
来源:

前言:


无论是看技术发展趋势,还是看市场发展前景,行泊一体域控制器无疑已成为自动驾驶领域新的竞争焦点。


1)技术发展趋势维度


从EE架构的发展趋势来看,集中式域控架构是传统分布式架构向前演进的必然结果。行泊一体方案作为智能驾驶域控的技术方案,已经得到业界充分的认可。


行泊一体域控方案相比于过去行车和泊车功能相互分离的开发模式,具备硬件综合成本低、软件配置灵活、传感器数据可共用等优势。因此,是否搭载行泊一体方案已成为衡量各主机厂上市车型智驾竞争力水平的重要参考指标之一。各大主机厂都在加快推进行泊一体方案的规模化量产进程,以期占据更多的主动权。


2)市场发展前景维度


据高工智能汽车研究院监测数据显示,2022年1-9月中国市场(不含进出口)同时前装标配搭载行车+泊车功能的乘用车上险量为105.69万辆,接下来前装搭载“行泊一体”域控制器的乘用车数量将会同步迎来大规模增长。


据市场反馈,在今年下半年,国内有多家的行泊一体方案将陆续实现量产交付。据相关数据显示:从2023年开始,行泊一体方案的新车前装搭载量将快速进入上升通道,前装同时搭载行车+泊车功能的乘用车上险量有望突破300万辆,其中,行泊一体域控方案占比将超过60%。


随着国内汽车智能驾驶功能渗透率的不断上升,整合芯片和核心算法的行泊一体域控制器将成为自动驾驶系统价值链上的关键部分和产业链上的利润集中点。


尽管行泊一体域控制器如此重要,各自动驾驶方案商对要不要自研域控制器的态度却不尽相同:通常,具备硬件背景的公司对自研域控制器的态度较为积极,而具备软件算法背景的公司则更倾向于专注于自己擅长的软件算法,去服务于域控制器厂商或者主机厂。


当然,以软件算法创新能力切入赛道的科技公司,也在积极拓展业务边界,加速软硬融合的脚步。如禾多科技就选择自研了域控制器HoloArk,并在今年获得了奇瑞等头部厂商的定点,即将在明年量产装车。


那么,禾多科技为什么会选择自研域控制器?自研域控制器的底气又来自哪里?自研域控制器的进展如何?如何克服域控制器在商业化落地过程中面临的问题?带着这些疑惑,笔者与禾多科技禾多科技域控平台高级总监于英俊、禾多科技高级产品总监毛涛进行了深入的交流,希望能够找到一些答案。







1. 禾多科技为什么会选择自研域控制器?



域控制器是一个载体,对于自动驾驶方案商而言,有了这个载体才有可能获得更多数据的使用权,进而把软件算法迭代得更好。

1.1


有助于获取更多数据的使用权,“反哺”算法迭代

对于禾多科技而言,为主机厂商提供自研的域控制器,既能更好地发挥算法的作用与主线性,更重要的是将会获取更多数据的使用权,进一步反哺自身研发,加速算法迭代。


此外,相比于单独卖软件,自研域控制器能够让主机厂与自动驾驶方案商在合作方式上有更多的选择—— 禾多科技不仅可以为主机厂单独提供软件方案,同时也可以为主机厂提供软硬一体方案。这样有利于禾多科技获得跟更多客户合作的机会,让更多的车用他们的软件算法,进而获得更多数据的使用权。


1.2


有助于更好地形成功能体验上的差异化优势


目前业内都在谈“软件定义汽车”,但现实情况是:行泊一体域控制器的软件相对标准化,差异化主要体现硬件上。


“虽然软件定义汽车,但是硬件决定软件。因为随着场景数据的不断迭代,各家上层功能算法的性能越来越趋一,很难做差异化,要把功能体验的差异化做出来,硬件是一个重要支点,自研域控制器有助于禾多科技在硬件层面以及软硬结合的整体性能上带来更好的用户体验。”禾多科技域控平台高级总监于英俊解释道。


1.3


有助于实现更好的用户体验


相比于单独做软件算法,自研域控制器有助于禾多科技从系统设计层面更好地去打通行车、泊车的各个系统,用从而给户提供尽可能统一的交互方式和连贯的智驾体验,让用户更少花时间去调用功能,最大程度地提升自动驾驶功能的使用体验。


因此,除了自研域控硬件外,禾多科技还专门打造了驾舱一体人机交互系统。其中驾舱明星产品 CID One(Center Information Display One)以响应式模块交互、主动化智驾建议、全场景数字孪生等功能定义人车共驾,为消费者创造安心便捷的自动驾驶体验。


图片



CID One设计理念:


行泊一体-“One”智驾:打通行泊功能,提供连贯、流畅的智驾体验。


智驾一张图-“One”地图:融合SD地图和HD地图,形成全局导航规划和道路结构清晰的“一张图”;


智驾一张嘴-“One”语音:统一智驾、导航和座舱前装语音,用“一张嘴”式智能语音提供连贯交互;


组件适配-“One”规范:运用统一的视觉元素和组件规范,形成一致的交互场景呈现。







2. 禾多科技自研域控制器的底气来自哪里?


智能驾驶域控制器已经成为各自动驾驶公司竞争的焦点,具备硬件背景的自动驾驶方案公司大都也在研发域控制器。相比于他们,算法背景的禾多科技自研域控制器的底气又来自哪里呢?


2.1


软硬件融合能力


对于行泊一体域控制器方案而言,软件和硬件的搭配非常重要,直接影响到算力的释放和算法的发挥,并最终影响到系统的性能表现。


为了充分发挥域控制器中芯片的算力效能,禾多科技坚持以“软硬一体”的思路,实现软件算法和硬件算力的深度耦合。于英俊举例说:“在做域控设计时,我们会充分考虑各芯片异构核性能,模型适配度,并结合禾多自身的技术优势去做芯片选型和硬件设计。比如我们在做硬件方案设计时,会选择技术复用度高,具备成熟工具链与生态的芯片,结合禾多在多传感器融合和规控方面的算法优势一起考虑进去。”


图片

△软件算法和硬件算力深度耦合的案例


另外,禾多科技通过自研中间件来充分发挥域控制器硬件的性能。


为什么都有专门的供应商去做中间件了,禾多还要自研中间件呢?于英俊认为:“商业化的软件可定制性较差,不能满足不同客户的差异化需求,其次工具链费用及人力维护成本较高,会加大项目的整体成本。禾多自研的中间件会结合上层功能算法的需求,以及参考AUTOSAR官方的标准需求,开发了一套能够满足Adaptive AUTOSAR标准及SOA架构的自动驾驶中间件。"


“最近这两年业内一直在强调‘软硬解耦’的概念,但是在真正的量产项目里,中间件如何在嵌入式平台里做好,如何把 CPU以及RAM这些硬件资源优化到极致,把软件算法及芯片异构核的算力性能充分发挥出来,还是需要跟硬件资源深度绑定。”


△禾多科技HoloSAR Designer工具


2.2


系统优化能力


对于中低算力平台而言,如何以有限的算力处理众多传感器输入的海量数据,完成相应的感知任务,一直是个技术难题。一些量产车型上甚至会出现由于芯片算力不足,关闭部分摄像头或者是降低性能指标来保障主体功能的情况。那么,HoloARK 1.0 是如何以18TOPS的AI算力去处理10颗高清摄像头的图像数据,并保证所有相关功能的正常运转呢?


禾多科技通过对功能颗粒度进行细化、算法优化以及通讯协议栈的优化来充分发挥域控中各芯片算力的有效利用率,进而保证相关功能的正常运行。


1)功能颗粒度的细化   


在功能部署方面,根据各芯片的物理特性对不同核进行不同的任务分配。于英俊举了一个比较细节的例子,他说:“感知会涉及到做前处理和后处理,以往前处理的一些工作都是在 CPU 里面去做,现在我们把前后处理的一些工作放到DSP去完成。再比如,泊车涉及 V -SLAM定位,以前在MDC610平台上这个功能是放到CPU-A72核去实现,现在在TDA4平台上,V-SLAM移到 C66的DSP 上去完成。”


2)软件算法的优化


禾多科技对底层软件进行了很多的创新,于英俊举例说:“操作系统宏内核的模块有很多,如果加载太多会影响系统的启动时间。我们通过优化底层操作系统 —— 把一些非关键或者对实时性要求不高的模块,从内核态挪到用户态,实现了系统的两秒快速启动。


“在算子库的编辑方面,我们一般不会用芯片自带的算子库,因为那些计算的编辑方式是芯片加载的、通用的,性能不一定好。我们在做Kernel编辑的时候,会做更多的优化。比如,原先TDA4 VM 里的Kernel计算是用 int 8 矩阵计算,我们通过优化可以做到浮点类型16 位的Kernel编辑,这样便能够加快芯片对上层功能算法的处理速度。”


另外,据禾多科技高级产品总监毛涛透露,之前用于感知的一些神经网络模型,因为网络模型尺寸太大了,只能跑在大算力平台上。针对这个问题,禾多科技通过对一些特征网络进行裁剪,去掉一些不必要的部分,同时精简和合并一些节点,在算法层面把一些子功能进行合并等。通过一系列的优化措施,最终使得感知网络模型能够跑在现在的中低算力平台上。


3)通信协议栈的优化


于英俊说:“以往底层通信中DDS的CPU的占有率都会达到30%,通过优化,我们把CPU的占有率控制在10% ,主要是优化协议栈本身,及底层通信方式,支持虚拟以太网,Zero-Copy;”


“同时,在域控制器里我们构建松耦合、易扩展的通信软件架构,引入DDS-TSN全域通信的概念,即在SOC和MCU芯片内都会部署DDS融合TSN的协议,设定Qos策略及配置参数,实现上层全功能节点的核间和片间确定性通信。”


2.3


高效的数据闭环通路


于英俊告诉九章智驾:“禾多科技在做域控制器开发的时候主要考虑到了两点 —— 一是满足客户需求,推动其尽快量产落地;二是满足自身的数据闭环能力需求。”


那么,在域控制器方面,禾多做了哪些工作使其能够很好地满足数据闭环能力的需求?于英俊讲述了以下两个细节:


1)时间同步

做数据采集需要有统一的时间基准,禾多在自己的域控制器上会维护两套时间:一个是域内的满足自动驾驶功能需求的数据面时间,这个时间是不允许有跳变;另外一个是跨域传输的管理面时间,主要负责数据及日志上云等需求。

另外关于多路相机的同步曝光,禾多域控可以把同步曝光的误差控制在5微秒以内。


注:数据面时间=系统时间=晶振时间(不能跳变)

管理面时间=UTC时间≈整车时间(可接受跳变)


2)数据记录与回放


禾多科技自研的数据存储工具HoloBag,其Record模块能够部署到域控制器内多个芯片中,支持多个传感器的同步录制,包括:相机、Radar、Lidar等传感器数据,也提供H.264/265视频流无损压缩,降低硬件存储空间的占用。上位机REPLAY回放工具,支持多路相机视频的H.264/265解码,以及CAN消息的转换。


外,禾多科技为应对以后其自动驾驶系统量产装车上路后回传的海量数据的处理需求,做好了以下准备工作:



打通端到端的自动驾驶数据处理闭环链路,覆盖数据采集、回传、挖掘、存储、预处理、标注、系统迭代(包括模型训练,众包地图等)、测试验证、软件部署发布等完整开发流程。


大数据闭环架构与配套工具链能从研发测试车和量产车回传数据中进行快速有效的大数据挖掘,建设场景库,解决长尾Corner Case。在数据来源上,基于量产数据+真值数据+仿真数据多元数据来源,逐步形成完善的场景库和测试集。在数据处理层面,禾多科技打造了统一的数据管理平台,数据标签适配OpenX标准,与各类项目管理和故障管理工具打通。



图片

△禾多科技数据闭环架构与工具链1.0


2.4


具备良好的合作生态


行泊一体方案的量产落地离不开产业链上下游生态伙伴的紧密协作。对于产业链上游,禾多科技正与地平线、德州仪器、RTI等软硬件厂商紧密合作,研发自动驾驶域控相关创新技术。于英俊说:“我们一直秉承开放的心态与芯片及软件公司建立沟通及合作渠道,同时结合禾多的功能算法在硬件上的运行状态,在域控硬件的方案设计上会跟几家芯片厂家进行深度的合作,也会根据芯片的升级来迭代自己的域控产品。对于一些潜在的芯片合作伙伴,禾多也会通过软件赋能的形式,帮助其搭建上层应用生态。”


对于产业链下游,禾多科技去年已经与广汽集团达成了“产融联合”式深度合作关系,将为广汽多款量产车型提供自动驾驶解决方案;同时,目前禾多科技也正与多家国内头部主机厂紧密协作,推动行泊一体域控方案在更多品牌的乘用车型上量产 。




3. 禾多科技自研域控制器的进展如何


3.1


HoloArk基本信息梳理



HoloArk是禾多科技基于地平线征程系列芯片和德州仪器TDA4系列芯片打造的行泊一体域控制器。HoloArk 1.0~3.0分别提供18TOPS、288TOPS和500+TOPS三种不同级别的算力,可适配不同传感器的融合方案,进而为主机厂提供适合不同自动驾驶级别、不同性价比的方案。


截止目前,HoloArk已获得奇瑞等多家头部主机厂客户的定点,并预计HoloArk1.0和HoloArk2.0域控方案在2023年实现量产装车。


△HoloArk域控产品的进阶路线


3.2


HoloArk1.0与HoloArk2.0方案对比


相比于HoloArk1.0版本,HoloArk2.0版本行泊一体方案提升的地方在于:


1)可实现传感器数据的复用


HoloArk1.0版本,采用DPT方案,属于硬切换,泊车和行车两边的数据尚不能复用;在HoloArk 2.0版本中,行车和泊车共用一个状态机 —— 行车和泊车是虽然是两套软件,但是可以通过一套状态机来调度两者的软件。比如说在高速行车状态下,可以调度环视摄像头的数据给行车软件。在泊车状态下,也可以调度周视摄像头的障碍物数据到泊车软件。


2)支持的功能更强


HoloArk 2.0版本的行泊一体域控具有较高的AI算力,能够处理更高分辨率摄像头的图像信息和激光雷达的点云信息,以及运行大型的神经网络模型,因此,它能够处理更多的Corner Case。


图片

△行泊一体系统框架图


毛涛举例说:“视觉需要语义化,对于一些异型障碍物或不明障碍物,如果他们没有出现在训练集里面,单通过摄像头的图像信息,系统多半识别不出来,但是通过激光雷达的点云信息就能够识别出来。


“相比于HoloArk 1.0版本,HoloArk 2.0版本方案中的传感器配置中多了一个800万像素的前视长焦摄像头,因此,系统便能够在更远处、更清楚地看到物体。比如,系统能够在150米甚至200米远的地方就能够识别红绿灯颜色,可以更好地辅助车辆完成自动变道。”


3)带有功能冗余设计


在硬件架构层面,HoloArk2.0版的行泊一体方案支持双层裁切 —— 在硬件设计里面考虑了传感器和芯片的冗余备份,也就是说,当一颗地平线J5芯片或者该路传感器失效的情况下,另外一颗地平线J5芯片还能接收到另外一路传感器数据,支持系统执行最小安全风险策略 —— 担负起功能降级、驾驶员接管提醒、安全停车等职责。


3.3


HoloArk1.0 产品定位的选择


HoloArk的第一代域控制器HoloArk1.0为什么要从中低算力行泊一体域控做起,并且采用多芯片组合的方案呢?


图片行泊一体架构


毛涛解释道:“行泊一体域控制器开发有两种选择:一种是大算力域控,另一种是中低算力域控。如果先开发大算力域控,它是应用于高端车型,销量不会太大,并且规模化量产落地时间也会偏晚。因此,我们打算先把中低算力域控平台以一个合适的价位开发出来,并且要能够在体验、功能、成本上做到较好的平衡,也就是说做一款高性价比且适合尽快量产的产品。


“另外,从芯片的选型上来看,HoloArk1.0 是结合了当时市场上主流的、已量产的车规级芯片的特点做出的芯片组合方案 —— TDA4VM相对来说比较适合做低速场景,J3芯片做行车上的感知是强项。”




4、如何克服域控制器在商业化落地过程中面临的问题


HoloArk1.0 和HoloArk2.0都将在2023年实现前装量产落地,在此过程中,各种挑战必不可少。那么,禾多科技又是如何克服这些挑战的呢?


4.1


满足客户需求的同时,如何提升研发效率


从行业大环境看,智能驾驶域控制器方案已走到比拼交付的赛点,现在主机厂都希望快速地实现行泊一体方案的量产落地,因此主机厂在选择供应商合作的时候,不仅需要供应商能够为其提供一个与车辆性价比相匹配的方案,而且给的工期也非常紧凑。这就需要其供应商在研发上有更高的效率。那么自动驾驶方案供应商应该如何提升域控制器的研发效率呢?


禾多科技认为这需要具备完善的研发流程体系和明确的团队分工。


1)完善的研发流程体系


于英俊说:“禾多有一整套的基于V模型开发的完整的流程体系,在流程的执行过程中,我们把客户需求导入到禾多的需求管理系统,并且,我们专门有软硬件架构师去核对这些需求,如果发现需求中有不妥的地方,会及时地反馈给客户。


“另外,我们也会把整个流程中的要求拆解到研发的每一项需求里,去指导研发 —— 不管是硬件的研发,还是软件的研发,比如从软件的需求设计到软件架构的设计开发,再到单元测试的整个环节。


“虽然说大家都有流程,可能外企对V模型流程掌握得比禾多科技更好,但禾多采用大小闭环的协同驱动的流程模式,系统、研发质量等团队介入需求的对接时间更早,比沿用传统的V模型开发效率更高。”


△大小闭环协同的开发流程


2)明确的团队分工


禾多整个域控制器研发团队的内部分工非常明确——硬件设计,SOC/MCU底软开发,中间件部署等都会有不同的小组去负责。这样的分工便于在针对于不同的需求都有对应的研发团队去负责对接,又因为都在一个部门,方案设计及评审阶段,软硬件团队会综合的评价设计本身及开发周期上的问题。


于英俊说:“域控的整个设计阶段,我们并不是完全的串行化开发,中间会穿插并行部分,比如在硬件设计过程中,原理图设计可能要花一到两个月才能做完,在设计中期,PCB Layout团队就会参与进来展开布局。随着域控复杂度越来越高,PCB Layout的设计要花近两个月的时间,在布局中期又要引入仿真设计人员,基于这种团队分工和协作的高效运转,整体项目的周期会得到大大的提升;正是由于完善的研发流程体系和明确的团队分工保证了我们的域控研发工作能够得以高效率的开展。”


4.2


如何在研发人员有限的情况下,充分满足客户的需求


HoloArk研发团队规模目前在50人左右,涉及SOC软件、MCU软件、HoloSAR中间件、平台架构、智能硬件等业务团队。在人数上相比其它竞品企业要少很多,那么禾多科技是如何在研发人员有限的情况下,去应对未来多个客户、多个项目的开发需求呢?


首先,依托现有团队的丰富经验 —— 现有的团队成员都有 Tier1背景,在域控研发方向具有较强的专业性,软件开发人员的平均工作经验是 8 到 9 年,硬件开发人员的平均工作经验在15年左右。团队在技术上已具备域控制器硬件+中间件+行泊功能软件的自动驾驶全栈研发能力。


凭借其与主机厂长期协作中积累的经验,在解决客户的开发需求过程中,禾多科技能够及时去实现客户的需求,并高效地定义、开发满足客户需求的域控产品。


其次,禾多科技也提前做好了一些准备。于英俊告诉九章智驾:“现在Ark团队在量产交付中的有三条大的平台化产品线:IFC1.0/2.0智能一体机,Ark1.0/2.0中高算力域控,HoloSAR中间件。在每个产品定点前期,禾多都会针对每个产品做平台化设计,用最短的时间内打造原型机,完成底软及功能的部署。那么,我们再去承接跟平台接近的项目,可复用度较高,整体的工作量就减少很多。”


另外,禾多科技也在不断地吸引优秀人才的加入,扩大HoloArk的研发团队规模。


4.3


如何解决工程化问题


在量产项目中,工程化中的难题比单纯的技术研发问题更加棘手,而要实现工程化就务必解决硬件的高可靠与高质量,软件的高性能与高实时,以及自动驾驶算法部署在域控平台的特殊化需求。


工程化中的难题更多的是在项目落地过程中被排解出来的,比如功耗太高、器件不稳等。


禾多的技术人员印象最深刻的例子是:ARK1.0 B样件在做高低实验的过程中,域控要连续全负载高温运行1200小时,结果却是,每运行至72小时就会反复出现死机卡顿。针对这个问题,软硬件工程师现场分析,对软硬件配置逐一排查,测电源信号波形、DDR眼图等,最终花了1周时间找到root cause是在芯片底层开发的一个安全监控模块出现了逻辑判断错误。


HoloArk 2.0用到的元器件物料数量要远超于过去任何车上ECU内的元器件数量,系统非常复杂,整体功耗高达100W,因此,域控的壳体散热一直是焦点问题。为保证芯片的运行温度,禾多的散热系统采用液冷方案,液冷管道的布置、流速的调节、关键芯片的凸台等设计都有技术创新和优化处理。


域控制器的可靠性的问题也被有些企业认为是工程化问题的挑战之一。比如,一些域控制器会存在高温、长时间运行等会死机或异常复位;数据量大时会丢包、接收数据中断;底层软件存在bug导致堆栈溢出、多核心跳数据不同步等。禾多在开发阶段也会遇到类似问题,但其硬件开发体系一直按照V模型正向开发,遵循从需求->设计->仿真->生产->验证流程,严格把控软硬件每个环节的交付,所以在域控硬件在EMC测试环节出现的死机卡顿等问题无一是硬件问题,个别是软件逻辑判断方面的问题。


在行泊功能部署运行阶段,也会出现丢包及时间跳变的问题。针对这种情况,禾多的做法是:调整底层通信的Qos策略,以及支持多种时间同步方式(gPTP,PPS,SPI等),为上层功能部署管理层与数据层两套时间。


对于自动驾驶初创公司而言,工程化能力方面的质疑是一个绕不开的话题,那么禾多科技又是如何培养其团队自身的工程化能力?


毛涛举例说:“比如BOM的设计就是一个比较考验工程化能力的事情,域控制器BOM的设计相对来说是比较复杂、也是最要紧的事情。我们一般会根据自己团队的经验做初版BOM,然后再根据多个合作伙伴的建议对初版BOM进行完善,最后再经过内部多方的审核,把最终版的 BOM 确定下来。比如,在测试过程当中,某家的电阻、电路不行或者板子厚度不够等等,合作伙伴会给我们更专业的一些建议,我们可能会进行部件的重新选择,BOM也会做相应的调整。”


成本控制一直是车企和tier1不容忽视的工程化难题,而对于如何把域控产品做到高性价比,禾多也已有一套成熟的管理系统:



A.域控产品平台化,在关键芯片选型上尽可能做到可复用;


B.域控预置禾多自主IP的Autosar软件(HoloSAR),满足从配置到代码生成等一系列标准化操作,实现软硬件解耦及SOA架构,既能减少每个项目上对国外AUTOSAR软件的依赖,又能实现平台化,缩短研发周期。




结语:


专注于量产不仅关系到自动驾驶初创企业在现阶段是否能够实现“自我造血”,也关系企业在未来是否会有更好的发展前景。在软件定义汽车的时代,数据已成为自动驾驶企业的核心竞争力,然而数据的获取依赖于前装量产。


正如禾多科技将其自研域控制器命名为HoloArk——寓意为承载其行泊一体自动驾驶系统的「方舟」。相信随着HoloArk在明年开始量产装车,禾多科技有望通过与主机厂客户的深度合作获取更大规模、更加有效的真实交通数据,进而持续驱动其整体自动驾驶技术的迭代升级。



参考资料:


1. 行泊一体「起跑」

https://mp.weixin.qq.com/s/z7G_HptFrsEKklcNXKjacA


2. 利用端到端闭环数据驱动自动驾驶安全升级

https://mp.weixin.qq.com/s/dvhiWB1YxrxqG6FrgnibKw


3. 打造行泊一体、软硬一体,体验升级的自动驾驶

https://mp.weixin.qq.com/s/cmpY_-QzCHT1GEk2sY72uA


分享
下一篇:这是最后一篇
上一篇:这是第一篇