机械社区

 找回密码
 注册会员

扫一扫,访问微社区

QQ登录

只需一步,快速开始

搜索
机械社区 门户资讯 要闻热点 查看内容

特斯拉“背叛”英伟达背后,是一场自动驾驶的芯片战争

2017-9-29 14:28| 发布者: 蛤蟆要起飞| 查看: 85| 评论: 0|来自: 虎嗅网

摘要: 前几日,特斯拉与AMD合作研发自动驾驶芯片的绯闻沸沸扬扬,一度让外界猜测特斯拉与英伟达的合作有所变动。昨日,英伟达CEO黄仁勋在GTC China则表示,即使特斯拉用了别家的计算芯片,自己也对特斯拉的车也照买不误。 ...

前几日,特斯拉与AMD合作研发自动驾驶芯片的绯闻沸沸扬扬,一度让外界猜测特斯拉与英伟达的合作有所变动。昨日,英伟达CEO黄仁勋在GTC China则表示,即使特斯拉用了别家的计算芯片,自己也对特斯拉的车也照买不误。


计算芯片这一自动驾驶的大脑,被再度推上了风口浪尖。尽管不慎放出“假消息”的格罗方德出面否认了,但坊间的极大关注也表明,芯片,是众自动驾驶公司的一块心病。


做平台的计算巨头如英伟达、英特尔、高通,“自古以来”为车厂供货的半导体商,以及做单点技术的初创公司,都在不断地试图制造属于自己的自动驾驶芯片,以在自动驾驶竞赛中掌握绝对制高点。


一、特斯拉“寻新欢”是假?


上周,从AMD拆分出来的晶圆厂格罗方德(GlobalFoundries,GF)无意间透露出来消息:特斯拉、AMD、GF三方,正在自动驾驶上“搞事情”。消息一出,自动驾驶圈子炸了锅。AMD股价应声而涨,英伟达股价则小幅下挫。


对于合作,报道称特斯拉将在AMD的芯片IP基础上,开发自己的自动驾驶芯片,格罗方德则是代工厂。


然而第二天,GF就跳出来否认,称“与特斯拉没有直接合作关系”。但是,这个说法很有意思,仅仅是撇清了自己和特斯拉的“直接关系”。而特斯拉与AMD两方,对此消息则是不予置评,既不否定,也不承认。


特斯拉当然不会承认,因为:


1、现在特斯拉的车型还装着英伟达家的Drive PX 2自动驾驶车载电脑到处跑呢。


2、英伟达CEO黄仁勋的车库里还停着特斯拉Model S和Model X。


3、英伟达今年那款性能爆棚的深度学习利器DGX-1,老黄直接送了马斯克资助的OpenAI一台,还是亲自交到后者的手中。


特斯拉捅翻了马蜂窝!自动驾驶芯片战争爆发


但是从马斯克的经历中就可以看出,他并不是一个安分的人。和Mobileye的分手已是前车之鉴,和英伟达现在虽然你侬我侬,但也架不住特斯拉的目标是星辰大海。


基于三点原因,特斯拉会热衷于研发自己的自动驾驶芯片:


1、对核心硬件有更强的掌控力。


2、研发自己的自动驾驶芯片,能够在硬件加速上形成差异,更有可能建立起自动驾驶技术的优势。


3、Drive PX 2功耗为150W,而价格则直接是约1万美元。如果特斯拉选择自己造自动驾驶芯片,那么成规模之后,有助于降低成本。


因此,出于提升对核心硬件掌控力、拥有更强计算竞争力以及成本等因素的考虑,自研自动驾驶芯片对特斯拉来说确实是一个可选项。


最直接的证据就是特斯拉作为一家汽车公司(至少目前来看是这样),所拥有的50余人的芯片团队,以及团队的带头人——去年年初加入的吉姆·凯勒。


凯勒早年任职于AMD,参与缔造了X86-64架构(AMD为桌面端处理器作出的最伟大的贡献),拿出了能和英特尔正面抗衡的K8架构;后又进入苹果,负责了A4与A5处理器;再一个回马枪杀回AMD,奉献了Zen架构——锐龙正是在Zen架构的基础上,逼得今年的英特尔不再挤牙膏。


特斯拉捅翻了马蜂窝!自动驾驶芯片战争爆发

吉姆·凯勒


特斯拉的芯片团队由这样一位在行业功勋卓著的传奇人物坐镇,必然是有所布局的。


昨日,英伟达CEO黄仁勋在GTC China上接受采访时,面对“如果特斯拉与其他厂商做了自动驾驶芯片,你是否还会买特斯拉”这一问题,也并未在回答中急于澄清和特斯拉的合作关系。


这次把格罗方德牵扯进去,则说明特斯拉的自动驾驶芯片至少已经到了流片测试的阶段。


不过特斯拉不太可能去挑战英伟达的GPGPU(通用计算型GPU)在深度学习中的地位,因此这枚芯片大概率会是一款针对自动驾驶的专用计算芯片。


二、三大巨头决战自动驾驶芯片


特斯拉与英伟达的分分合合只是自动驾驶芯片大战中的冰山一角。在这个关键领域中,自动驾驶芯片延续了与其高度相关的深度学习所采用的几类硬件技术路线:GPU、FPGA、ASIC,引来全球各方公司同台竞技。


首先不得不提的是英特尔、英伟达、高通三大芯片巨头,它们带领的竞争为这场芯片战争奉献了绝大多数戏码。而且,他们也恰好反映了自动驾驶芯片的不同技术路线之争。


1、英特尔:豪掷320亿美元,买出一片天


在深度学习兴起的这两年,英特尔颇有些哀伤。因为CPU天生擅长串行与通用计算,在面对需要大规模并行计算的深度学习时,暂时处于被GPU压制的状态。因此,英特尔绕过GPU,在2016年以167亿美元完成了对世界第二大FPGA公司Altera的收购。


FPGA,现场可编程门阵列,是一种处于CPU、GPU和ASIC之间的芯片。相较于CPU、GPU的通用计算属性(没错,GPU虽然比CPU“专业”不少,但仍属于通用计算),FPGA的功能更加专一,并且更加接近底层I/O,运算实时性比CPU/GPU更高,一旦完成编程,就能进行特定的运算,比CPU、GPU更加高效。同时,它又比专用芯片ASIC更加灵活——芯片可以被反复编程,以满足不断变化的计算需求。


高实时,低功耗,可灵活编程,这全都切中了自动驾驶对计算芯片的要求。英特尔在年初推出的自动驾驶计算平台Intel Go中,也使用了FPGA芯片。奥迪新A8自动驾驶所仰赖的核心计算单元zFAS,也使用了Altera的FPGA芯片,内建被英特尔收购的Movidius视觉算法,负责物体数据和地图数据的融合,与自动停车功能的实现。


另外英特尔在服务器市场拥有不俗实力,这意味着在云端,其可以部署强大的计算能力。结合低延时又高效的FPGA,英特尔可以在云端处理大量并发的实时计算。这种模式尤其适合人们对智慧城市大脑的设想:每一辆无人车的数据都上传到一个中枢,由其处理并洞悉每一辆车的状态,去命令他们如何驾驶。


当然,无人车与城市中枢之间需要高带宽、时延极低的数据通道连接起来,这也是英特尔对5G如此上心的重要原因之一。对此,英特尔在今年推出了首款车载5G通信平台。


但是,虽然这一套设想很先进,但标准、基础设施建设,将耗费大量的时间和财力,短期内实现难度仍然较大。因此,进入眼下有切实市场的辅助驾驶至关重要。


2016年10月,英特尔发布针对ADAS市场的凌动处理器A3900系列,为车载信息系统和ADAS功能提供计算支持。为了符合车规,英特尔还对A3900做了特别设计,最高耐受150°高温。并且,应用了16nm制程和Apollo Lake架构的A3900在功耗表现上也相当优秀,最高不超过12W。


但ADAS的芯片市场已经有了众多传统汽车半导体商,还有Mobileye这一称霸的公司,英特尔怎么可能说切入就能切入?


不能平地起高楼的一种解决方法是,直接买一栋。今年3月,英特尔一狠心一咬牙,以153亿美元的天价收购了以色列ADAS公司Mobileye。对于其他公司来说,Mobileye或许不值153亿美元,但是对于英特尔来说,这钱不得不花——今年初建立自动驾驶联盟时,只有宝马才买了英特尔的账。


而Mobileye一方面为英特尔提供了切入自动驾驶市场的渠道——前者在全球ADAS市场的份额超过70%;另一方面,Mobileye的核心产品——ADAS专用芯片EyeQ系列,使英特尔形成了针对车辆端的计算芯片解决方案——英特尔的凌动/至强+Mobileye的EyeQ+Altera的FPGA。这153亿美元,其实是英特尔为自动驾驶买的门票。


特斯拉捅翻了马蜂窝!自动驾驶芯片战争爆发

黄圈中即为EyeQ3芯片


在英特尔投入巨资过后,Mobileye直接绕过了其ADAS的第四代专用芯片EyeQ4,将在明年量产EyeQ5。值得一提的是,Mobileye宣称,EyeQ5的计算能力能够满足L4-L5级的自动驾驶。


当下,自动驾驶的车辆终端和云端还没有实现实时的高带宽传输,因此车辆终端的计算力显得尤为重要。


2、英伟达:生态、性能一骑绝尘


英伟达无疑是人工智能时代计算巨头中最大的受益者。GPGPU(通用计算型GPU)在深度学习领域的统治力无需多言,目前大部分深度学习在训练阶段,都是由英伟达的GPU支持的。


一方面,这得益于其GPU相对于CPU而言针对深度学习更强的计算能力,另一方面在于,英伟达为其GPU通用计算所做的开发易用性工作开展得是如此之好,大大降低了开发者的上手难度。


这不,昨天GTC上,老黄又带来了更新过后的深度学习应用平台TensorRT 3,把各种深度学习框架都囊括了进去。


而在运用其GPU为车辆端的深度学习应用(Inference)提供支持方面,英伟达的做法颇有些“浮点运算能力越高越正义”的意味。


在自动驾驶时代之前,英伟达很早就通过Tegra 系列处理器进入了众多整车厂的供货商名单,比如和英伟达保持了8年合作关系的奥迪,以及颇受老黄喜欢的特斯拉,不过早年英伟达的Tegra负责的主要还是车载娱乐方面(最新消息,彭博社报道特斯拉或将其娱乐信息系统芯片供应商换为英特尔)


而今年具备L3自动驾驶功能的奥迪新A8,其由采埃孚打造的自动驾驶计算平台zFAS,使用了英伟达的Tegra K1芯片,负责处理车辆的环视影像。然而,zFAS主要负责实现自动驾驶功能的芯片,是Mobileye的EyeQ3和Altera的Cyclone。这一点显然无法让英伟达满意,乃至都不愿意提到这一点,但Tegra K1的单精度浮点运算性能也只有350GFlops,而EyeQ3整合了完整算法支持的一整套ADAS功能,使得K1的性能看上去并没有那么诱人。


特斯拉捅翻了马蜂窝!自动驾驶芯片战争爆发

zFAS的四大主要计算芯片


其实,在新奥迪A8亮相之前,英伟达已经连续推出两代性能十分强悍的自动驾驶车载电脑,其中被力推的Drive PX 2最强版本Drive PX Autochauffeur使用了两颗名为Tegra Parker的SoC,内建6核CPU以及基于帕斯卡架构、拥有256个CUDA单元的显示核心。Tegra Parker的上一代Tegra X1单精度浮点运算能力就达到了1Tflops,Parker性能据称达到1.5T,两个Parker SoC加起来性能达到3T。然而英伟达觉得还不够,又在两个SoC之外加入了两张帕斯卡架构的独立显卡。最终的结果是,Drive PX 2 autochauffeur的单精度浮点运算能力达到了8TFlops,是Tegra K1的20倍还多(可怜的K1,人家只是一枚SoC而已)


12下一页

最新评论

 
 



工作时间:
9:00-17:00
 

小黑屋|手机版|Archiver|中国机械社区 ( 京ICP备10217105号,京ICP证050210号,京公网安备11010802010176 )  

GMT+8, 2017-10-23 21:40 , Processed in 0.075532 second(s), 8 queries , Gzip On, Memcache On.

Powered by Discuz! X3.2 Licensed

© 2001-2013 Comsenz Inc.

返回顶部