2024年被广泛认为是人工智能元年,大模型、端到端成为热词。如今理想汽车也加入车企智驾鏖战。


2024年12月25日-27日,理想汽车连续3天推出“2024理想 AI Talk”,董事长兼首席执行官李想多次提到,理想是一家人工智能企业,要做的是人工智能的汽车化,而不仅仅是汽车的智能化。


不过,要实现端到端并不容易,算法、算力、数据都是门槛,此前理想汽车并不完全具备迈过门槛的能力。纵观汽车市场,理想在智驾上起步已晚,在各家车企都在抢占第一梯队位置的今天,“晚来者”能否突出重围还是未知数。


决意推进端到端


“有多少人工,就有多少智能”这句话一度在智驾圈广为流传,背后的意思是人工智能需要人类工程师发现并筛选问题后,将问题喂给智能去处理,工程师编写规则的速度决定了人工智能的处理速度,特斯拉为此写了高达30多万行C++代码。


但端到端改变了一切。理想汽车智能驾驶研发副总裁郎咸朋用刹车来举例说,以前团队花了很长时间写规则和代码,但依旧无法让车辆实现完全拟人的、舒适缓慢的刹车,而端到端可以提取真实司机的行车数据进行训练,“一定比现在所有的智能驾驶软件都要好”。


特斯拉内部也有相似的观点。回顾特斯拉自2021年发布FSD Beta版本(测试版本)至2024年发布FSD V12(Supervised)版本(受监管版本)走过的3年路程,特斯拉首席执行官马斯克把FSD的30多万行代码删到只剩下2000多行。这背后,是FSD端到端的全新升级。


为什么要做端到端?在连续3天的直播中,理想汽车的高管们聊到了这个话题。一方面,理想汽车意识到,智驾对销量有非常大的促进作用。2024年2月理想汽车AD Max车型的交付量占比只有两成,而2024年下半年已经过半。当车辆的城市+高速综合接管里程超过百公里时,客户愿意为自动驾驶买单。


另一方面,L4级别自动驾驶或成为车企的“决胜法宝”。在此之前,电动化、端到端都可以算是“决赛”的一张“门票”。李想说,“我们今天做的所有事情,是为了L4拿门票,因为L4所需要花的钱,所需要拥有的能力,所需要的数据量,是今天所不具备的。”


做智驾,特斯拉显然是每家车企都绕不开的对比项。2024年初李想就逼着智驾团队去美国,让团队在不同的城市开特斯拉的FSD V12,“要么做端到端,要么就不要再做自动驾驶了。”他还对郎咸朋发火说,“下半年如果我还看不到变化,咱们还是拿不到头部位置的话,那你这个负责人就可以不用干了”。


根据李想的排期,端到端可以让理想汽车在2025年实现L3级别自动驾驶,2028年左右实现L4级别自动驾驶。


争抢智驾第一梯队位置


正是为了“决赛局”,2024年以来,理想汽车在智驾领域发力明显加速。


2024年10月23日,理想汽车宣布全新一代双系统智驾方案端到端+VLM全量推送。11月28日,理想汽车推送车位到车位智能驾驶。而12月底的直播中,理想汽车宣布高速城市全场景升级端到端+VLM,并于2024年12月31日全量推送AD Max用户。


但在汽车行业,这样的速度依旧属于“晚来者”,其实大量车企早已争夺端到端的第一梯队位置。


早在2021年,特斯拉就发布了FSD Beta版本(测试版本),随后不断升级FSD系统,引入全新的端到端神经网络架构,实现了从感知到车辆控制的全面自动化。


2024年4月,华为常务董事、终端BG董事长、智能汽车解决方案BU董事长余承东公开表示,哪怕与特斯拉FSD相比,华为和奇瑞合作车型智界S7的智能驾驶系统仍然是全世界最好的。8月6日,华为和北汽合作车型享界S9首发搭载华为乾崑ADS 3.0,采用端到端全新架构。


2024年7月27日,蔚来汽车发布全新智能驾驶技术架构NADArch 2.0,引入自研的蔚来世界模型的端到端架构。7月30日,小鹏汽车推送了AI天玑系统XOS 5.2.0版本,强调端到端大模型量产上车。


目前,小米汽车已经开启了端到端全场景智能驾驶的定向内测。零跑B系列和C系列也计划于2025年实现自研端到端大模型智驾系统上车。


发展端到端不易


尽管各家车企摩拳擦掌,但实现端到端并不容易,算法、算力、数据都是门槛。根据郎咸朋的说法,此前理想汽车并不完全具备迈过门槛的能力。


从数据来看,理想AD Max车型的销量在2024年初可以支撑高质量训练数据量达到10亿公里左右规模。


这还不够。郎咸朋提到,如果理想汽车希望实现城市+高速综合接管里程达到500公里,预计需要2000万Clips(视频片段)的水平。如果这些要从不到5%的老司机中筛选,意味着理想汽车的车辆行驶总数据要达到50亿公里甚至上百亿公里的水平。


李想将数据换成销量来解释,称要拿到L4的门票,需要有500万辆以上的车跑在路上。


尽管有大量数据,实现端到端依旧有困难。北京社科院副研究员王鹏表示,一方面,训练端到端自动驾驶模型需要大量的真实驾驶场景数据,且需要覆盖不同的天气、道路和交通状况。另一方面,高质量的数据对训练有效的模型至关重要。低质量或不准确的数据会导致模型学习到错误的行为。不仅如此,极端和稀有情况的数据往往比较稀缺,导致数据集可能不平衡。这会影响模型对这些情况的泛化能力。


理想汽车团队也提到,己方选择使用端到端+视觉语言模型就是考虑到了“极端数据较为稀缺”的情况。郎咸朋称,理想汽车始终无法解决的问题是,当一套自动驾驶或智能驾驶系统,工作时如果遇到之前没有见过的场景,应该怎么处理?为此,他们选择了双重模式。


做端到端,理想汽车不仅比特斯拉多了视觉语言模型,还配备了激光雷达,这也是出于安全方面考虑。


不仅如此,端到端也对车企的算力提出了极高要求。2023年7月,特斯拉Dojo超级计算机投产,FSD拥有了更强算力支撑。特斯拉方面称,Dojo的启动并运行让FSD Beta呈现“指数级提升”。特斯拉当时预计2024年2月公司算力规模将进入全球前五,10月算力将达到100E FLOPS。


与之相对应的是,华为在2023年12月云端算力为2.8E FLOPS,2024年4月上升到3.3E FLOPS。蔚来与阿里云、英伟达合作,算力在1.4E FLOPS左右。理想汽车和火山引擎合作,算力为1.2E FLOPS。小鹏与阿里云合作,算力为0.6E FLOPS。根据直播公布数据,理想目前的算力基础达到了5E FLOPS。


这也意味着,端到端的争夺赛仍然在继续。


新京报贝壳财经记者 林子

编辑 白昊天

校对 柳宝庆