21世纪经济报道记者张梓桐上海报道
日前,首个自动驾驶领域大模型迎来面世,毫末智行发布自动驾驶生成式大模型“雪湖·海若”,通过引入驾驶数据建立RLHF(人类反馈强化学习)技术,对自动驾驶认知决策模型进行持续优化,最终实现端到端自动驾驶。
(资料图片)
21世纪经济报道记者了解到,“雪湖·海若”现阶段主要用于解决自动驾驶的认知决策问题。目前,“雪湖·海若”实现了模型架构与参数规模的升级,参数规模达到1200亿,预训练阶段引入4000万公里量产车驾驶数据。
在毫末智行董事长张凯看来,随着AI大模型推动下的产业生态正在不断进化和升级。城市导航辅助驾驶产品在2023年将围绕量产交付发力,几个主要玩家的城市导航辅助驾驶产品将会进入到真实用户交付和多城市并行落地的比拼中。此外,表示行泊一体和无人车的商业化将成为自动驾驶公司深耕的重点。
NOA密集发布
随着近日百度、华为等大厂纷纷发布NOA产品,自动驾驶正在逐渐渗透至城市复杂道路中。
张凯判断称,在乘用车领域,随着搭载规模的增长和智驾产品整体成本的下降,智驾产品也将从高端车型向更多中低端车型全面覆盖。搭载低成本行泊一体功能的智驾产品将迎来一个前装量产的高潮,高速导航辅助驾驶、自主泊车等产品的体验也会迎来全面升级,车主的使用频率和满意度将成为产品竞争力的主要衡量标准。
而在末端物流自动配送领域,末端物流自动配送在商超、快递等场景将会迎来爆发,2023年将在这些场景实现可持续的商业化闭环。
张凯认为,AI大模型推动下的产业生态的不断进化和升级具体体现在三个方面,首先在数据生态上,随着用户更高频地开启辅助驾驶功能,智驾行驶的行驶里程和使用频率呈现指数级提升,足够规模和多样化的数据带来数据积累的优势,可以更好驱动自动驾驶技术的快速迭代升级。
其次在AI技术生态上,生成式大模型已成为自动驾驶系统进化的关键,基于Transformer大模型训练的感知、认知算法,将逐步在车端进行落地部署。
在算力生态上,基于自动驾驶数据的大规模增长,以及大模型的深入应用,智算中心已经成为自动驾驶行业的“新基建”。
容错率极低
在毫末智行之外,越来越多的自动驾驶公司开始将目光放在大模型领域内。
在日前的中国电动汽车百人会论坛(2023)上,地平线CEO余凯发表演讲称,近期ChatGPT的火热给自动驾驶行业带来了很大启发,二者之间也存在许多相似之处。“自动驾驶行业应该继续用更大的数据、更大的模型,并且无监督地去学习人类驾驶的尝试。”
但与此同时,两者之间仍存在较为明显的不同,余凯表示,ChatGPT的工作容错率相对比较高,而自动驾驶特别是无人驾驶,容错率为零。
此外,ChatGPT的计算在云端,在云端有充分的能量供给、电源供给,同时有非常好的系统。但是自动驾驶大模型计算在车上依赖的是电池和车端散热,而这一挑战很大,意味着自动驾驶不能用那么大的模型和计算。
除此之外,余凯表示,类似于ChatGPT从大量无监督且没有标注的自然文本里去学习,每个驾驶员驾驶控制的序列就可以被当做一个个自然语言文本。而语言模型的运行逻辑在于给定一个文本的历史预测下一个词的概率。
“在自动驾驶行业内如果给定当前的交通环境以及导航地图,驾驶员驾驶行为的历史,就可以预测其下一个驾驶动作。从大量无监督不需要标注的行为里面去获得学习,构建一个回归自动驾驶的大语言模型。
余凯坦言称,这个事情本质在于参数越多系统越聪明,ChatGPT—3大概拥有1750亿参数,ChatGPT—4差不多有1万亿参数,人类大脑是100万亿参数。参数的规模决定了智能的水平,没有神秘的魔法,人类这么聪明无非就是我们的大脑容量确实大。”豫开说道。