作者:孙志富
众所周知,汽车行业的竞争正在从新能源驶向智能化,而无论是传统车企,还是造车新势力,也无一例外地都将智能化作为发展的重点。
近两年来,不少中国企业在AI大模型领域进行大量投入,通过AI大模型实现了文本生成能力、多模态感知能力、智能驾驶数据生成能力等,实现了百亿乃至千亿级别参数覆盖。
随着以ChatGPT为代表的生成式AI大模型的火爆,大模型技术也开始迅速 “上车”。 吉利、广汽、长安、奇瑞、长城等车企都公布了自家的大模型进展,而科技企业华为、百度、腾讯等也纷纷将大模型领域的技术能力应用在汽车行业。
业内普遍认为,伴随着大模型“入场”,未来包括交通汽车等领域在内,将会涌现出越来越多的可能性,大模型将会对智能网联汽车的发展起到加速推动作用。
那么问题来了,大模型真的可以让汽车智能化更上层楼吗?
智能座舱 大模型加速上车潜力凸显
当下,汽车智能化主要是指智能座舱和智能驾驶两个方面。大模型在汽车智能化方面目前也主要体现在智能座舱和智能驾驶,这也是车企们关注和用户体验的重点。
“生成式语言大模型运用在汽车上,可以让汽车更‘聪明’,并且它只需要本地算力就可以解决驾驶员和乘客的常见问题,比如汽车发生故障了应该如何处理,附近有哪些美食和好玩的景点可以推荐。”在近日举行的第六届进博会上,英特尔操作系统开发首席工程师陈鲁海在接受媒体采访时,向外界通俗易懂地解释了大模型上车的作用。
随着汽车智能化概念不断被强化,消费者对于汽车智能的要求也越来越高。但是,当下,依然有很多汽车的人机交互能力被用户所诟病。
如何改善车机交互水平,提升用户体验?大模型为主机厂提供了新的解题思路。
今年8月,百度文心一言、百川大模型、商汤大模型开放商用。9月,腾讯发布自研通用大模型“混元”,讯飞星火认知大模型、360智脑大模型面向公众开放……
从目前国内的情况来看,已有多家车企宣布将在旗下车型上接入大模型,如长安、集度、吉利、岚图、红旗、长城、东风日产、零跑等,它们均为文心一言的早期客户。讯飞星火也已与包括奇瑞、广汽、长城、长安在内的几十家车企和合作伙伴强强联手,构建汽车AI星火生态。
10月底,百度和吉利共同打造的极越01实现了百度“文心一言”语音大模型的正式上车,基于此,极越01的人机交互体验达到了一个新高度。
基于文心大模型能力探索下,智舱将具备出行场景对话式交互、逻辑推理、策略规划和知识问答等多项能力,同时也展示了在当前智舱命令式交互下覆盖全车多音区、毫秒级响应、免唤醒全时交互的体验。
融入了文心一言的大模型能力的极越,是全球首个大模型“上车”的智能汽车,让SIMO的智商达到了新的高度,智能座舱从此拥有了逻辑推理、策略规划和内容生成等诸多能力,能解奥数题,助力“自然交流”再进阶。
本月初,华为发布了接入盘古大模型的鸿蒙HarmonyOS 4系统,将首搭于与奇瑞合作的首款华为智选车型Luxeed。
11月3日,大众汽车集团旗下软件公司CARIAD的中国子公司宣布,与中国手机大厂vivo成立“手车互融联合创新实验室”(下称M²实验室),专注智能手机与智能汽车领域的互联创新和长期合作。据了解,二者合作主要方向是智能座舱,除此之外,未来的合作还涉及人工智能、大模型领域。
近日,vivo在其2023开发者大会上发布了自研通用大模型矩阵——蓝心大模型。这意味着大众汽车未来车型很有可能将实现“大模型上车”,这也是智能座舱的热门技术方向之一。
海外市场大模型“上车”同样火热,今年,奔驰和微软就早早宣布,将展开合作,把ChatGPT人工智能服务整合到存量汽车中。微软公司称,这是ChatGPT产品第一次应用在汽车环境中。
据奔驰方面介绍,未来车主在使用语音助手提问时,ChatGPT将会负责回答问题,增强汽车语音助手的negligible。
或许是出于把“命运掌握在自己手里”的目的,车企除了和联合科技企业,加速电动化、智能化的同时,也在发力大模型的自研。
传统车企这边,今年广汽集团已经宣布正式推出AI大模型技术的最新研发成果——广汽AI大模型平台,吉利汽车集团计划推出全栈自研的全场景AI大模型。奇瑞新能源汽车注册了“ICARGPT”商标,长城汽车注册了“长城汽车SPACEGPT”商标,目的不言而喻。
新势力这边,今年6月,理想汽车自研认知大模型“MindGPT”发布,在语音交互与智能驾驶实现双赋能;蔚来、小鹏也均瞄准GPT,申请了专属的“NIOGPT”“XPGPT”商标。小鹏汽车创始人何小鹏也曾公开表示“ChatGPT是最近数年的全新技术浪潮中,唯一觉得既是趋势又在眼前又可产生颠覆的。”
在猫头鹰车志看来,大模型在智能座舱上的应用已经可以直观感受到,且已有应用出现。不可否认,大模型应用在智能座舱等车联网场景中已经展现出了巨大潜力,但是还未达到“爆发”阶段,或者只能说到了一个快爆发的阶段。
智能驾驶 大模型上车还有很长的路要走
除了智能座舱,AI大模型在自动驾驶领域同样有着广泛的应用前景。大模型可以处理海量数据,同时具备多维度分析能力,可以提供更精准、更全面的数据分析和预测能力。保持对大模型的优化升级,就可以提高自动驾驶的准确性和可靠性。
许多专家学者认为,AI大模型在自动驾驶领域的应用将会成为未来智能出行的重要驱动力之一,为自动驾驶技术的发展和普及做出重要贡献。
但是,对于智能驾驶,业内普遍认为,大模型上车还有很长的路要走或者说挑战更大。
某业内人士对猫头鹰车志表示,大模型上车的主要障碍是算力和时间。现在训练一个文本大语言模型,就已经需要上万张的A100卡,如果再把图像信息也加进来,对算力的要求只多不少。传统的图像训练,百万帧级别,或许就能训练出一个小模型,但换作大模型再涉及到多模态的话,背后是要有数千万帧的训练量。业界对于这种多模态的大模型训练,包括文本和视频的对齐,还在探索阶段,还需要很长的时间去不断尝试,最终结果也无法确定。所以无论算力还是时间,背后都代表着需要大量的资金,需要非常有实力的玩家才能去做这件事情。
在业内人士看来,AI大模型的运行需要高规格的硬件配置支持,需要具备高算力、大容量内存以及低时延的特性。但现阶段车载设备的硬件水平虽然有所提升,但还无法达到支撑AI大模型运行的水平。即便目前蔚来、理想等造车新势力使用的英伟达Orin X芯片,已经是目前量产车中算力最高的芯片,但还远远达不到大模型的计算要求。
另外在数据层面,处理起来也存在挑战。现在日益流行的多模态数据,包括自动驾驶中激光雷达、毫米波雷达、超声波雷达等,以及专用的高清摄像头、GPS设备等搜集到的数据、场景数据等,本就使得数据处理、管理和使用变得相当困难,相比之下,大模型的数据量是有过之而无不及。
2021年,特斯拉率先采用了基于TransFormer大模型的BEV+占用网络感知算法,提升了环境建模的效率,成为目前主流车企下一代智能化的主要架构。国内的小鹏+华为+理想等今年也切换到了BEV+Transformer。
业内人士认为,通过这套感知架构确实能够减少对于激光雷达等高成本传感器的依赖,有效降低系统成本,减轻车企及消费者的负担。但仍只是应用于感知端,而受限于算法复杂性+大算力要求,感知决策一体的端到端算法落地尚需时日。
不言而喻,高昂的成本,在某种程度上会阻碍大模型大规模上车。红杉资本还曾做过一笔测算:全球的科技公司每年预计将花费2000亿美金,用于大模型基础设施建设;相比之下,大模型每年最多只能产生750亿美金的收入。
另外,汽车驾驶的前提是安全与严谨,大模型的准确性仍然让不少业内人士担忧。今年8月,马斯克在直播测试特斯拉全自动驾驶系统FSD 12时,就出现了可能致命的误判:将左转车道的绿灯当成了自己车道的绿灯,启动车辆打算穿过路口。好在马斯克立刻介入,刹住了车。在此之后,被问及解决方案时,马斯克的回应是“继续向神经网络投喂大量带有左转交通灯的驾驶视频。”
马斯克的说法其实就是做大模型的训练,这就要求有大量高质量的数据,车企如果想将大模型应用于自动驾驶,数据数量以及质量能否达标也是关键。
当下,大模型虽然可以为自动驾驶和智能座舱带来巨大的潜力,提供个性化的驾驶体验,改善驾驶安全性。但同时,其在算力、算法及数据方面的挑战也成为能否最终实现大规模“上车”的阻碍,所以外界一直也有“大模型上不了车”的说法。
极越CEO夏一平曾向媒体表示:“自动驾驶值得用大模型的方式重写一遍,但是,这个事情可能是未来3~5年之内要做的事情,绝对不是明天就要做的事情。”
以小见大,应用场景相对较小的汽车领域,尚且存在诸多挑战,而应用场景更为广阔的通用型大模型,必将面对更大的挑战。所以外界对于大模型,究竟是挑战大于机遇,还是机遇大于挑战,也是众所纷纭。
但无论怎样,都挡不住大模型的汹涌浪潮。毕竟在AI热潮下,类似ChatGPT和Midjourney等几十人规模的公司,创造40亿美金左右的估值,美股“七巨头”总市值一年飙升至11万亿美元,大涨60%。这些激动人心的爆发式增长的故事,都在不停搅动着国内科技商业市场。
风口之下 大模型需尽快从“玩具”进化到“工具”
近日,由李开复创办的AI公司——零一万物,发布首款开源中英双语大模型“Yi”。在“Yi”发布的当天,零一万物也获得阿里云领投的新一轮投资。据悉,该轮融资完成后,零一万物估值超过10亿美元。
在这之前,10月份,智谱AI也披露,公司2023年已累计获得超25亿人民币融资,投资方包括社保基金、阿里、腾讯、高瓴等知名机构,智谱AI估值已经超过100亿人民币。
就在智谱AI官宣获融资的前几天,由前搜狗CEO王小川创立的AI公司百川智能也对外披露完成3亿美元的A1轮战略融资,投资方同样包括阿里、腾讯、小米等科技巨头和多家顶级投资机构。加上天使轮的5000万美元,百川智能的融资金额已达3.5亿美元。
据创业邦研究中心发布的《2023年H1 AIGC产业报告》,今年上半年,国内AIGC领域的融资事件共57起,已披露融资总额63.13亿元,涉及投资机构数66家。
上面提到,大模型是少数人的游戏,所以融资也基本集中在少数几家大模型公司。在国内叫得出名或被市场熟知的大模型公司屈指可数,包括百度文心一言、智谱AIGLM大模型、中科院紫东太初大模型、百川智能大模型、商汤日日新大模型、MiniMax——ABAB大模型、阿里通义千问大模型,以及华为盘古大模型等,其他更多被外界视为“凑热闹”“投机分子”滥竽充数。
在这些大模型公司背后,基本站的都是BAT等互联网大厂。例如,文心一言由百度孵化;智谱AI背后是腾讯、阿里、美团等;王小川的百川智能也腾讯、阿里、小米加持;MiniMax有腾讯、米哈游下注;最近拿到投资的零一万物背后有阿里云。
从大厂的表现形式看,大都选择内部孵化加对外投资的方式。这样或许可以确保或者提升大厂在这波大模型浪涌中不被落下。另外,手握重金的大厂也确实投得起大模型公司。
据不完全统计,腾讯共计投资了5家大模型公司,包括智谱AI、百川智能、MiniMax、深言科技以及燧原科技;阿里投资了智谱AI、百川智能2家公司,自己孵化了通义千问;百度孵化内部大模型,另外投资了西湖心辰;美团对外投资了智谱AI,收购了光年,自己首个AI产品“Wow”也已经亮相,小米选择站台百川智能。
从传统AI时期开始,国产技术被寄予厚望的一个长板就是应用,大模型时代也是如此。需要尽快从“玩具”进化到“工具”,这也是今年下半年以来国产大模型的一个显著趋势。
在此背景下,大模型开始争相“上车”。因为业内认为,汽车是一个垂直领域,应用场景相对较小,对参数的量级要求也没有通用型大模型那么大,汽车最有可能成为率先实现大模型落地的B端场景。
但是,目前来看除了智能座舱在大模型应用方面初显潜力之外,其他方面,大模型在算力、算法及数据方面的新挑战都会给发展带来变数。
那么,大模型“席卷”汽车,究竟是真风口还是伪需求?既然风口来了,要不要先上车再说?