理想社区_理想汽车

理想汽车AI首席科学家陈伟|成为理想同学的“博士生导师”之后

有个理想_

2023年9月6日

一个圆圈,两个眼睛,一个简单到极致的形象,这是理想同学。

许多人对于理想汽车智能化水平的第一次直观感受,都来源于理想同学。两年前,它被吐槽是一个长不大的小学生,而现在,它是车载语音助手领域的佼佼者,小朋友们都喜欢的数字家庭新成员。

就像去进修了,理想同学成长迅速,给用户带来了更多自然、简单、顺畅的交互体验。

而事实上,理想同学背后真的有一位“博士生导师”——理想汽车AI首席科学家陈伟。

一年时间,他带领空间AI团队实现了理想汽车AI核心算法的全自研切换,让更聪明的理想同学成长为新一代理想智能空间交互的主入口,更大的信心则是基于 Mind GPT 大模型的基础建设,让任何人都能够轻松使用AI。

他代表理想汽车真正的技术实力吗?服务全家人的理想同学到底是怎么炼成的?我们采访了陈伟,以下是他的答案。

受访者:理想汽车空间AI负责人陈伟

作者:张婉婷


01

对抗“惯性”的人

理想汽车AI首席科学家陈伟在内部有一个亲切的称呼:“伟叔”,他是智能空间AI负责人、是一个开创未来的“活字招牌”;更是大家口里的“伟叔”,一个让团队里的人谈及“伟叔”就咬字轻盈,语气上扬,说话有底气的存在。

伟叔2021年底入职理想汽车,入职几个月前,李想在智能空间大部门的战略会上,明确智能空间与AI相关的全部算法都要自研,之前底层算法依赖于供应商的局面必须被打破,伟叔就是那个拨云见日的人。

当时的伟叔已经在AI领域取得了不菲的成绩,他不仅是搜狗的AI交互首席科学家,2020 年“北京青年榜样”年度人物,还曾担任中国人工智能产业发展联盟AIIA数字人工作委员会金融应用组组长等职位。

反观理想汽车的AI才刚刚起步,AI研发的基建能力几近荒芜,有的只是一颗坚定不移全自研的决心,放弃已有的成绩去从头开始,许多人并不理解。

机遇与挑战并存,在伟叔看来,商业浪潮上的大船早已转向,一路驶向新能源汽车,许多人还被惯性牵引着,维持原来的姿势。他要做对抗“惯性”的人。

那又为什么是理想汽车?

他回忆起和理想汽车智能空间负责人勾晓菲第一次接触的场景,那是一个周六,在星巴克,两个人聊了近三个小时。两个同样热爱AI,拥抱智能,认可“创造移动的家、创造幸福的家”使命的奶爸很快产生共鸣,最终确定了一个非常明确的目标:“我们要把三维空间交互做好,要做服务全家人的理想同学,更要围绕三维空间交互去打造出专属于理想汽车的智能座舱!”

对伟叔而言,“服务于全家人”的目标让他重新点燃了对职业的兴奋和初次接触AI时的那份热血,如同第一次用代码敲出"Hello, World!",加入理想则意味着他进入了一个属于未来的房间,屋子里没有天花板,怎么也看不到成长的上限。

技术上需要去做、可以去做的事情太多了,而在明确的战略下,要走的路却又格外清晰。伟叔说:“我们不仅要做全自研,而且要做最好的,做能引领行业的智能座舱,真正服务于全家人!”

02

在高速边开车边换轮子

彼时的理想汽车刚刚实现从0到1,正快速迈入从1到10的灰度时空。AI团队不仅要按时交付理想同学的OTA功能,还要短时间内完成算法全自研,逐步替换掉供应商。

这对于当时的伟叔来说,就像是一个在全速奔驰的汽车上换轮子的过程——车不能停,轮子也得完成更换。

“这是在当时一个非常激进的规划,因为比我们更早规划自研的车企到现在还没做到,这几年还是在依赖供应商。”伟叔说。

两条线平等地环绕着他,稍不注意,便有脱轨的可能,他开始一点点搭建空间AI团队,越来越多认同理想汽车价值观的人才加入,和伟叔一起牵引住了两条线。

在此过程中,算法团队要做的还是要首先保证用户的体验,不管是自己的技术,还是供应商的能力,按时交付超越用户需求的产品和功能一定是第一位。

人才、资源汇聚后,空间AI团队在做的其实就是让两条线变为一条线。在一条线上奔跑,才能让每个人做的事更高效、更聚焦,才标志理想汽车空间算法全自研能力的搭建完成。

最终,这个不可能完成的目标不仅实现了,而且超出了所有人的预期。在去年11月的OTA3.2上,理想ONE自研语音完成,今年的OTA4.3则实现了座舱人机交互的全量自研,包括语音、视觉、语言等全链路能力,“那个时候还赶上了理想L7的SOP,也就是说理想L7在首发的时候,搭载其上的语音和视觉功能已经全部是自研技术了。”

算法自研的基石搭建好后,研发飞轮也就更快地闭环转动起来,支撑了更强更快的AI创新,从而能快速甩开别人。此外,迭代速度和优化都控制在自己手里,我们能够持续深挖用户场景,从用户需求和高价值点出发快速迭代智能空间的人机交互体验。

伟叔举了一个语音交互的例子,“用户在车里叫理想同学,唤醒够不够准,误唤醒够不够低,每一句话能不能识别对,以及我说的非常口语化、自然表达的一句话,语意理解是不是足够聪明地理解我说的是什么,其实这些都是底层算法需要解决的问题。”

做自研,我们是目标驱动的,完全按照我们的用户场景以及打造产品力的规划来推进。“我们就是自己的顶层设计。”

“所以说即使当时的目标比较激进,但是为用户创造了最大的价值,这是非常值得的。”伟叔说。

03

更好的用户体验没有捷径可走

短暂的胜利,并不是整个空间AI团队追求的终点。

算法团队的大多数伙伴大多来自互联网公司,软硬件结合的经验是有限的,有时候代码写完了,在服务器上跑的效果和实车上的效果完全是不一样的,有时卡顿、有时回复不达标,小的问题很多,而一旦落到用户体验层面就都是天大的问题。

伟叔记得去年第三、第四季度是最忙的时候,自研能力正在切换,团队的伙伴们基本都是早上实车先测试一段,把问题筛出来,白天继续写代码,晚上9点大概会出一个新的版本,10点半的时候,就会把车从望京联络大厦开去顺义总部再测,11点到12点再开回来,日复一日,测性能指标,比如卡不卡,或者是有没有崩溃的情况;测不同场景下的功能体验,高速上、安静时、多人讲话时、能想到的每一个场景都要测试一遍。

比如多音区的算法,我们是用尺子量出来的。

“我们把车分成了几个区域,这个区域的人如果叫理想同学,那我们就把这个区域锁定了,用尺子标好了位置,再去测效果,目的是其他人讲话是不能影响到理想同学的识别,我们把区域划好后就一直在测,最终让旁边有人说话时的泄漏率达到了1%以下。”

在为提升用户体验的路上,没有什么捷径可走,该下的功夫,空间AI团队只能踏踏实实地下。

“我不认为在这个事情上我们永远都是最聪明的,我甚至会认为我们有可能会比别人笨一些,所以我会对团队要求更高一点,更追求极致才有可能勤能补拙。”伟叔说。

正因如此,打完这场胜仗的过程堪称艰辛,但打了胜仗,就“有成长、有成就、有回报。”,伟叔一直相信的一个状态就是一个有士气的团队,或者说一个团结的团队,最重要的特质就是经常要打胜仗,打了胜仗才会相信之前的努力不是白费的。

一个控场的教练员登场了。目标是怎么让团队做到全局最优。“我大概要定一下阵型,搞一下战术,但是很重要的是要依赖于球场上的球员去跑的。”伟叔说。因此,他对自己的定位不是退役的运动员,而是一个自己也可以上场写代码的教练员,“我其实是1.5线。”他笑称。

04

“隐藏”在展车里的科学家

这意味着,伟叔要始终要再多走一步、走到最前面。集中路测的时候伟叔总是早晚开测试车回家,路上也一直在问理想同学,回家后第一时间记下发生的问题,并梳理成自己的思考,第二天早上,这又成为了布置给团队的作业。

他找到了身边最好的测试对象:9岁的大儿子,理想同学的最佳玩伴。有空时,儿子会主动坐在测试车的后排,伟叔就观察到孩子和他说话的时候,喜欢趴在中间的扶手箱上,但实际上扶手箱的位置正好处于多音区难以覆盖的位置,有时候说一段后收音就丢了。

为深入发现这个问题,伟叔给儿子讲:“你再多叫几个同学过来一起测”,越来越多“小用户”的真实体验很快让他辨别了问题,下一步则是和团队一起直面问题,无论是从语音还是视觉能力的优化上,都要让理想同学找到每个人的具体位置。

9岁的儿子现在上车也说:“爸爸,理想同学越来越聪明了!”

伟叔还有一个有趣的“癖好”,周六日的时候,他总是会带着儿子一起去家附近的商场逛自家的门店,那是整个海淀都比较大的商场,理想汽车门店里来的家庭用户络绎不绝,每当有爸爸或妈妈带着孩子坐在后排体验时,伟叔就会看准时机坐到主驾或副驾。

最近一次他还记得,坐的理想L8的展车主驾,后排是一位爸爸和一个小朋友,产品专家看到小朋友会给他秀理想同学的功能,爸爸一会说想听个歌看个电影,小朋友总是抢着问问题,两个人的语音都频繁被打断。看到这个场景,伟叔脑中高速运转的齿轮又发动了,他在想,两个人挨的很近的情况下,能不能做到很好的人声分离,“我们的理想同学要服务于全家人,如何能够做到,技术上需要有新的突破。”

“我们现在在做的事情其实就是发现问题,然后不断去直面问题,再把它解决掉,这样你的自研能力才能真正拉高到一个别人做不到的水平。”

空间AI团队不轻易放过任何一个用户体验上的问题,因为他们想的很清楚,自研的价值其实是要做到行业领先,做别人没有做过或者想都没有想到的东西。

“在自研能力的切换上,我们做出来的效果不如供应商好,我们就不上,我们要确保用户体验的是目前理想汽车能给到的最好的能力,我们自研的核心始终是要做超预期的能力,能让用户在智能空间上感受到我们的智能化水平有一个非常大的变化。”他说。

05

另一个孩子

“我们以大模型 Mind GPT 为核心,打造了新一代多模态人机交互技术体系,让理想同学成为每一个家庭的新成员,成为一位智能管家。”

6月17日,理想汽车首个家庭科技日上,伟叔代表理想汽车在智能战略-智能空间上的成长进行演讲,在这个演讲场域,你开始想象真的与AI生活在一个有爱的家。

伟叔用一贯和煦的、稳定的语言邀请我们走进有AI的“家”里,我们看到,在智能战略指引下,更聪明的理想同学将成长为新一代理想智能空间交互的主入口。理想同学将会像人一样主动地感知环境和他人,可以进行学习、思考,表达和互动,并拥有更丰富的知识。

是的,理想同学会更像一个人,在伟叔眼里,理想同学是一个需要来来回回教的“孩子”,谁也代替不了。

“之前我们纠结的是理想同学能力范围内的事有没有做好,能力范围之外的也不强求。但是大模型来了,空间交互一下子从以前的“收着做”变成一个“摊开做”的状态,对于理想同学也应该有个新的身份认知,就是你要把它当人看,当一个数字的生命体或者是家庭的数字成员看。”他说。

一切固定的东西都烟消云散了,伟叔和团队只能一个个拆解技能并补充,未来理想同学要做到1000多种技能,比如能写一首古诗就是一项技能,会做数学题就是一项技能......

谈及此,伟叔有点惭愧,核心算法全自研完成了,接下来要将代表底层基建能力的语言模型做得越来越大,让任何人都能够轻松使用AI,未来自己和团队肩上的担子只会更重,陪伴家人的时间始终是有限的。

但是在大儿子眼里,父亲是可以向同学炫耀的对象。“同学问他你爸爸是做什么的?他就说我爸爸在理想汽车,是科学家,做AI的,理想同学都是我爸做的!”

还有一次夜晚,儿子突然提出要和他睡,当时他还在桌子上办公,儿子躺在被窝里就问他:“爸爸,理想同学最近研发的怎么样?”

两岁的小儿子也能在别人问你爸爸在哪工作时,完整地回答“理想汽车”四个字,现在出门认得最全的也是理想汽车,看到车的侧面就兴奋了,边砸吧嘴边喊:“理想,理想!”

家人全力支持,为他自豪,和研发的功能能被用户充分使用,并且得到正向评价一样,都是伟叔成就感的来源。

那些瞬间是小小的烟火,绽放在他一路前行的路上。他知道,一个有AI的未来是值得期待的。

我们同时也知道,一个有AI的家是值得期待的。

插入表情
已输入0字

56 条评论

孙健-新农人

支持无线投屏增加HIcar和Carplay

小萱鹏

无线投屏先弄起来,在开放点把鸿蒙和carplay都兼容了。

zxy

我追这样的星

有理想的lixiang

人送外号大帅哥

牛逼

JudyLove

果子理

加油

AirJie

大哥们,车机开发点游戏啊,虽然可以投屏,但有时候嫌麻烦难得接这接那,等待几分钟的时候玩玩车机自带游戏也挺不错,哪怕来个斗地主呢

米修meer

LLLLL文杰

最佳手气

奈斯

理想老爸普若

现在还没有推出大模型的理想同学吧

恩恩宸宸

一句话执行多种指令很有用,希望改进

追逐梦想的80后

话说理想同学AI版啥时候出!

天堂525

牛人
页面加载中,请稍候...