2021年4月13日,由盖世汽车、慕尼黑上海电子展联合主办的“2021中国汽车人机交互HMI创新大会”隆重召开。本次大会旨在聚集汽车HMI领域的杰出人才、UX/UI设计师以及前瞻规划研究人员分享全方位汽车人机交互领域的创新理念、技术趋势、行业焦点、现实挑战及应用解决方案。会议期间,阿里巴巴-达摩院自动驾驶高级专家沈勇博士发表了“车载智能助手探索”的主题演讲。

阿里巴巴,车载智能助手

以下为演讲实录:

首先跟大家稍微介绍一下,我在汽车这个行业属于新人。我刚刚听到陈芳教授的演讲,我是感觉很亲切的,我以前在浙大心理学也读这个专业,但是毕业以后不小心去了互联网公司,很遗憾错过了汽车非常好的产业,我去了腾讯微软,2015年的时候加入阿里巴巴,目前工作负责帮助AI技术产品化的工作,在过去几年主要在天猫精灵这个团队,在2020年正式加入达摩院团队的,所以我今天主要介绍的是过去三四年在天猫精灵的经验和思考。

首先我们来看一个社会学的统计模型,丹特模型,简单理解就是我们无论个体差异很大,比如你会选择在30岁结婚,有人可能选择40岁还没结婚,但是从大的社会统计角度来看大部分人在46岁就会带来消费的高点,随后可能开始节约你的开支。人大教授根据丹特模型和中国人口曲线做了分析,第一个人口潮60-70年,每年大概出生3000万人。70年到今年是几岁了?50岁,所以中国在2020年正式进入老龄化。未来他们将逐渐退出劳动力市场,所以中国大量低端劳动力人才就会大量流失掉那么会向下挤压其他劳动力市场。在第二个人口潮出现是什么时候呢?1985-1990年。因为是上一代人口潮带来他们的孩子。当然还有第三个,但是这个风浪越来越小。通过这两个人口统计和模型拟合以后,可以看到中国房产从消费角度来说是可以预测。房地产消费有几个高峰点,2016-2021年是小户型,未来当那批或者下一代人口潮变老了以后会出现新的大户型的消费波潮。

我们对车的消费是跟手机是不一样?首先车不是刚需,其次车也是长生命周期的大宗商品,所以我认为在消费决策心理上,车更像是房子消费特性。当然今天房子除了消费以外多了一个投资属性,而我们车目前还没有投资属性。比如说你结婚了,年轻人可能现在先买房,当我的支付能力比较弱的时候会选择先买车。但是它也会像房子过几年以后才出现升级或更换需求周期特性。

从人口老龄化,我们可以知道未来十年每年中国约有3000万要退出劳动力市场。中国在这几年每年出生人口是1200-1500万,而其中800万都去参加大学了,全中国大概有将近50%左右的高等学历录取率。意味着未来中国每年退出劳动力市场净数是2000万,所以未来中国劳动力的缺口十年以后就会出现负2个亿。我不知道会不会影响到各位主机厂或者制造相关的合作伙伴。但是在消费人口结构上讲出现大的变化。这是第一个变化,来自人口数量和人口结构的变化。

第二,我们今天看到很多有意思的事情,比如说以前餐厅的地方,今天叫做网红餐厅。今天人家说,对不起,我来这个餐厅主要是用来拍照的,所以叫网红餐厅,酒店也有网红酒店。你们会也会蔚来车友经常会发一些朋友圈,大家是否很羡慕。所以除了人口结构发生大变化以外,今天另一个最大的变化互联网。因为互联网,信息的连接性和流动性变得非常快,非常高效。比如我们今天可以和全世界人民追求一样的热点,比如比特币,疫苗,核电站问题等等。

那么过去,大家的做法是什么呢?比如说有一个研究院,或者策略规划部门,或者品牌市场部等,由这群人去指定和计划未来5年的产品线。然后经过秘密和长时间的研发以后,最后交给我们的市场部门去宣传新产品。但不知道,大家有没有这种感觉,无论你一开始如何包装自己的产品,一旦投放到市场上,你完全随时面对一种失控感觉。你再也不能像过去一样通过所谓关键信息节点来塑造自己的品牌印象。因为互联网,今天传媒和链接都是分布式,而且越来越多的年轻人根本不相信所谓主流媒体。

我举一个最近我看到的例子。比如我在B站上看到有个UP主做某品牌的新手机测评的,我以为这个up主肯定会说一堆。另外我没有想到up说了一堆这个产品的缺点和遗憾。在最后还自己出来道歉,说让我免费使用产品,结果还说真多缺点。这就是当下的年轻人,他们自信而且真实。同时我也看到今天年轻人也不是简单追求奢侈或者追求便宜,而是有很多年轻的消费者愿意去体验和选择真正有特色的有技术含量的新产品,但是大家不愿意做冤大头的,不要被包装和概念的所忽悠,所以我称他们为叫精明理性消费。同时我也在网上经常看到一个词叫“颜值”,但我觉得不是很到位,我称之为叫“当下”。我认为现在年轻人更关注于当下。比如新入职年轻人,你和他们说公司过去怎么样,对不起,他们只关心当下和他们的未来。就好比我们经常希望我们把我们过去自己的历史经验传递给我们的孩子们,可是最后你还是会发现我们的孩子们有他们自己的世界和自己观点。所以我想,我们应该更加关注年轻人的喜好和价值观。我今天参加我们的大会,我发现大部分人都直接会说我们是要干什么,我们要怎么干。但是我很少听到大家怎么样理解我们要服务的消费者是谁,他们有什么喜好,和我们这些做规划或做设计的想法有什么不同吗?

刚才我分享一些外部的变化与挑战。我经常在反思一个问题,今天那些在公司里面做决定的人是不是离我们的消费者太遥远。我听到一个故事,某主机厂曾经发布一个定位女性的汽车,想象一下对于组织里面的专家或领导,决定是否使用红色内饰将是一个非常冒风险的事情,因为根据过去多年的销售数据和生产管理经验,都会让他们选择安全保守的白色内饰来作为他们的第一选择。幸好的是,在这个故事有一位年轻的女设计师主推的粉红色内饰,最后取得了巨大的成功。我经常拿这个故事提醒我自己,我是否真的知道用户是谁?他是否真的很喜欢我们的方案。

另外我想讨论一下“高级”感,比如说十年前你让消费者感觉豪华,你觉得它如何设计这辆车的高级感?也许是匠人的手工制作,或者一个某某的材料。今天我们怎么样传递高级的?Tesla怎么传递高级?我有自动驾驶,我有最先进的电动车技术。所以稀缺的东西,才是高级的。所以本质上我们需要传递是一个“稀缺感”。有什么是我有你无的东西吗?

我觉得今天我们缺少什么呢?第一,设计不够有聚焦。大多数同行做的都是最大众的车。那我们常常陷入一个非常同质化的竞争。我会好奇思考一个问题,比如中国市场这么大,我们就不能为女性车主开发一款产品吗?而且随着中国女性的经济实力的增长,在家庭中话语权的增长,女性应该成为我们主要市场人群,为什么我们想当然认为一定是男性来选车来开车呢?中国市场这么大,销量可能比欧洲市场还大,所以大家想象一下,假如我们在欧洲市场竞争,那是不是为法国市场和英国市场设计的东西会有些差异化呢?

举个例子,比如说我个人现在开车时间比较少,不是我不热爱汽车,而是因为我的长期伏案工作导致我的腰椎不好。所以我每次去试车,第一件事情就是先去试试各个位置的椅子舒不舒服,有没有一定特殊设计。今天我们在办公室,已经可以看到一些人体工效学的椅子。而我在汽车的配置表上却却很少看到可以较少驾驶或乘坐的疲劳的椅子。上一次我听到蔚来宣传“女王副驾”,我觉得太棒了,真正有人是在理解消费者需求。我们是不是太把车想当然想成这就是一个车。

还有一直让我很困惑的事情,为什么车用了这么久,感觉这个车还是一辆车。这话什么意思呢?我想问大家一个简单的问题,不管你租房子,还是买房子。如果这个房子被你住了3个月,请问跟你刚住进去的时候差别大不大?如果你同意汽车也是一个车主的私人空间,那么一个房间在用户过去生活12个月以后会留下大的痕迹,但是现在车没有。我也没有觉得我的汽车与邻居家的车有什么不同?比如请问我们为什么不能为女性车主打造化妆间功能的汽车呢?

所以我们需要重新去定义什么是高级感。第一中国市场非常大天生存在差异性,其次年轻的消费者是变化的,最后如果所有人都做同质化的竞争,比如提高续航里程。我们将无法提供有有稀缺性的高级感。

接下去我讲讲过去三四年在天猫精灵一些经验。2017年开始和宝马,奔驰,沃尔沃合作的时候,整个成果落地差不多快2020年了。我进去之后发现认知过程很有意思,一开始大家把语音这件事情当做是车内语音摇控器,比如说开个车内的空调。后来因为天猫精灵和家里很多智能家居链接了,所以合作伙伴希望通过助手把家也变成一个摇控器,比如在美国很多人有车库,所以这个功能确实很吸引消费者,但是到了中国大家就发现汽车和智能家居链接的场景就很小了。

今天听到很多人说,想去做一个虚拟人的数字助手。如果你对机器人很有期待,你接触机器人产品以后会巨大的失望。另外一种极端情绪是是对人形一机器人的恐怖感,比如科幻剧精彩会让大家焦虑,机器人是否会取代人类,或者说这个机器人是否会监控我隐私。所以因为我们对人性期待和熟悉,所以对今天人型产品经常会带来高期待和高焦虑。我一直非常赞赏二十年前,索尼发布宠物机器人。至今我认为它的产品化思维非常棒,尤其是当机器人技术没有特别成熟的时候。通过宠物这样形象,可以帮助消费者建立合理的心理认知和期待,减少不必要的焦虑感。

人们不喜欢复杂两面性的事情,更习惯于简单认知事物,比如星座就满足我们通过标签来认知周围人需求。所以一旦你发布产品以后,我们要么会把它当作一个工具。但是工具产品有一个问题是,用户对工具的学习热情,一般只在刚开始的使用的。比如你出厂的时候发布8个功能,但是用户可能只会选择性记住吸引他自己的3个功能。以后就比较难学会新的功能。我还记得2017年,天猫精灵刚发布的时候,我们每周开一次用户访谈会,当时我们收到很多热心用户给我们提建议,你应该做这个功能做那个功能。然后我们神奇发现,我们都做了。但是用户最后会说,没有啊,我不知道啊。所以你发现你很难将新的功能传递给你们的用户。当然还有一种极端的需求,有的用户一开始把天猫精灵当作是情感陪伴的伙伴,所以她说对情感交流特别渴望的,我们就发现她们经常会和天猫精灵交流,你能不能陪我聊天,我心情不好。我们在新用户当中收到大量情感类的交流请求,但是过一段时间基本上用户又会觉得它好傻,新鲜劲一过就不再好玩了。

所以我们天猫精灵一直没有计划推出一个虚拟人像就是这个原因。我们觉得像hey google,siri这样通过数字化抽象的助手形象,可以减少人类直觉类比带来的想象力限制。

我们一开始在家庭场景,随后进入了用户的出行场景,我们选择跟车厂合作。作为一个汽车行业的新玩家,我个人有些思考,过去大家比较容易去关注汽车所有场景。所以经常我们提供的技术可以满足汽车所有挑战。但其实有些问题是技术短时间很难解决的,比如在高速上噪音干扰问题,比如高速网络可能会掉线等。今天我想给给大家一个新的视角,如果我们可以汽车不再单纯是个汽车,而是想象成用户的私人空间。举个例子,如果今天用户开着窗,你想像成这个用户就坐在花园里欣赏美景;然后它可以变成一个移动客厅,客厅就意味着会有客人或者朋友来访,所以你要考虑需要这个空间就有社交和个人隐私需求;娱乐房、书房、化妆间等等。我之前听到过一个数据,说好多男性车主晚上回家要在车上休息30分钟再进屋,这就是车主放松和娱乐的场景。而不再仅仅把车想象成从A点到B点的移动工具而已。

我听很多人都讲到多模态。在我过去工作里,多模态概念不是指各种交互行为的融合。在机器学习领域,我们希望通过把各种数据融合,提高我们对用户意图和状态判断的确定性。如果你去做识别,你会发现提升单一维度数据判断性的正确率是非常难的,比如你可能可以把准确率做到95%以上,这其实已经是很不错了,对于机器学习来说做到100%几乎不可能的,这意味着总有5%的人会有不好的体验不好,会投诉你,会觉得你做的东西很不好用。而95%的人是往往是沉默的,大家认为这是理所当然的。这就会形成一个可怕结果,没有人表扬你,但总会有人被投诉做得不好。所以我们希望借助多个信息通道交叉来提高我们服务的确定性。

过去我们遇到的困难是,硬件传感器是不是提前布置?因为很多时候硬件团队考虑的问题是不能额外增加成本,而软件团队也不能提前把这个信息的价值说清楚,他需要时间去探索去测试,所以在现实中,我们只能通过产品迭代,第一代,第二代,第三代,这样一点点积累下来。

今天因为时间有限,关于车载助手我简单聊三点。第一,我建议,在你产品形象和感觉上应该把它设定为用户的数字宠物,这样它就不是一个工具,可以满足一定情感依赖,宠物本身又具有一定成长性,同时又可以规避人型焦虑感。第二,在汽车上和家里尤其不同的是,一定要注意安全性问题,尤其是因为助手带来的用户分神问题。所以在设计上,一定要干脆和直接一点。第三,用户都是懒的,有时你需要跟用户比韧性。不是什么好坏或者优劣的问题,其实就是因为用户习惯而已,如不必要,人们就不愿意主动改变自己。所以所以你一定要坚信如果这对于你的用户就是好东西,你就要不停地去坚持。

好的,再次感谢盖世汽车给我这个机会能和大家交流。