思必驰李枝桂:重塑“人车”关系
由盖世汽车、AUTOSAR组织、上海车展三方联合主办的SDVF2021第二届软件定义汽车高峰论坛暨AUTOSAR2021中国日于4月19-21日在上海举办,本次活动也是2021上海车展的同期活动之一,同时也是AUTOSAR组织在中国区唯一官方活动。本次会议邀请到了思必驰科技股份有限公司、智能汽车事业部商务总经理李枝桂先生在本次论坛进行了题为《重塑“人车”关系》的主题演讲,以下是他在本次演讲的主要内容:
大家下午好,首先说明下为什么会起这样一个话题?我们先分析一下传统人与车的关系,主要是人驾驶车辆,通过一些按键或者触摸跟车进行交互。但是随着自动驾驶和智能座舱的兴起,这种关系发生了比较大的变化。
首先我们分析一下智能座舱用的最多的三个功能:导航出行、语音交互、媒体娱乐。接下来我们重点从语音交互来做一个分析和介绍。
首先简单介绍一下语音识别发展的周期。在2010年以前基本上是离线的语音指令为主,那个时候特别难用。在2010-2015年随着移动互联网的兴起,在线识别技术识别率不断提升,这个时候语音识别得到了快速的提升期。2015-2018年,这个时候语音不仅仅是语音,它整合了很多生态的服务,比如说导航、音乐、天气、股票、航班、股票等等,所以让用户感觉到语音识别很好用,这个叫服务集成期,2018年以后就是个性化的服务,比如声音个性化的定制,社交个性化。
这里有些数据跟大家分享一下,2020年,新车语音搭载率达到63%,同比增长18%。这个增长率还是比较高的,因为这几年都处于快速的发展期。车载日活是23%,这也是比较高的。
针对车上的场景,这几年我们一直在打磨“天琴系统”方案,我们整合了生态的服务,赋能汽车做一些增值化的运营。
左边的功能就比较传统,也是非常常用的功能。比如说车控,出行,通信,查天气,查股票,打电话等等。我重点介绍一下右边的,也就是2018年以后处于个性化的服务。比如说第一个全双工语音,去年小鹏P7推的就是一直可以跟它对话,也是我们和小鹏一起打造的,这也叫全场景语音,不用每次唤醒,可以一直跟它对话。
第二个是TTS复刻,就是用户录一段话,大概5-6分钟,它可以合成,合成完之后在车上进行播报。
第三个是多音区,最早车上是单麦,后来逐步出现双麦,四麦,现在还有六麦,随着智能座舱的发展麦克风也越来越多,就是各个位置都可以进行语音交互,每个位置还可以互不干扰。
第四个是声纹识别,这个也算比较成熟,类似于指纹和人脸一样,每个人有自己的声纹特征,可以利用它进行登录和解锁,甚至小额支付。
第五个是虚拟形象,这个可以是2D,也可以是3D的。
下面这些技术也是非常常见的,像One-Shot,免唤醒,自定义唤醒,单轮对话,多轮对话,所见即可说,所见即可说就是在每个界面看到什么就可以说什么,这个也是提升用户体验的功能。
刚才这些技术离不开各个语音模块,比如说识别、合成、语义++。除了中文普通话,还有方言,像粤语、四川话、上海话,同时我们还做了十几个国家的语种。
还有现在提的比较多的是多模态,多模态语音是比较重要的一环,视觉也是比较重要的,基于这个我们推出了多模态系统。思必驰跟上海交大有一个联合实验室,除了做语音,还做了视觉相关的东西,所以这些算法都是有的。基于这个我们做了DMS,人脸识别,活体检测等相关的多模态交互产品。
刚才提到服务,服务非常重要,基本上在车上常见的,还有不太常见的也基本上全部用语音可以进行操作,地图、音乐、电台、天气、股票、火车票、百科、航班等等,这些都已经对接好了。
现在大家都对数据比较感兴趣,因为数据很重要,所以我们现在做了一个大数据平台,它可以进行语音交互数据,包括前两页说的那些数据其实就是我们大数据平台统计到的,包括大数据画像。基于这个数据可以做车主的信息推送,这是运营推送平台,可以做洗车券,保养券,节日提醒,比如说劳动节马上到了,上车的时候可以提醒今天是劳动节,直接是主动的提醒。
主机厂一般对数据比较敏感,所以可能不太放心数据跑在其他家服务器上面,甚至我们语音厂商服务器上面,基于这个痛点,我们现在推出了AI大脑私有云,相当于把AI引擎全部布到主机厂服务器上面,所有数据只有主机厂能拿的到,连我们都拿不到,这个目前来看也是比较大的趋势。这个架构图也是跟很多客户一起沟通的,我们把核心引擎全部做一个包装,基于主机厂的诉求做一个融合。
现在有很多案例,通用五菱、博泰等用的就是我们这个方案。现在合资厂商对这块就特别在意,现在我们跟东风日产也搭了一个私有云的平台,所有数据只有自己拿的到。可以看到日活,月活。车主分布在哪里,他有什么习惯,喜欢听什么歌,数据全部可以获取的到。基于这个我们再搭建一个推送平台,分区域,分设备号进行推送。
这是数据看板,可以看到语音交互习惯的占比。接下来我们看两个视频。
—VCR—
这就是刚才说的全场景,不用每次都唤醒,一直跟它对话。接下来是所见即可说,看到什么就可以说什么。
—VCR—
这套系统是不用唤醒,只有跟它说有用的话才触发。所见即可说,每个界面看到什么都可以说,而不是传统那样一定是指令式的,这就解决了用户核心的诉求。
接下来再介绍一下软硬一体化的方案。为什么车主更愿意使用手机?首先我们看一下他们用手机做什么?音频类占35%,导航地图占28%。基于这个痛点我们提出了车、家、手机三网生态数据融合方案。在硬件端做了类似于车载机器人和智能收放机的产品形态。
首先讲下硬件端,形态可以各种各样,可以是车载机器人,可以是智能收音机,可以是手机支架。核心是什么呢?核心是手机车联网方案,我们手机上有一个APP,可以把语音的东西全部放在手机上处理,支持安卓和IOS。
基于这个我们前几天刚跟雅迪签了一个战略合作,现在不仅仅是四轮车,现在二轮车也往智能化方向转型,我们跟雅迪做了两轮车方案,高端搭载我们的天琴,中低端搭载我们手机车联网方案,形态可以是仪表,可以是硬件盒子,核心是手机,连手机可以进行所有语音操控。
车家联动,现在我们集成了80多家智能家居平台,有海尔、美的、涂鸦等,可以进行车跟家的联动,只要是我们接过的设备,比如说快到家了,可以说把我家里的空调打开,可以进行提前操控。
这个产品形态是可以各种各样的,比如说宏光MINIEV我们做得是一个收音机,最早做得是机器人形态,但毕竟是单独的配件。他们说为什么不能做成收音机形态呢?因为收音机反正要装,那为什么不装一个智能收音机?装上收音机之后,可以对着收音机喊,所有功能全部可以语音实现。
我们还与三一搅拌车做了一个合作,这边项目做成了轮胎的形状,我们还有好多客户也在做,形态是各种各样的。
最后简单介绍一下思必驰,思必驰是国内领先的对话式人工智能平台公司,拥有全链路的智能语音语言技术,自主研发了新一代的人机交互平台(DUI),和人工智能芯片(TH1520);为车联网、IoT、以及众多行业场景合作伙伴提供自然语言交互解决方案,同时不断丰富后端服务资源,满足用户的多样化需求。
这是合作客户方面,思必驰携手众多合作伙伴如长城汽车、理想汽车、北汽集团、一汽奔腾、上汽通用五菱、东风日产、爱驰汽车、天际汽车、马自达、五十铃、吉利汽车、一汽解放、三一重工、上汽大通等,打造了小鹏P5/P7/G3、宏光MINIEV、岚图FREE、荣威RX5系列、长城哈弗系列、北汽新能源EU系列、BEIJING-X7、奔腾T33、宝骏E系、理想ONE、爱驰U5、天际ME7等多款车型。未来思必驰将继续在车联网领域为赋能更多车企,为实现全车智能互联互通而不懈努力。