没有语音交互功能,再好的车机都是摆设

栏目:教育平台  时间:2023-04-25
手机版

  文秦叔宝

  当你兴致勃勃的开着车和朋友一起出去玩“哎,你手机拿来导航一下。”

  “干嘛,我要玩手机呢,用你车机导航呗,我来弄,你这导航功能到底在哪?。”

  “点完这里,再点这里。”这车是几年前的老款了,车机是触屏的,该有的功能都有,但是没有语音交互。

  五分钟后“空调风太大了,调一下,在设置里吗?”“太阳好晒,把遮阳帘开一下,应该点哪里呀?”“音乐声音好小,我调大一点。”朋友在车机上一顿捣鼓,终于调到了舒适的环境,不过这时候目的地都到了,你们这一路和车机斗智斗勇,还没玩已经有些心力交瘁了。

  通俗点来说,没有语音交互的车机就像没有管家的庄园,本来想享受主人待遇,结果事事都要亲力亲为。

  一、功能

  车主:“小X同学。”

  “诶,我在呢。”

  车主:“导航到大剧院。”

  “已为您找到多条路线。”

  车主:“第一个。”

  “全程18公里,预计用时三十分钟,18点40分到达目的地大剧院,准备出发。”

  从车主说出第一个字到完成这件事不超过一分钟,类似的指令,我们的车机同学会一丝不苟的、迅速的执行,路途本可如此简单。

  随着科技的进步语音交互也越来越从人工智障蜕变为人工智能。

  车载智能语音交互包括:

  (1)导航:增加途径点、导航到兴趣点、导航到固定地点

  (2)音频:有声读物、广播、音乐

  (3)通讯:短信、电话

  (4)车辆基本控制:雨刷器、天窗、空调

  (5)车辆信息查询:胎压、油耗

  (6)生活信息查询:天气/机票/酒店/新闻/股票/限号

  二、操作及体验

  语音交互的优点有三,第一,没有什么方式能够比直接说话来的更简单,更自然,更不需要学习成本。第二,通过语言交互可以将手和眼睛空起来处理其他事情,第三是效率问题,利用语音输入普通话的速度是传统输入方式的3.21倍。

  我们来看看目前市场上,各大车企对语音交互的应有以及消费者的体验。

  据亿欧智库调查,近600款新车中的智能语音系统渗透率就达到了86%;国内用户对智能语音交互感兴趣程度就只有42.9%。

  两组数据巨大的落差,无疑就与高调的智能语音宣传形成了既然不同的反差。简言之,大家对智能语音的使用依然保守。

  根本原因其实就是现阶段大部分语音系统都体验不佳。在传统品牌中,其语音基本停留在“有比没有好的阶段”,控制简单功能、可玩性不强;而新势力,体验有所改进,但日常使用依然痛点不少,识别效率低等等。

  但车企对此也正在努力改进,在语音分区+毫米级响应+连续对话+语义打断等方面都有一定进步。

  三、技术原理

  语音交互(VUI)指的是人类与设备通过自然语音进行信息的传递。一次完整的语音交互需要经历车八步:对话输入与前端处理- ASR语音识别- NLU语音理解- DST对话状态追踪- NLG语音生成- Policy动作候选排序-TTS语音合成-对话输出

  在语音交互在车端应用过程中,ASR、NLP和TTS是三个关键环节,同样也是当前行业发展仍需深耕的单点技术模块:

  ASR(语音识别)包括:接收声音信号转化为音频信号并放大、声源定位、降噪去混响、语音增强、声源信号提取/分离

  NLP(自然语言处理)包括:NLU即分词、词性标注、句法分析、文本分类、信息检索、信息抽取、文字校对,以及NLG即机器翻译、问答系统、自动摘要

  TTS(语音合成)包括:从文本转换成语音,让机器说话。TTS业内普遍使用两种做法:一种是拼接法,一种是参数法。

  拼接法即从事先录制的大量语音中,选择所需的基本发音单位拼接而成。优点是语音的自然度很好,缺点是成本太高,费用成本要上百万。

  数法指使用统计模型来产生语音参数并转化成波形。优点是成本低,一般价格在20万~60万不等,缺点是发音的自然度没有拼接法好。

  写在最后:

  随着车联网和智能汽车的兴起,越来越多的功能被搭载在车机上。日趋复杂的界面形成了对驾驶者注意力的争夺。车载语音交互将会越来越重要。

上一篇:声动华珠,响彻世界丨华南农业大学珠江学院2023北美艺术家中外文化交流晚会圆满落
下一篇:壳牌“美境行动”2022年获奖名单揭晓,持续赋能青少年环保实践

最近更新教育平台