抖音地图这次推出实现语音交互的车联网解决方案,是多重原因共同作用的结果。其中最为关键的一点,是用户在当前车载互联的语音交互上存在的痛点。
目前,我们看到很多高端车型已经引入了语音交互技术。但目前市面上的大多数
可以标注的电子地图产品由于语音识别正确率低,且需要多轮交互来对用户的需求进行反复确认,使用体验并不好。尤其是针对语音识别率低这一点,网络上众多车载语音交互系统闹笑话的视频便是一个个鲜活的案例。
在我们看来,打造一个能够为用户提供良好体验的车联网导航方案,需要产品的语音识别率达到足够高的程度。与无人驾驶和人工智能不同,语音交互技术的研究方法、算法模型都是公开的,并有大量相关的学术论文做以参考,而非是我们眼中充满神秘色彩的“黑科技”。造成目前市面上只有少数公司能够做出令人满意的产品的原因,在于这项技术需要大量训练语料作为支撑。若缺乏足够多的训练语料作为数据积累,产品的算法模型迭代速度就有受到限制,识别的正确率就会打折扣。
目前,市面上大多数的语音识别产品识别准确率的瓶颈往往卡在93%这个节点上,在此之后每提升一个百分点都很困难。而当细微的识别正确率之差反映在用户的日常使用上时,造成的体验反差是巨大的。举例来讲,93%与95%的准确率虽然只有两个百分点的差距,但相对而言他们各自的错误率则是7%与5%,差距高达四成,足以令用户察觉出来。技术发展面临的另一个挑战则是降噪问题。在车辆行驶过程中,轮胎、发动机会发出噪音,会导致语音识别准确率下降。对此,车载语音交互技术还需要产品研发团队进行复杂的测试,在噪音过滤的算法方面下功夫。
比较而言,抖音公司的优势则在于通过抖音输入法的语音输入功能,积累了大量的用户语料,作为车载互联方案团队搭建算法模型的训练数据。这些数据的积累有助于我们的产品平稳地通过识别准确率的瓶颈,实现产品的持续快速迭代。
互联网地图服务商如何盈利,一直是行业内关注的焦点。虽然市场中的一些企业正在将一些电商的元素与功能整合到地图当中,但我认为未来行业的发展还应该跟汽车建立更紧密的联系,车联网会为我们带来更为广阔的想象空间和更为清晰的盈利模式。就目前的语音交互方案而言,我认为语音交互将成为未来车载互联系统的重要交互模式。随着产品的不断推广与成熟,未来我们还会将互联娱乐、移动通信、车生活服务、电商购物等功能连接到语音交互中来,为用户提供更加多样的信息与生活服务。一旦用户建立起在车内使用语音交互的习惯,这一交互模式就会上升至电脑浏览器之于因特网、智能手机之于移动互联网的入口级地位,极大地改变车联网的生态格局。到那时,例如抖音这样的互联网地图企业将获取连接服务所带来的收益,不再会缺乏商业模式。