构筑语音新世界 车联网中的“siri”

发布时间:2012-10-9 22:14    发布者:1770309616
关键词: 车联网 , siri , 语音识别
  “车联网构筑语音技术应用新世界”
  在苹果Siri所引发的全球语音热潮的推动下,科大讯飞成为了中文语音识别领域的弄潮儿。然而一些有识之士深刻认识到,语音识别技术真正有价值的应用领域是在汽车驾驶,车联网将成为语音技术应用领域的又一蓝海。与科大讯飞走手机语音识别应用之路不同,车音网将语音识别应用的重点放在了汽车驾驶室内,并成功搭建了一个车载语音云平台。
  语音汽车
  依托车载语音云平台,驾驶者只要开口说话,相关需求就能得到满足。
  1920年代生产的“Radio Rex”玩具狗是眼下有据可查的最早的语音识别器,当这只狗听到自己的名字时,它就会从底座上弹出来,吓人一跳。那时候的语音识别技术是基于英文语音为基础开发,而作为象形文字的中文语音识别与作为音节文字的英文语音识别有着很大差别,而且也相对困难得多。
  苹果Siri(语音个人助理服务)的问世,展示出了语音识别技术在应用领域的非凡前景。科大讯飞则是借助苹果Siri所引发的全球语音热潮,成为在中文语音识别领域中异军突起的企业。为此,中国移动宣布斥资14亿元现金战略入股科大讯飞,成为第二大股东。
  对于这一举措,中国移动方面称,主要是由于看好语音技术的发展潜力,智能手机下一步的发展将会是以语音技术为主的人机互动科技,而科大讯飞已于内地上市,在语音技术业务方面取得行业领先地位,基于此双方形成了目前的资本合作格局。
  其实,语音识别技术并非苹果的创举,早期的声码器,可以看做是语音识别技术的雏形。在追溯中文语音识别技术起源时,另一家公司的名字映入眼帘——车音网。基于十余年语音识别技术的研发耕耘,车音网成为为车主提供基于语音识别技术的智能辅助驾驶服务的领头羊。
  早在1999年,车音网创始人沈康麒所带领的技术团队就开始投身语音识别技术的研发,这群工程师也可以说是国内研究中文语音识别技术最早的那拨人。因此,在语音识别技术研发道路上,科大讯飞并不孤单。
  记者通过采访发现,科大讯飞与车音网的底层技术原理和算法几乎完全一致,但在对语音引擎理解、应用领域研究和业务发展方向等方面,两家公司却走着几乎完全不同的道路。车音网的核心团队基于十余年语音识别技术的研发耕耘,深刻认识到,语音识别技术真正有价值的应用领域在车里,在手眼感官被占、行为受限的特定行为空间当中。
  车音网致力于为车主提供基于语音识别技术的智能辅助驾驶服务,并成功搭建了一个车载语音云平台。依托该平台,驾驶者只要开口说话,相关需求就能得到满足。凭借优秀的语音技术基础和卓越的用户体验,车音网在短短三年时间内就发展近20万用户。
  语音引爆车联网
  在车联网服务大规模增长的路上,人机交互的语音识别技术被认为是必备的入场券。
  车音网所在的行业叫车联网(Telematics),也就是车载信息服务,即借助无线通信网,为驾车人士提供诸如免提电话、道路救援、指路导航、车辆远程诊断、预订酒店等多样化的汽车安全及信息服务。
  在美国,车联网市场规模已超过100亿美元,但在中国,2009年车联网才开始起步。车联网服务源自欧美,是一种结合了全球卫星定位系统和无线通信技术的汽车远程信息服务。通俗地说,装了Telematics的汽车,就像是航线上的飞机,包括运行轨迹、车况等一切数据信息都能被服务中心及时掌握,而驾驶者也能通过无线网络随时与服务中心进行联系,及时获取所需的信息和服务。“路上快行、车下秘书、车上生活、车上办公”是车联网的本质特征。
  从产业链上来看,车联网服务可以分为以移动通信运营商为主的后装市场和以汽车厂商为主的前装市场两个部分。前者主要侧重位置导航、实时路况、资讯娱乐等车载位置与信息服务;而后者则集中于车辆诊断、碰撞紧急求助、被盗车辆追踪、呼叫中心等汽车安防服务。
  在欧美,车联网服务已经是驾驶者不可缺少的一项服务。譬如,通用ON-STAR(安吉星)在全美有5000万用户,且在通用车里使用比例高达到50%,但对中国车主而言,这还是一个全新的概念。
  毫无疑问,这将是一个很庞大的市场。一个简单的数据对比或可以说明,相对于中国过亿的乘用车保有量相比,目前使用车联网服务的还不足1%。无论是海外经验证明还是简单的逻辑分析,都可以得出这样的结论:鉴于这样的服务与个体生命密切相关,“用户黏性”非常好,其市场一旦爆发,规模势必惊人。
  但三年时光匆匆过,车联网行业的发展依然是“雷声大,雨点小”。谈及现状,业内普遍认为,一方面是这一行业还缺乏“杀手级”的应用,另一方面则是因为中国车主的消费观念短期内难以改变,市场还需要逐步培育。
  车音网副总裁陆凌涛分析称,在前装市场,汽车厂商还没有相关意识,即使有了意识后,也涉及一些汽车生产标准的调整,这需要时间;而在后装市场,目前多数人还是把车当奢侈品,而不是一个工具,这决定了消费习惯。
  不过,多数人相信,这一市场即将爆发,而在车联网服务大规模增长的路上,基于人机交互的语音识别技术被认为是必备的入场券。陆凌涛说,在车载环境下用户能做什么,受制于与汽车的交互方式。他认为,在车载环境下,用户的主要集中力在于驾驶,人与车的交互必须在不影响驾驶的前提条件下进行。语音识别技术则提供了这样一种安全便携的交互方式,用户只需动口,即可满足在行车过程中拨打电话、位置导航、资讯播报、语音点歌、车辆诊断等伴随式服务。
 语音梦回车里
  通过语音识别技术,车音网已经帮车主实现了“动口不动手”的车上信息服务。
  车音网可以说是国内首家通过智能手机实现车联网服务的企业,十几年的语音识别领域耕耘最终在车联网的应用领域迸发出火花。
  苹果公司在今年6月份举行的全球研发者大会(WWDC)中提到,iPhone未来将会用一根数据线与汽车连接,驾驶者(用户)可以通过方向盘上的按钮触发Siri,包括丰田、捷豹在内等九大厂商已经承诺将在未来一年内开发支持iPhone Siri的接口。届时,驾驶者将能一边驾驶,一边和身旁这位上知天文下知地理的助手聊天。
  令人兴奋的是,这些设想早在三年前就已经在车音网的业务规划当中,通过蓝牙技术,车音网已经实现手机与汽车的连接的产品化,通过语音识别技术,车音网也已经帮车主实现了“动口不动手”的车上信息服务。真正实现了将语音识别切入到人的实际生活场景中去。车音网整合了语音通讯、地图、地理信息、音乐媒体等几乎所有生活信息,然后进行人性化的整合,并且用语音交互的方式表达出来。
  通过切身的体验,更加令人兴奋的是,苹果在WWDC上提出,未来的iPhone仅仅用一个触发按钮就能实现Siri与汽车的结合,而车音网却已经将这个按钮装到了车上,而且通过国际通用的蓝牙技术,这个按钮能连接的手机当然不仅仅是iPhone,还有其他各类的具备蓝牙功能智能手机,还因为车音网的服务实现方式是建立在2G基础上的IVR话音通道和基于3G通讯网络的数据通道,所以甚至就连非智能手机都能听得懂车主的“发号施令”,就如同在你驾车的时候,身边多了一个听得懂人话、几乎无所不能的助手副驾。
  在移动互联网领域中看似简单的语音应用,在高速行驶、行为受限的车载应用场景中,却并非那么简单。首要问题就是语音识别技术的商用能力成为关键,噪音、麦克风回声、口音问题等等都会深深的影响语音技术的识别率,而语音识别率的高低又直接影响用户的体验,同时也关系到语音技术开发企业的核心竞争力。
  “事实上,噪音和麦克风回声都有办法建立模型来解决,但实现更高的语音识别率首先需要解决口音问题,尤其在中国这个口音繁杂的环境下,不同地域不同口音的语料数据库以及针对语料库的语音模型分析至关重要。”陆凌涛说,要提高语音识别率,并不仅仅需要庞大资金的支持,还需要时间的积累。
  据了解,在语料采集方面,沈康麒曾亲自带领一支数据团队,专门在全国各地收集采录不同口音、不同阶段年龄、不同性别在不同环境下的真实语料。这样的工作十余年来始终坚持不懈,并不惜耗资过亿进行特征提取、模型训练,形成了世界上独一无二的广谱语音特征数据库资源,这为车音网特有的商用级非特定人语音识别技术打下了坚实的基础。
  机会总是留给有准备的企业。
  从2010年下半年开始,汽车销量在经过大规模快速增长后,增速放缓甚至出现了停滞,许多汽车厂商意识到需要通过差异化服务来增加销量,而车联网这一在欧美汽车行业发展了近十年的新兴汽车信息服务被引进后,几乎成为了所有汽车厂商特别是国产汽车品牌寻求市场差异化的兴奋剂。但当时由于国内很多汽车厂商缺乏相关的技术积累,只能找到技术相对成熟的第三方公司合作。
  于是,国内一些车厂纷纷找到了车音网洽谈合作。截至目前,奔腾、莲花、斯巴鲁、一汽丰田、一汽马自达、安吉星等车厂及TSP(Telematics运营服务商)纷纷开始与车音网寻求合作打造语音服务平台。车音网正逐渐成为中国车联网行业中基于语音识别技术的人机交互平台的主要提供商。
  语音车的未来
  陆凌涛表示,要达到更自然的人机交互,需要三个层面的努力:自然语言识别、人工智能和知识库,缺一不可。
  完美的语音技术,或者人类对这一技术的最终想象,早在上个实际80年代,就在美国的科幻电影《霹雳游侠》中的那辆听得懂人话的汽车上就已有所展现,直到近期,电影《钢铁侠》中的那位无所不能的智能管家、《机器管家》中的那位机器人,都在不断体现着人们对语音识别技术的应用渴望,这些机器(人)不仅能够完美执行指令,而且还能够读懂人的感情。从这一意义上来说,从事语音识别研发的公司均存在着巨大的潜在前景。但让机器读懂你在说什么,这实在是一件浩大的工程。
  陆凌涛表示,要达到更自然的人机交互,需要三个层面的努力:自然语言识别、人工智能和知识库,缺一不可。而云计算和大数据时代的到来,这些科幻小说里的场景几乎距离大众只剩下“最后一公里”。云计算带来的一个好处是,每个人的数据都是存储在云端的,不管这个人到了哪里,他的数据都可以随时调用,他的偏好都可以随时下载下来。
  设想这样的场景,你在云端设置了一个叫“我的家”的地点,然后当你对着手机喊“我的家”时,它会告诉你怎么走。但当你和你的汽车系统说去“我的家”时,它显然并不能理解“我的家”是什么,因为它的数据和云端的数据是不相通的。
  每个人每天用得最多的设备毫无疑问是手机,你的大多数个人数据和个人偏好都被手机记录了下来。如果每台手机都是一个助手,显然这个助手是众多数码助手中最了解你的。而汽车系统因为是相对独立的,它并没有像手机那样,了解那么多你的偏好,甚至,它能知道你经常在什么地点之间往返就已经算是“聪明的汽车”了。
  另一方面,目前每个汽车厂商研发的汽车系统都是相对独立的,这给数据共享带来了难度。设想某一智能汽车已经了解了你的偏好,某一天你换车了,你得重新调教这辆车,让它更“懂”你。
  于是,如果每个人开车时都连上自己的手机,这时在你手机里记录的个人偏好就被完整的移植到了汽车系统当中,哪怕这并不是你自己的车,那一瞬间,这辆车也是完全懂你的。所以更智能的、更个性化的汽车系统,必将与手机密不可分,或者说,必将与手机记录下来的用户数据密不可分。
  而这也恰是车音网眼中车联网产业的最后一公里,让你的车“听懂”你,让你的车“更懂”你!

来源:证券时报
本文地址:https://www.eechina.com/thread-98728-1-1.html     【打印本页】

本站部分文章为转载或网友发布,目的在于传递和分享信息,并不代表本网赞同其观点和对其真实性负责;文章版权归原作者及原出处所有,如涉及作品内容、版权和其它问题,我们将根据著作权人的要求,第一时间更正或删除。
您需要登录后才可以发表评论 登录 | 立即注册

厂商推荐

相关视频

关于我们  -  服务条款  -  使用指南  -  站点地图  -  友情链接  -  联系我们
电子工程网 © 版权所有   京ICP备16069177号 | 京公网安备11010502021702
快速回复 返回顶部 返回列表