AI show|点赞!云知声音频文件转写准确率提升超3%

发布时间:2022-6-8 18:06    发布者:uullop
关键词: 声音频文件转写 , SMAD技术

无论是会议、访谈录音的整理,还是各种视频的字幕制作与语音质检,快速解决各类场景下的音频转文字的需求,都离不开音频文件转写服务。

音频文件转写服务,是自动语音识别Automatic Speech Recognition(ASR)技术的一种应用,将长段音频文件(5小时以内或文件大小在2G以下)转换成文本数据。适用于会议转写、字幕生成、音频内容分析等场景。

近期,云知声音频文件转写发布最新版本。经过不断地努力与算法攻坚,云知声团队在前端语音信号处理、声学模型、解码方式等各项技术实现全面升级,尤其声学模型方面,首次使用了基于注意力机制的端到端模型,在准确率方面有了明显提升;同时,在快速纠错和热词识别等方面也进行了功能优化与实时更新,进一步满足了各使用场景用户的需求,提升音频文件转写使用体验。


01全新技术升级 准确率提升超3%

最新的版本中,云知声的音频文件转写在语音识别技术上采用最先进的AED 端到端系统(Attention-based Encoder Decoder),又创新性的提出了SMAD(Self-and-Mixed attention Decoder)技术,即在解码中,采用文本和声学的混合注意力机制,从而得到识别的最优结果。

无论是不同设备录制、不同网络传输、还是带有一定噪声和干扰的语音,都可以实现准确转写。在通用场景测试中,云知声准确率绝对提升超3%。达到行业顶尖水平。这不仅能带给终端用户更好的体验;对开发者来说,也是一次效率以及质量的升级,大大满足开发者精0益求精的诉求。

02   更简单易用 开发者0成本接入先进语音识别技术

音频文件转写通过 Web API 的方式给开发者提供通用 HTTP 接口,具备流式传输能力和轻量、跨平台的特点,方便开发者直接调用、快速集成。

云知声作为国内头部的人工智能独角兽企业,以人工智能语音技术为核心,通过全栈式技术链条,为企业和用户提供智能语音技术和综合解决方案。

本次升级只是技术提升,并不改动接口,所以原来对接过云知声音频文件转写服务的开发者没有任何影响。

此外, 我们为新接入的开发者准备了免费体验包,注册即可认领;实名认证的个人开发者和企业开发者,还可以获得一大份认证礼包。

新手 3步 集成:


作为新一代智能语音识别引擎,云知声音频文件转写最新版本已经在官网及AI开放平台焕新上线,以优质的性能对外提供AI开放式服务,赋能更多对音频文件转写有需求的开发者与合作伙伴。

未来,团队会在继续打磨技术的基础上,赋能更多应用场景,加速语音识别技术的快速落地!


本文地址:https://www.eechina.com/thread-792362-1-1.html     【打印本页】

本站部分文章为转载或网友发布,目的在于传递和分享信息,并不代表本网赞同其观点和对其真实性负责;文章版权归原作者及原出处所有,如涉及作品内容、版权和其它问题,我们将根据著作权人的要求,第一时间更正或删除。
您需要登录后才可以发表评论 登录 | 立即注册

厂商推荐

  • Microchip视频专区
  • Dev Tool Bits——使用MPLAB® Discover浏览资源
  • Dev Tool Bits——使用条件软件断点宏来节省时间和空间
  • Dev Tool Bits——使用DVRT协议查看项目中的数据
  • Dev Tool Bits——使用MPLAB® Data Visualizer进行功率监视
  • 贸泽电子(Mouser)专区
关于我们  -  服务条款  -  使用指南  -  站点地图  -  友情链接  -  联系我们
电子工程网 © 版权所有   京ICP备16069177号 | 京公网安备11010502021702
快速回复 返回顶部 返回列表