murata的个人空间 https://www.eechina.com/space-uid-139095.html [收藏] [复制] [RSS]

博客

新唐ISD系列录音芯片

已有 682 次阅读2018-5-23 10:27 |个人分类:新唐| ISD, 录音芯片

      录音芯片是通过触发REC录音键随意录音保存,并且在录音完毕后,再触发PLAY播放键播放录音,并且可以实现重复录放的一个语音储存芯片。
      录音芯片:是通过触发REC录音键随意录音保存,并且在录音完毕后,再触发PLAY播放键播放录音,并且可以实现重复录放的一个语音储存芯片(原理图在录音芯片的原理中查看),它包括ADC和DAC两个过程,都是由芯片本身完成的,包括语音数据的采集、分析、压缩、存储、播放等步骤。
ADC=Analog Digital Change 模数转换
DAC= Digital Analog Change 数模转换
音质的优劣取决于ADC和DAC位数的多少。例如,WTV-SR模块采用主控芯片外挂SPI- FLASH的硬件架构,在录音时间及性价比方面有很大的优越性。)
1、原理比较简单,就是有REC和PLAY通过的两个按键组成,更多功能可以根据具体的案子来定义选择,比较全面的原理图如下:
录音芯片原理图录音芯片原理图
2、语音信号的量化表述:
(a) “录音芯片”介绍:
(1)语音信号的量化
采样率(f)、位数(n)、波特率(T)
采样:将语音模拟信号转化成数字信号。
采样率:每秒采样的个数(byte)。
波特率:每秒钟采样的位数(bit)。波特率直接决定音质。Bps: bit per second
采样位数指在二进制条件下的位数。一般在没有特别说明的情况下,声音的采样位数指8位,由00H--FFH,静音定为80H。
(2)采样率
奈奎斯特抽样定理(Nyquist Law):要从抽样信号中无失真地恢复原信号,抽样频率应大于2倍信号最高频率。抽样频率小于2倍频谱最高频率时,信号的频谱有混叠。抽样频率大于2倍频谱最高频率时,信号的频谱无混叠。
嗓音的频带宽度为20~20K HZ左右,普通的声音大概在3KHZ以下。所以,一般CD取的音质为44.1K和16bit,如果碰到某些特别的声音,如乐器,音质也有用48K和24bit的情况,但不是主流。
一般在我们处理针对普通语音IC的时候,采样率最高达到16K就够了、说话声一般取8K(如电话音质)、6K左右。低于6K效果比较差。
在应用单片机的过程中,采样越高,定时器中断速度越快,会影响到其他信号的监控和检测,所以要综合考虑。
(3)语音压缩技术
由于语音数据量庞大,对语音数据进行有效压缩是很必要的,能够使我们在有限的ROM空间里录入更多的语音内容。有以下几种方式:
语音分段:将语音中可以重复的部分截取出来,通过排列组合将内容完整地回放出来。
语音采样:一般我们使用的喇叭频响曲线在中频部分,较少用到高频,所以,在喇叭音质可以接受的情况下,适当降低采样频率,达到压缩效果,这种过程是不可逆的,无法恢复原貌,叫有损压缩
数学压缩:主要是针对采样位数进行压缩,这种方式也是有损压缩。例如,我们经常采用的ADPCM压缩格式,是将语音数据从16bit压缩到4bit,压缩率是4倍。MP3是对数据流进行压缩,涉及到数据预测问题,它的波特率压缩倍率为10倍左右。
通常,以上几种压缩方式都是综合起来使用的。
(4)常用语音格式
PCM格式: Pulse Code Modulation 脉冲编码调制,它将声音模拟信号采样后得到量化后的语音数据,是最基本最原始的一种语音格式。同它极为类似的还有RAW格式和SND格式。它们都是纯语音格式。
WAV格式:Wave Audio Files 是微软公司开发的一种声音文件格式,也叫波形声音文件,被Windows平台及其应用程序广泛支持。WAV格式支持许多压缩算法,支持多种音频位数、采样频率和声道,但WAV格式对存储空间需求太大不便于交流和传播。WAV文件里面存放的每一块数据都有自己独立的标识,通过这些标识可以告诉用户究竟这是什么数据,这些数据包括采样频率和位数,单声道(mono)还是立体声(stero)等。
ADPCM格式:是利用对过去的几个抽样值来预测当前输入的样值,并使其具有自适应的预测功能与实际检测值进行比较,随时对测得的差值自动进行量化级差的处理,使之始终保持与信号同步变化。它适用于语音变化率适中的情况,而且声音回放过程简短。它的优点是对于人声的处理比较逼真,一般达到90%以上,已广泛地应用于电话通信领域。
MP3格式: Moving Picture Experts Group Audio Layer III,简称为MP3。它是利用 MPEG Audio Layer 3 的技术,采取了名为“感官编码技术”的编码算法:编码时先对音频文件进行频谱分析,然后用过滤器滤掉噪音电平,接着通过量化的方式将剩下的每一位打散排列,最后形成具有较高压缩比的mp3文件,并使压缩后的文件在回放时能够达到较接近原音源的声音效果。它的实质是vbr(Variant Bitrate 可变波特率)可以根据编码的内容动态地选择合适的波特率,因此编码的结果是在保证了音质的同时又照顾了文件的大小。
录音芯片的应用领域非常广泛,如礼品类的录音玫瑰,玩具类的录音玩具熊,通信类的录音答录机,以及记者必备的录音笔等等
这些领域的应用,都是因为录音芯片有以下不可替代的优势:
长时间录音模块 录音芯片
智能可重复录放音功能,也可以订做各种功能;
具备根据不同的应用场合设置不同的语音提示功能;
支持直接按键控制及单片机串口控制;
录音时采样率为8KHz,录放音音质好;
固定语音支持6KHz~24KHz采样率;
麦克风现场录音、直接用音频线录制模拟信号声音,以及用软件烧写数字语音等多种音源加载方式;
利用USB端口下载语音信息,传送速度快;
配套功能强大的上位机操作软件,操作简单明了;
独立的固定语音区域及现场录音区域;
高端智能傻瓜软件支持WAV、MP3、ADPCM下载,支持录音内容上传;
采用低功耗工作模式,适合长时间工作;
最长可录制256段语音,最小段长不受时间限制;
可录制30分钟到16小时(视外挂NAND-FLASH而定)的高品质语音;
工作电压:DC3.3V或DC5V。
描述:由麦克风、模拟音源、上微机软件录制语音信息到录音模块,在控制端发出控制指令(如脉冲、微机数据信息等)到WTV-NAND录音模块,就能触发录音模块播放已录制的报警语音。
支持16MByte到256MByte的NAND-Flash。
相关词语描述 ◎ 现场录音:指通过麦克风从现场录制到的语音(第一段现场录音被系统设置为固定语音,方便现场操作)。
◎ 现场放音:播放通过麦克风录制现场的语音。
◎ 固定录音:用上微机软件烧写到录音模块的语音,其中包括报警提示语,疏散人群提示语,广告语,整点报时等等。
应用范围 录音模块是集录音放音于一体的多功能模块,能够以声音的形式采集到现场的音频信息,适用于各种消防警戒现场,以及需要高品质长时间录放音的场所,如会议记录,电话录音,复读机,学习机等。
在实际应用中,假如觉得录音模块功能不够用,可以订制功能,录音模块功能定做轻而易举。如卡片学习机轻松实现录制、播放多张卡片内容等。
如果用于消防现场录音,能为日后对火灾事故做分析提供有力的线索,且可以在火灾发生时进行报警,通知有关人员并及时疏散人群,能够有效的解决当前火灾事故报警力度不够的问题,将灾害降低到最低程度。用在会议现场录音,可以记录会议里每一句重要的语录,用在复读机方面,能完好的将自己的读声反复体现,方便自己找到错误并纠正。
  有任何技术或业务上的问题,需要新唐系列的开发板请联系我,谢谢

 联系人:刘先生

 联系电话:0755 8259 1179-803   

 QQ:97805809

 公司:深圳市颖特新科技有限公司(新唐华邦代理)


路过

鸡蛋

鲜花

握手

雷人

评论 (0 个评论)

facelist

您需要登录后才可以评论 登录 | 立即注册

关于我们  -  服务条款  -  使用指南  -  站点地图  -  友情链接  -  联系我们
电子工程网 © 版权所有   京ICP备16069177号 | 京公网安备11010502021702
返回顶部