微信小程序如何实现语音识别转文字功能,有哪些技术难题和解决方案?
- 内容介绍
- 文章标签
- 相关推荐
本文共计1858个文字,预计阅读时间需要8分钟。
最近为小程序增加了语音识别转文字的功能,持续更新中,特别记录。
微信开发者工具上的录音文件与移动端格式不同,暂时只能在工具上播放调试,无法直接播放或在小程序中进行播放。
最近为小程序增加语音识别转文字的功能,坑路不断,特此记录。
微信开发者工具
开发者工具上的录音文件与移动端格式不同,暂时只可在工具上进行播放调试,无法直接播放或者在客户端上播放
debug的时候发现,工具上录音的路径是tmp/xxx.mp3,客户端上录音是wxfile://xxx.mp3。 忽悠呢,不是格式不同,是映射路径不同。
其实做个兼容也不难,每次提示一行文字,很丑。
采样率与编码码率限制
每种采样率有对应的编码码率范围有效值,设置不合法的采样率或编码码率会导致录音失败。详细看这个
developers.weixin.qq.com/miniprogram/dev/api/media/recorder/RecorderManager.start.html
一开始没有留意,导致录音不成功。
试过几次后,采用这样的配置,感觉录音识别率和体积之间比较好平衡:
sampleRate: 16000, //采样率 numberOfChannels: 1, //录音通道数 encodeBitRate: 96000, //编码码率
单通道基本是必选的。因为asr只支持单通道。frameSize也是可以的,但是要考虑截断对识别的影响。暂时没有用上。
本文共计1858个文字,预计阅读时间需要8分钟。
最近为小程序增加了语音识别转文字的功能,持续更新中,特别记录。
微信开发者工具上的录音文件与移动端格式不同,暂时只能在工具上播放调试,无法直接播放或在小程序中进行播放。
最近为小程序增加语音识别转文字的功能,坑路不断,特此记录。
微信开发者工具
开发者工具上的录音文件与移动端格式不同,暂时只可在工具上进行播放调试,无法直接播放或者在客户端上播放
debug的时候发现,工具上录音的路径是tmp/xxx.mp3,客户端上录音是wxfile://xxx.mp3。 忽悠呢,不是格式不同,是映射路径不同。
其实做个兼容也不难,每次提示一行文字,很丑。
采样率与编码码率限制
每种采样率有对应的编码码率范围有效值,设置不合法的采样率或编码码率会导致录音失败。详细看这个
developers.weixin.qq.com/miniprogram/dev/api/media/recorder/RecorderManager.start.html
一开始没有留意,导致录音不成功。
试过几次后,采用这样的配置,感觉录音识别率和体积之间比较好平衡:
sampleRate: 16000, //采样率 numberOfChannels: 1, //录音通道数 encodeBitRate: 96000, //编码码率
单通道基本是必选的。因为asr只支持单通道。frameSize也是可以的,但是要考虑截断对识别的影响。暂时没有用上。

