微信小程序语音识别,微信小程序语音识别代码
1 概述
通过微信小程序的wx.startRecord()和wx.stopRecord()接口进行录音,并将丝录音文件上传到服务器。通过ffmpeg将silk录音文件转换为wav录音文件,然后使用百度语音识别
RESTAPI获取语音识别结果。
2. 代码实现
录音及语音文件上传
节点服务器接收语音文件代码
将Silk 文件转换为wav 文件
我使用Silk-v3-decoder 将Silk 文件转换为wav 文件
如何使用Silk-v3-解码器
百度语音识别REST API识别wav文件
1、通过APIKey和SecretKey获取access_token
通过APIKey和SecretKey获取的access_token文档
2.通过token调用百度语音识别REST API识别接口
3. 语音识别优化
经过以上操作,发现识别的内容和实际的内容相差很大。
百度语音识别REST API文档
查看文档:采样率:8000/16000 仅支持单通道
ffmpeg中对应的设置为:
-arrate 设置采样率
-acchannels 设置通道数
修改converter.sh文件如下图所示
修改converter.sh文件