微信小程序语音识别,微信小程序语音识别代码

9158APP 0

微信小程序语音识别,微信小程序语音识别代码

1 概述

通过微信小程序的wx.startRecord()和wx.stopRecord()接口进行录音,并将丝录音文件上传到服务器。通过ffmpeg将silk录音文件转换为wav录音文件,然后使用百度语音识别

RESTAPI获取语音识别结果。

2. 代码实现

录音及语音文件上传

节点服务器接收语音文件代码

将Silk 文件转换为wav 文件

我使用Silk-v3-decoder 将Silk 文件转换为wav 文件

如何使用Silk-v3-解码器

百度语音识别REST API识别wav文件

1、通过APIKey和SecretKey获取access_token

通过APIKey和SecretKey获取的access_token文档

2.通过token调用百度语音识别REST API识别接口

3. 语音识别优化

经过以上操作,发现识别的内容和实际的内容相差很大。

百度语音识别REST API文档

查看文档:采样率:8000/16000 仅支持单通道

ffmpeg中对应的设置为:

-arrate 设置采样率

-acchannels 设置通道数

修改converter.sh文件如下图所示

修改converter.sh文件