walking机器人入门教程-语音交互-配置百度语音服务

walking机器人入门教程-语音交互-配置百度语音服务

说明:

介绍如何配置百度语音服务来实现语音识别ASR
在简化的语音交互有三个重要概念: 唤醒词,语音识别,语音合成.
唤醒词,是进行唤醒语音交互的词,比如我们是用"小腾"来唤醒语音交互.
语音识别,是唤醒之后,在几秒内说一段话,作为执行的语音指令或匹配的语音关键词. 比如播放本地音乐, 测试深度相机,测试雷达等,当收到语音指令,语音识别会转化为文字与写好的语音脚本关键词匹配,从而执行匹配的脚本.
语音合成,是当匹配到语音脚本后, 在处理前会生成一段处理的回答语.或在执行后,提示已经处理的结果.

相关设备

walking机器人套件：采购地址

步骤:

唤醒功能通过snowboy实现, 语音识别和语音合成通过百度语音服务实现.
更详细的配置介绍, 可以参考配置文件~/.voice/config.yaml里面的提示.
目前主要通过百度语音服务实现. 需要注册帐号和开通语音服务.
默认我们是不提供使用帐号, 需要自己先注册帐号和开通语音服务
大致流程:

1. 注册或登陆帐号
2. 冲值, 充10元, 用于测试金额可以小点. 首次注册会有一定免费额度.长期使用建议小额充值.
3. 创建应用,有星号的,按实际选择即可. 默认就是包含了语音技术.就可以.其他随意.
4. 开通付费,语音识别下,点击开通付费, 在语音合成下,点击开通付费.开通付费后，默认采用按量后付费形式，总调用量不受限制，并发提升至50
5. 记录帐号信息, 点击管理应用, 进入页面后,记下 AppID, API Key, Secret Key几个值
6. 配置帐号,打开~/.voice/config.yaml 在百度配置一栏, 填写上述的几个值.即可完成配置

注册帐号:

点击访问百度云服务网站, 已有帐号,请登陆. 没有帐号,可以点击注册

冲值:

如果首次使用,可以不冲或小额充值测试.

创建应用:

点击创建应用, 有星号的,按实际选择即可
默认的语音技术下就包含了语音识别和语音合成
语音包名: 不需要
应用归属: 个人
应用描述: 随意写
创建应用后,记下 AppID, API Key, Secret Key几个值,后面配置需要

开通付费

首次可以忽略,默认有免费额度. 如果不想受限制,继续开通.
在可用服务列表下, 语音识别分页下API, 选中文普通话一行的开通付费.
在可用服务列表下, 语音合成分页下API, 选基础音库一行的开通付费.

记录帐号信息

上面创建应用如果没记下AppID, API Key, Secret Key几个值
打开管理应用,记录上述几个值

配置帐号

打开配置文件, vim ~/.voice/config.yaml
找到# 百度语音服务, 修改百度下配置的AppID, API Key, Secret Key几个值

测试语音:

执行语音交互

~/tools/ai_voice/ai_voice.sh

说出唤醒词: 小腾. 读法: 小.腾. 小中间拖长一点,腾这样容易识别
目前支持的语音指令:

播放本地音乐 #内置在/home/ubuntu/Music下已经不少歌曲
测试底盘
关闭底盘
测试雷达
关闭雷达
测试深度相机
关闭深度相机

更多的语音指令在开发中.....
语音插件目录在~/tools/ai_voice_custom/walking/custom
功能插件目录在~/tools/ai_voice_custom/walking/scripts
参考我们现有的插件写法,可以扩展自己语音插件和脚本插件.
比如说: 语音指令: 启动巡逻, 实现自动航点导航功能脚本.
比如说: 语音指令: 设置闹钟几点, 实现自动设置闹钟等等.
具体扩展,发挥自己的想象力.只有想不到,没有做不到. :)

获取最新文章: 扫一扫右上角的二维码加入“创客智造”公众号