门户
图库
科技
数据
VR
区块链
学院
论坛
百科
导航
登录
注册
帮助中心
公社首页
中国人工智能社区
公社版块
广播
Follow
升级会员
动态
Space
用户名
Email
自动登录
找回密码
密码
登录
立即注册
登录后你可以:
登录
首次使用?
点我去注册
搜索
搜索
本版
文章
帖子
公社群组
用户
好友
收藏
道具
勋章
任务
淘帖
动态
日志
相册
分享
记录
留言板
广播
群组
门户
导读
排行榜
设置
我的收藏
退出
首页
›
智能技术
›
语音识别
›
语音识别功能测试:90%问题,可以通过技术解决 ...
返回列表
语音识别功能测试:90%问题,可以通过技术解决
[复制链接]
CBEC
2024-1-5 10:56:51
显示全部楼层
|
阅读模式
现在市面上的智能电子产品千千万,为了达到人们使用更加方便的目的,很多智能产品都开发了语音识别功能,用来语音唤醒进行交互;另外,各大公司也开发出来了各种智能语音机器人,比如小米公司的“小爱”,百度公司的“小度”,三星公司的“bixby”,苹果的“siri”等等。这些语音识别的功能,提高人们使用电子的产品的体验,但是作为一名测试员,给你一款语音识别产品,要怎么进行测试呢?
接下来,我就以小米手机为例,给大家介绍小米手机语音识别如何测试。
小米语音识别功能如何进行测试?
要知道语音识别功能如何测试,我们先了解智能产品语音交互流程:
所以,要进行测试的话,我们需要从以下几个维度来准备测试点:
01.基础功能测试:
1 声纹的录入:
语音唤醒,为了确保每个人的声音、每个人在不同场景下的声音都能成功语音唤醒,测试一定要有各种不同的声纹来进行测试。
所以,就需要录入各种不同的声纹,来丰富测试场景的覆盖;
2 语音唤醒:
正常唤醒:使用正常的声纹进行语音唤醒,检查可以成功;
异常唤醒:使用异常的声音,比如视频/录音进行唤醒,音乐声进行唤醒,确保不会有误唤醒。
3 唤醒后的功能:
a、语音找设备:可以唤醒设备,比如手机,通过语音找到设备。
b、音量调节:可以通过语音对设备进行音量调节
c、连续对话:唤醒设备后,可以与其进行持续的语音对话,功能正常。
d、指令识别:唤醒后,可以下发指令比如播放音乐,查询天气,拨打电话、定闹钟等,检查指令可以正常被执行。
4 功能冲突交互测试
a、中断测试:语音识别过程中,有中断干扰,比如手机唤醒的时候有电话中断;有闹钟中断、低电量中断等,确保这些中断能被正常处理,不会造成异常;
b、麦克风冲突:如果麦克风被占用了,测试是否能被唤醒;
5 多用户场景
因为用户使用语音识别的场景非常多,测试很难进行完全的覆盖。所以,我们需要通过分析用户的主流使用场景,来覆盖主要的场景。
通过一些数据的采集,发现用户使用的场景屏幕分布如下:
调查结果发现,用户使用语音功能主要覆盖以下场景:
所以测试就主要优先去覆盖这些用户场景,其他的场景用例优先级可以逐步降低,调整测试权重,保证用户主流场景的稳定性和准确性。
02.UI 测试
语音唤醒的有 UI 界面需要进行 UI 测试。
比如手机的语音唤醒功能,需要进行 UI 界面的检查,保持 UI 的友好型和美观性;
03.兼容性测试
1,第三方应用的兼容性测试
如果设备里有安装其他的应用,比如手机里的其他应用,是否可以通过语音识别唤醒后进行指定的动作操作;第三方应用兼容性需要保证;
2,外界设备兼容
a、三段式耳机接入
b、四段式耳机接入
c、type-c 数字耳机接入
d、蓝牙耳机接入
通过接入这些第三方的耳机设备,可以进行语音识别并且功能正常。
04.自动化语音识别测试
以上都是通过手工进行测试的,要进行一个比较完整的语音识别覆盖,至少需要以下配置:
测试人数:
10/20 人(男女各一半)
测试次数:
每个场景 50 次
测试环境:
办公室、会议室
测试场景:
亮屏唤醒、灭屏唤醒、手机播放音乐唤醒、声纹误唤醒、基本语句识别率
但是手工测试是有不可忽视的一些严重缺陷的:
1、测试手法不统一:
不同的距离和不同的角度都会导致识别结果不一样。
2、测试过程中人员声音波动大
同一算法,同一产品,在测试人员不变,场景一致的情况下,多轮测试的数据差异大;
由此可见,手工测试耗时耗力、测试数据参考价值低。所以,语音识别测试也可以进行一些自动化测试。
05.自动化测试的关键点
1 实现半自动化语音测试
因为手工测试就是没有办法提供那么多人进行不同语料的测试,所以需要实现语料自动合成和模拟。可以采用 python+pyaudio 开发 + 音箱模拟人声,来对语音进行识别测试。
而且通过增加语料量级(至少 40 组声纹),降低唤醒/识别频次;增加不同的噪音环境,不同噪音 + 不同距离,模拟用户真实环境。
这样,就可以覆盖更多的不同的语料以及场景,大大提高识别的正确率。
2 语料自动化播放 + 自动化检测
现在有了语料,但是需要手动播放的话,工作量依然很大,所以需要实现语料自动播放和自动化监测。
3 增加噪声播放系统 + 滑轨控制系统
因为用户的使用场景往往有很多的噪音,如果测试不模拟这种噪音环境,是没有办法真正还原用户场景的。所以,需要设置一些噪音源,可以自动化增加噪音,并可以调整距离。
如下图,就是小米公司的专为为测试语言识别造的混响室,以及自动化调节人头系统
本帖子中包含更多资源
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
回复
使用道具
举报
大神点评
3
残楼听雪
2024-1-5 20:01:24
来自手机
显示全部楼层
LZ帖子不给力,勉强给回复下吧
回复
使用道具
举报
飘啊飘
2024-1-6 20:59:25
来自手机
显示全部楼层
我反手就是一个么么哒,不谢
回复
使用道具
举报
3wingsun29
2024-1-7 12:22:09
显示全部楼层
写的不错,配图再多点就好啦
回复
使用道具
举报
发表新帖
回复
高级模式
B
Color
Image
Link
Quote
Code
Smilies
本版积分规则
发表回复
回帖并转播
回帖后跳转到最后一页
CBEC
注册会员
0
关注
0
粉丝
15
帖子
Ta的主页
发布
发消息
加好友
最近发表
无人驾驶的“真相”:不过是辅助驾驶的“高级版”,别被忽悠了!
珠海格力申请分布式智能家居的定时方法专利,解决现有技术中智能
人形机器人“天工”再升级:登百级台阶,雪地高速奔跑
无人驾驶真的靠谱吗?2025年技术突破还是隐患?
最新AI大模型来了!马斯克发布Grok 3聊天机器人
天启坦克?央视首公开99A坦克主动防御!同时拦截火箭弹和无人机
公社版块
版块推荐
更多版块
智能穿戴
智能家居
机器人
无人驾驶
无人机
反馈吐槽
闲聊灌水
大话智能
大数据
图像识别
自然语言
数据挖掘
大话智能
数据挖掘
北大讲座
清华讲座
网贷观察
股市评论
区块链
闲聊灌水
反馈吐槽
站务通知
关注我们