找回密码
 立即注册
搜索

想和机器人调侃吗?身边的黑科技,揭秘智能电话语音机器人技术


“喂,家长,您好,我们是XX教育机构,我们有一堂收费儿童编程体验课,请问您有空带孩子来参加下吗?”

“呃,我孩子曾经报名了其他课程了噢!”

“没关系,您可以来试听下我们的课程……”

我想很多冤家们都接到过这种营销电话吧,您有没有想过电话的那头是谁在和您通话呢。看了文章的标题,我想您应该会猜到答案。没错,电话的那头很有能够是智能语音机器人,也可以说就是一台计算机。

“但是不对啊,计算机能和我聊天?我们可是聊的很不错啊,怎样能够是机器人?”

但是理想就是如此,明天就让我们来揭秘一下这身边的黑科技——智能电话语音机器人技术。

语音辨认

想让机器人和您聊天,首先机器人得能听懂您说的话,能把您说的话变成正确的文字才可以,这也就是语音辨认。光这一步,迷信家付出了几十年的努力,阅历了有数次的失败才获得明天的成功。

详细是怎样完成的呢,我先假设您说了一句“我是中国人”,然后我们来按顺序走一遍流程,分析下机器是怎样处理的,以下是处理流程图。
语音辨认流程



1)语音预处理:预处理的第一步需求将您说的话停止数字化处理,由于声响信号本身是一种延续地模拟信号,经过采样编码,就会变成计算机可以处理的数字信号了。数字化当前,计算机会对您说的话“掐头去尾”,由于人说一个句子,总会有停顿,计算机经过算法会自动地截取一个残缺地句子。然后会对这句话停止切片,将语音切成非常小的一段一段,至此,预备工作就做好了。
语音预处理



2)数字化特征提取:在这一步中,预处理输入的信号会和声学模型停止婚配,声学模型是对语音特征的一种数学建模,可以简单了解为一个语音特征对应了一个或一组数字编码。比如“我是中国人”,对应的声学模型是【3,6,19,9,5】,但是我要提示大家一点,到目前为止,这个声响并没有对应到“我是中国人”这几个字,它对应的只是发音而已,没有意义。为了方便了解我暂且以拼音来表示辨认结果:【wo,shi,zhong,guo,ren】。

3)形式婚配:好了,我们离开了最关键的一步,先要把声响翻译成文字,当然一个音能够对应了不止一个文字,这是我们汉语的特点。这时分我们的言语模型库就要上场了,这个模型库是一个基于统计概率学原理来组织的一个数据库。照旧以我们的例子来阐明,假定第一个字以为是“我”,在模型库里我们可以找到在“我“后面是”事“的概率为0.28,”我“后面是”是“的概率为0.78,“我”后面是”时“的概率为0.16,很显然,”是“的概率最大,拿我们就选择概率最大的”我是“来组成词语。后面再按照异样的原理依次类推,最终就得出了”我是中国人“的句子了。当然,为了阐明原理,我只是按最简单的方式举例,实践状况不光是要看两个延续的字或者词的概率,还会看有间隔的字词的组合概率,算法要复杂的多。但大家只需记住一个关键点,那就是计算机选择的是概率大的字词组合来看法句子。特地要说一点,言语模型是哪里来的呢,这是迷信家经过大量的语料库让计算机自行学习统计而构成的。

言语处理

至此,语音机器人曾经将您说的话,正确的翻译成文字了,也就是完成了语音辨认,后面要处理的成绩就是机器人怎样回答您的成绩了。这个成绩相对了解起来要简单一些,对于那些用于营销产品的机器人,事前是会预备一套话术流程的,简单的说,就要先预备好一套问答流程库。一个最基本的流程是这样的:

假如您不说话,机器人会按照它设定的流程来引见产品,假如您打断了他的引见,他立刻回启动语音辨认模块,辨认您说的话,语音变成文字当前,言语会被抽取关键字,并且与问答知识库停止婚配,搜索到结果后,机器人又会以电话语音的方式将答案播报给您,这样就构成了与您的互动聊天啦。

虽然经过了这么多复杂的流程,但是机器人处理起来也就是几秒钟的事情,怎样样,您了解了吗?下次无机会接到机器人电话的话,可以和他调侃两句噢,看看它是不是能聪明地回答您的成绩。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复

使用道具 举报

大神点评3

123788999 2019-8-18 20:29:25 显示全部楼层
这么强,支持楼主,佩服
回复

使用道具 举报

lawjean 2019-8-19 16:03:50 来自手机 显示全部楼层
沙发位出租,有意请联系电话:13888888888
回复

使用道具 举报

笑点来了 2019-8-20 11:21:08 显示全部楼层
沙发???
回复

使用道具 举报

高级模式
B Color Image Link Quote Code Smilies