找回密码
 立即注册
搜索

顶商投资:唠嗑之间 从小爱同窗聊到自然言语处理

家里的小爱同窗说:“陪我聊聊天吧”,于是便末尾了人机智能对话,当然现有的条件仅支持简单对答。此外,面向C端的还有Siri,天猫精灵,或是小度等,而在B端范畴,NLP(Nature Language Processing)作为人工智能的一个分支,曾经被逐渐运用在教育、医疗等范畴。

语音辨认属于NLP范畴内,基础声学和语音辨认处理的是计算机“听得见”的成绩,NLP要处理的是计算机“听的懂”的成绩,语义了解深度学习。

自然言语处理(NLP)是计算机迷信,人工智能和言语学的交叉范畴。目的是让计算机处理或“了解”自然言语,以执行言语翻译和成绩回答等义务。自然言语处理作为人工智能发展最早,且率先商业化的技术,是将来人机交互的趋向,在大多数智能产品中,NLP技术都是不可或缺的。近几年来随着深度学习技术的打破,NLP中的语音辨认才能、浅层次的特征提取,分类等不断成熟,技术才能大幅提升,带动了商业化探求热潮。

NLP技术正在被越来越广泛的行业所需求,包括教育行业、医疗范畴、金融范畴、政务范畴、智能设备范畴等。美国研讨公司Tractica的分析预测以为人工智能技术的发展将带动NLP软件市场在将来十年完成近40倍的增长。从2016年的1.36亿美金增长到2025年的54亿美金,同时将带动硬件及产品服务行业,到2025年,NLP范畴的软硬件及服务总市场规模将达223亿美金。

而我国的NLP增长速度也非常迅速。根据数据显示,国内的智能语音市场规模从2011年的6.3亿元到2016年的59.3亿元,复合增长率约45%。

NLP次要靠机器翻译系统来完成,在传统的机器翻译系统中,我们必须运用平行语料库:一组文本,每个文本都被翻译成一种或多种不同于原文的其他言语。例如,给定源言语f(例如法语)和目的言语e(例如英语),我们需求建立多个统计模型,包括运用贝叶斯规则的概率公式,训练的翻译模型p(f|e)平行语料库和言语模型p(e)在纯英文语料库上训练。这种方法跳过了数百个重要细节,需求大量的手工特征工程,全体而言它是一个非常复杂的系统。

神经机器翻译是经过一个称为递归神经网络(RNN)的大型人工神经网络对整个过程停止建模的方法。RNN是一个有形状的神经网络,它经过工夫衔接过去。神经元的信息不只来自前一层,而且来自更前一层的信息。也是如今较为主流的一种NLP神经网络系统。

RNN的一个大成绩是梯度消逝(或爆炸)成绩,其中取决于所运用的激活函数,随着工夫的推移信息会迅速丢失。粗浅的说,这是一种数据记忆的丢失。因此,RNN在记忆序列中的前几个单词时会表现的很困难,并且只能根据最近的单词停止预测。长期/短期记忆(LSTM)网络试图经过引入门和明白定义的存储器单元来对抗梯度消逝/爆炸成绩。每个神经元都有一个存储单元和三个门:输入、输入和遗忘。这些门的功能是经过中止或允许信息流来保护信息。曾经证明LSTM可以学习复杂的序列,例如像莎士比亚的写作或者创作原始音乐。请留意,这些门中的每一个都对前一个神经元中的一个单元具有权重,因此它们通常需求更多资源才能运转。LSTM目前非常盛行,并且在机器翻译中被广泛运用。

除此以外,还有DNN,CNN等其它的网络系统。近年来,语音辨认获得了很大的打破, IBM、微软、Google、百度等多家机构相继推出了本人的Deep CNN模型,提升了语音辨认的准确率。根据Mary Meeker年度互联网报告,Google以机器学习为背景的语音辨认系统,2017年3月曾经获得英文范畴95%的字准确率,逼近人类语音辨认的准确率;2017年8月,微软的语音对话研讨小组在Switchboard语音辨认义务中,将错误率从去年的5.9%再一次降低到5.1%,达到目前最先进程度。在中文语音辨认率方面,百度、搜狗,科大讯飞等主流平台辨认准确率均在97%以上。此外,NLP对于浅层次的特征提取、分类等成绩曾经比较成熟,而深层次的语义了解正是如今研讨的重要方向。NLP范畴技术的不断打破,为语音技术的落地提供了能够。

语音辨认目前比较成熟的运用在三个方面:教育范畴、医疗范畴和金融范畴。

首先是教育范畴。智能语音在教育范畴的价值,一方面在于提高教师工作效率,另一方面在于协助先生提升学习效果。科大讯飞经过智能语音为一些全国性考试做技术支持,已是国内中英文口语测评方面抢先企业;思必驰、云知声等初创公司也正经过智能语音的人机交互切入教育市场。2C端运用英语流利说,注册用户数已超过4000万人,在言语教育行业高居第一。

医疗范畴的运用目前次要是电子病历录入、电子病历数据挑选、辅助诊断等。电子病历录入是医生在临床诊断时运用专业麦克风,可将诊断信息实时转化成文字,录入医院HIS系统,方便后续查询和问答,提高工作效率,科大讯飞和云知声是该范畴典型代表;由于医疗信息和病人的病史以自在文本格式保存在病历里,NLP可以协助医生从庞大的记录中萃取关键信息,并将文本转化为可运用的知识。2016年百度发布的医疗大脑,具有语音(语音合成、语音辨认)、图像处理、自然言语处理以及用户画像四种才能,可经过海量医疗数据、专业文献的采集与分析停止人工智能化的产品设计,模拟医生问诊流程,与用户多轮交流,根据用户的症状,提出能够出现成绩,反复验证,给出医疗建议。

金融行业很多业务带有客户服务属性,可以充分运用智能语音技术,一些商业银行曾经经过运用语音辨认技术,完成语音导航、语音买卖、业务办理等在线客服及呼叫中心的基础服务。此外,经过NLP技术,分析从个人及企业在其主页、社交媒体等爬取的数据,自动提取特征关键词,再对文本数据停止自动分类,生成结构化的客户大数据信息,可以作为金融机构风险控制、征信的重要根据,目前国内许多互联网公司如宜信、闪银等都曾经采用NLP技术。

语音技术相比较于视觉辨认技术,还处于高速发展阶段,运用的行业和细分范畴也更广泛。在人工智能技术疾速发展的趋向下,语音辨认行业将诞生更多成熟先进的优秀企业,也将引领人工智能将来的发展方向。
回复

使用道具 举报

大神点评3

annana66120 2019-6-1 18:20:37 显示全部楼层
我了个去,顶了
回复

使用道具 举报

从阳台泼下的水 2019-6-2 16:23:06 来自手机 显示全部楼层
没写完吧,等楼主更新哦~
回复

使用道具 举报

刺眼xiaolow 2019-6-3 13:59:55 来自手机 显示全部楼层
我擦!我要沙发!
回复

使用道具 举报

高级模式
B Color Image Link Quote Code Smilies