找回密码
 立即注册
搜索

从“小度”“小爱”到智慧教育,语音识别—智能时代的必争之地

这两年以物联网、人工智能、大数据、云计算等技术为核心的科技春风已经吹遍全球的各个角落,使得教育、医疗、家居、汽车等行业变得异常的生动活泼,也让不少传统行业逐渐变得“洋气”起来。



你一定有所意识,人工智能的应用已经逐渐渗透到生活的方方面面,并开始影响、改变人们的各种习惯。在人工智能覆盖的众多应用里,语音识别无疑是最接地气也是落地最快的,例如,语音助手已经成为了智能手机的标配。

同时在新冠疫情的催化下,让互动和经商方式发生了根本性的变化。诸如社交距离和避免触摸物体表面之类的措施给语音识别带来了新的动力,并推动了无接触控制的发展。



语音技术正逐渐成为主流

语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。与机器进行语音交流,让机器明白你说什么,这是人们长期以来梦寐以求的事情。中国物联网校企联盟形象得把语音识别比作为“机器的听觉系统”。语音识别技术主要包括特征提取技术、模式匹配准则及模型训练技术三个方面。

语音识别技术已经存在很长一段时间了。20世纪50年代初开发的第一套系统只能理解数字,到2017年,这项技术达到了人类水平的准确度。这种先进程度使得语音识别能够在各个行业中扩展,并成为互联设备的标准。

用途范围语音识别在移动终端上的应用最为火热,语音对话机器人、语音助手、互动工具等层出不穷。

目前,国外的应用一直以苹果的siri为龙头。而国内方面,科大讯飞、云知声、盛大、捷通华声、搜狗语音助手、紫冬口译、百度语音等系统都采用了最新的语音识别技术,市面上其他相关的产品也直接或间接嵌入了类似的技术。

新冠病毒流行后,凸显了迫切需要重新考虑用户与控制器进行交互的方式,以支持非接触式系统。除了提高安全性之外,语音优先技术还通过增加交流的便利性来改善客户体验,因为我们说话的速度比打字快得多。通过将口头命令应用于非接触式控制系统,交流变得更加自然和高效。

随着语音识别系统的不断成熟和日趋完善,语音技术有望在未来几年内吸引数十亿的用户。专家预测未来5年内,几乎每个应用程序都会以某种形式集成语音技术。且有机构预测,全球语音识别市场预计到2025年将达到318.2亿美元。
语音识别将成为万亿级的物联网设备的标配

当下的语音识别其实已经达到一个很高的水平,但怎么样才能让未来机器为人服务,能够帮人完成任务这件事情,事实上还有很长的路要走。

现在已经完成从PC互联网到移动互联网的跨越,下一个阶段将是物联网(IoT),而在这个发展过程中,用户数基数是呈倍数增长的,围绕硬件形态以及联网的形态,在上述转变过程中,交互模式也在不断的发生变化。

传统的PC端,无外乎网页的搜索,再到手机端是通过触屏的方式,甚至有一些带语音交互的APP,甚至包括手机自带的一些语音服务,都逐步从实验室走向大众消费者。

拿苹果来说,早在iPhone 4s上就加入了语音工具siri,在此之后,siri在每一代iPhone中都有质的提升。

从最开始命令式的控制,到最后聊天式,再到现在苹果未来大的方向,它真正能够达到一个助理、个人秘书的产品发展方向。

不过,智能手机市场已经遇到了天花板,语音识别公司也必须做出战略上的改变。那么手机之后,还有什么设备会集成语音识别的功能呢?

答案必然是所有物联网设备,小至智能音响,大到汽车、风力发电机,语音识别技术将进入工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域。这些设备的交互方式都会因语音识别在未来得到改变。而这样的改变也是必然趋势,“因为它可能没有屏幕,或者屏幕非常小,这个时候语音的交互显得尤为重要。”

毫无疑问,如果每一台物联网设备都植入语音识别功能,那么以万亿级出货量的物联网市场来算,这将会是一个巨大的市场空间。
·智能家居
智能家居市场发展迅速,前景广阔,根据 IDC 发布的中国智能家居设备跟踪报告,预计 2020 年规模将达到 5819.3 亿元,年均复合增长率超过 27%,单个家庭在智能家居上的平均消费金额也在不断增加。预测在 2022 年,这个数字将上升到 122美元,年均复合增长率达到 28%。

在智能家居市场中,网络摄像机、智能插座、Wi-Fi 智能灯等应用的市场规模较大,是目前的主流智能家居产品,而在其中嵌入语音控制系统会将智能家居自动化提升到了一个新的水平。
·医疗保健

在医疗环境中,物联网语音控制有助于改善患者体验并提供个性化护理。智能语音助理可以实时更新患者病历,提供有关药物和治疗程序的信息等等。
·语音支付

语音技术已作为一种强大的工具而受到金融业的关注,该工具可以改善客户服务、个性化金融体验并获得竞争优势。随着人们对这项技术的更多信任,语音支付也开始兴起。

银行中语音技术的另一个潜在用途是每天被人们使用的ATM。语音识别可以作为一种替代方式来认证用户和执行交易,而不需要基于触摸的交互——在疫情大流行后的世界,这可能会成为新的标准。
·数字化工作场所
家庭并不是语音激活设备发挥作用的唯一地方,语音技术也在改变工作场所。Gartner预测,到2023年,25%的员工与应用程序的交互将通过语音进行。

如今,支持语音的虚拟助理通过执行琐碎且耗时的任务(例如安排会议和面试、设置提醒等)来帮助员工提高效率和生产力,具有语音到文本功能的语音界面可以为会议、讲座和电话会议做笔记,生成亮点并与参与者共享,以简化协作。



小结
如果说视觉是人获取信息的主要渠道,那么语音则是人输出信息的主要渠道,在新时代,要实现更好的人工智能体验,“视觉+语音+语义”的复合型AI技术将缺一不可,尤其在人机交互场景中,相信随着智能语音技术步入黄金期,未来成熟化的语音产品将通过云平台和智能硬件平台快速实现商业化部署。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复

使用道具 举报

大神点评2

cyokkk 2022-7-3 07:00:32 显示全部楼层
楼下的接上
回复

使用道具 举报

巫山夜话 2022-7-5 17:15:23 显示全部楼层
我擦!我要沙发!
回复

使用道具 举报

高级模式
B Color Image Link Quote Code Smilies