找回密码
 立即注册
搜索

杨敏:深耕自然言语处理架起与机器沟通的桥梁

在CCF-A类学术会议和JCR一区期刊上发表高程度学术论文80余篇,获得中国人工智能学会2018年度最佳青年科技成果奖、2019年度CCF-腾讯犀牛鸟基金优秀专利奖,是中国迷信院青年创新促进会成员……拥有这份亮丽简历的是来自天府之国的“90后”杨敏,抱着对自然言语处理技术的极大热情,她在香港大学攻读计算机迷信专业博士之后,进入中国迷信院深圳先进技术研讨院数字所开启了她的科研之路,目前是副研讨员兼博士生导师。

为什么选择深耕人工智能?杨敏表示兴味与热爱是最大驱动力,“数据发掘研讨令人非常着迷,从大数据中常常能分析出有用和令人兴奋的信息。”同时,杨敏也非常看好人工智能技术的发展前景,她以为随着人类对先进便捷生活的不断追求,人工智能必将在当中扮演重要角色。

让机器听懂人话?从模拟人类行为末尾

近年来,随着智能技术的普及,机器人逐渐在各个范畴代替人工成为客服的主力军。但是,人们在“人机对话”中常常会遇到程序繁琐、答非所问的状况。如何让智能客服更好地了解人类的真实需求?如何更快、更精准地反馈成绩的答案?这些都是自然言语处理技术亟待处理的成绩。

“要让智能问答和人类问答达到相反程度,实践上是非常困难的。”杨敏说,“目前我们还处于弱人工智能时代,需求攻克认知智能,才能让机器真正地了解成绩、停止推理和处理成绩,目前看来还有一定间隔。”

为了让机器读懂人类的言语,杨敏团队尝试根据人类行为设计深度神经网络模型。“比如人类在做一篇文章的阅读了解时,通常会先粗略阅读整个文章的大致内容,第二遍再带着成绩精读寻觅答案,第三遍确保答案正确。” 杨敏团队从人类阅读认知角度出发,模拟人类阅读认知过程中预读、精读、后读三个阶段,提出基于先验知识的交互感知模型、目的感知的语义蒸馏模型、基于强化学习的语义反馈模型等,以更贴近人类阅读认知的方式处理自然言语了解成绩。

光有大数据不够!知识图谱给机器“补课”

当然,人工智能也有“过人之处”,弱小的算力与大量的数据让机器可以疾速获得学习的资源,但只要大数据还远远不能达到人类的程度。

“虽然经过大数据的发掘分析可以得到很多有用的信息,但只要数据驱动是不够的,人类之所以可以疾速做出决策,是由于拥有丰富的阅历常识和背景知识。”杨敏表示,她们团队尝试用数据驱动和知识驱动相结合的方式,经过建立完善的知识图谱,补齐人工智能背景知识的“短板”。

此外,模型紧缩也是杨敏团队主攻的技术方向。当对模型训练的强度越来越大,数据量越来越多,精度越来越高时,耗费也会越来越大。特别是在线上运转时,由于模型过于复杂,反馈结果的工夫会从毫秒级拖延成秒级,导致用户体验效果不佳。

“经过模型紧缩可以在不影响运算精度的状况下,让参数变少,效率提高,节省训练工夫的同时,降低对数据的要求,提升用户体验。”据杨敏引见,团队目前正与腾讯、神州泰岳等企业合作停止模型紧缩的攻关研讨,次要运用于自然言语了解和引荐系统义务。

得理法律平台

在运用落地方面,杨敏团队还与深圳市得文科技有限公司成立了“法律人工智能结合实验室”,将自然言语处理和引荐系统的核心算法运用到司法范畴,开发案件判决预测、类案智能搜索、法律智能问答等系统。

为科技之城贡献力气

在杨敏加入深圳先进院之前,她曾在科技企业有过短暂的工作阅历,她感到科研机构与企业最大的不同之处在于,在科研机构可以无机会深化研讨一些“有难度又有研还价值的课题”,虽然短工夫未必能很快看到结果,但可以投入更多工夫和精神专注攻克,希望能获得打破性的停顿。

不只如此,深圳先进院对于产学研交融的大力支持,也让杨敏感到“可以真正将基础研讨写在祖国大地上”,既能打破技术壁垒,又能疾速找到产业界合作的落脚点,疾速验证本人的算法能否适用。

来深3年,深圳带给川妹子杨敏最大的感受是“科技之城”,“科研技术公司非常多,对于我们寻觅产业合作伙伴和先生寻觅实习工作都非常有利。同时,深圳出台了非常多吸引高端人才的政策,使得深圳汇聚了全世界顶尖的人才,人才又反哺深圳,为深圳的发展作贡献,构成良性循环,对于我们年轻人而言,充满吸引力。”(刁雯蕙)
回复

使用道具 举报

大神点评3

云雀ing 2020-9-23 18:14:02 来自手机 显示全部楼层
话不多说,【抱拳了,老铁】。
回复

使用道具 举报

anne718410 2020-9-24 15:30:29 来自手机 显示全部楼层
支持,赞一个
回复

使用道具 举报

蓝磬香儿 2020-9-25 12:55:08 显示全部楼层
赞赞赞赞赞赞赞赞
回复

使用道具 举报

高级模式
B Color Image Link Quote Code Smilies