找回密码
 立即注册
搜索

潘云鹤:攻克人工智能“视觉知识”五大难题(转载)

潘云鹤:攻克人工智能“视觉知识”五大难题(转载)
作者:韩扬眉 来源:中国迷信报 发布工夫:2021/6/7 11:41:49
http://news.sciencenet.cn/htmlnews/2021/6/459180.shtm


潘云鹤:攻克人工智能“视觉知识”五大难题







近年来,图像辨认程度的疾速提升推进人工智能热潮构成,图像辨认技术的打破不只提高了计算机对人脸、文字、指纹及生物特征、医学图片等辨认的准确率,而且进一步推进了安全监控、智能交通、无人机、智能制造等广泛范畴的发展。但也遇到进一步发展,如可解释、可分析综合、可设计仿真等等应战。

对此,在中国工程院信息与电子工程前沿学术期刊上,中国工程院院士、浙江大学教授潘云鹤提出了“视觉知识”概念,他以为完成视觉知识表达、推理、学习和运用技术将是人工智能 2.0 获得打破的重要关键之处。近日,潘云鹤在接受《中国迷信报》专访时,详细阐述了“视觉知识”发展面临的5个基本成绩。

“认知心思学早已指出,心象是人类知识记忆的重要部分,被用来停止笼统思想。视觉知识就是计算机对心象的模拟。因此,基于视觉的人工智能是人工智能发展绕不开的课题,且具有重要意义。”潘云鹤指出。

潘云鹤以为,视觉知识表达是第一大成绩。与当古人工智能所用的知识表达方式不同,视觉知识概念具有典型与范畴结构、层次结构与动作结构等要素。视觉概念能构成视觉命题,包括场景结构与动态结构;视觉命题能构成视觉叙事,例如无声电影就是视觉叙事的显示方式。

视觉知识不同于言语知识的特征是能表达对象的大小、颜色、纹理、空间外形及关系;能表达对象的动作、速度及工夫关系;能停止对象的时空变换、操作与推理等。理想上,人类记忆中储存的视觉知识远多于言语知识。



视觉辨认是第二个成绩。

“从人工智能早期末尾,形式辨认便是其中一个最重要的研讨范畴,其中图象和视频辨认是发展最快的方向。”潘云鹤表示,近来,深度学习所提供的方法:用大量标识的图像训练出深度神经网络模型用于图象辨认,分明提高了正确率,已获广泛运用。

但与深度神经网络模型方法不尽相反,人类在工作记忆中停止视觉辨认时,不只分析视网膜即时感知后传入短期记忆中的数据,而且激活了长期记忆中过去学到的并记住的相关怀象,即视觉知识。因此,人类在完成视觉辨认义务时往往只需大批数据,而且可解释,也可推理。

潘云鹤说,在视觉辨认中,不但运用数据,而且协同运用视觉知识,构成数据驱动和视觉知识指点的协同计算范式是视觉辨认的重要的研讨方向。

第三、四个成绩分别是视觉笼统思想模拟、视觉知识的学习。

潘云鹤指出,视觉笼统思想模拟在计算机辅助设计和仿真、计算机动画、游戏、儿童教育和数字媒体创意等范畴运用非常广泛,计算机图形学已储备很多基础技术,但有待与人工智能打通。一旦完成,有望打开新一代设计、仿真、教育、创意等软件的发展新空间。

“视觉知识学习则要将目的从三维外形的重建义务提升到视觉知识概念和命题的重建。”潘云鹤指出,这就需求对现有计算机视觉技术做进一步研讨:不只要重建3D 外形,而且要重构 3D 外形的概念结构与层次结构。在此基础上,有望发展出视觉知识的自动学习手腕,“当前的场景图研讨是向视觉知识自动学习行进的一个合适的中间方法,当今特别需求人工智能、计算机图形学和计算机视觉3 个范畴的研讨者们联手研讨。”



多重知识表达是第五大成绩。

潘云鹤以为,人脑中的知识往往是经过多重表达来描画. 因此,人工智能2.0的知识应有多种表达方式,包括知识的言语表达、知识的深度神经网络表达、知识的笼统表达等,多重知识表达将构成跨媒体智能和大数据智能新的技术实际和模型。

“视觉知识和多重知识表达的研讨是发展新的视觉智能的关键,也是促进人工智能 2.0获得重要打破的关键实际与技术。”潘云鹤表示,视觉知识的独特优点是具有笼统的综合生成才能、时空演化才能和笼统显示才能,人工智能与计算机视觉、计算机辅助设计、计算机图形学技术结合,将为人工智能在创造、预测和人机交融等方面的新发展提供重要的新基础新动力。

“视觉知识是一块寒湿而肥沃的人工智能的‘北大荒’,也是一块充满希望、值得多学科合作勇探的‘无人区’。”潘云鹤呼吁道。




本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册