门户
图库
科技
数据
VR
区块链
学院
论坛
百科
导航
登录
注册
帮助
公社首页
中国人工智能社区
公社版块
公社群组
Group
升级会员
用户名
Email
自动登录
找回密码
密码
登录
立即注册
登录后你可以:
登录
首次使用?
点我去注册
搜索
搜索
本版
帖子
公社群组
用户
道具
勋章
任务
设置
我的收藏
退出
首页
›
智能技术
›
图像识别
›
忽悠AI图像识别系统的新方法:随机复制并粘贴 ...
返回列表
忽悠AI图像识别系统的新方法:随机复制并粘贴
[复制链接]
漠然维权
2023-4-14 10:25:40
显示全部楼层
|
阅读模式
雷锋网 AI 科技评论按:本文由「图普科技」编译自AI image recognition systems can be tricked by copying and pasting random objects
你并不总是需要构建复杂的算法来扰乱图像识别系统——你只要在随机位置添加对象就行了。
大多数情况下,可以用对抗模型更改一些像素以扭曲图像,从而使目标识别出现错误。一些例子包括用一张小贴纸让香蕉图像秒变烤面包机,或戴傻眼镜忽悠面部识别系统。乌龟被误认为是一支步枪的经典案例证明了欺骗人工智能是一件多么容易的事情。
然而,约克大学和加拿大多伦多大学的研究人员现已证实,将物体图像复制并粘贴到原图像中,就可以误导神经网络,无需耍任何花招。
目标移植
他们利用 Tensorflow 物体识别 API 中的模型进行了一系列实验。Tensorflow 物体识别 API 是一个由 Google 工程师构建的开源框架,用于执行图像识别任务。该 API 是构建在 TensorFlow 代码之上的另一层,描述了卷积神经网络的架构。
研究人员从某张图像中获取一个对象并将其添加到另一图像的不同位置,然后将这些图片输入到 API 中。arXiv 在发表的论文中将此技术称为「目标移植(object transplanting)」。
在第一个例子中,研究人员在一名男性坐在其起居室的图像中添加了一张大象的图像。该模型在不同目标周边输出了一系列彩色边界框,并计算了不同目标识别结果的可能性。它识别出目标是一名人类和笔记本电脑的可能性为99%,椅子为81%,手提袋为67%,书籍和杯子为50%。
到目前为止该模型的表现还不错。但当将大象的图片添加到同一图像中时,模型识别开始出现混乱。当大象图片被粘贴在红色窗帘上时,模型对于图中椅子的识别突然变得不那么自信了,评级从81%下降到了76%,但它对于桌面上有一个杯子的可能性从50%增加到了54%。
更奇怪的是,当大象图片被直接复制并粘贴在人的头顶上时,它被识别为椅子。当将动物的图片粘贴在场景中的不同位置时,它只在两个地方被正确识别:当它被放置在笔记本电脑和书柜的顶部时。
当大象的图片粘贴在场景中的不同位置时,API难以正常识别。在许多情况下,它完全无法识别。
图片来源:Rosenfeld等。
尽管如此,但该API仍可能正确识别物体,因为很少出现大象与一些客厅中的常见物品混在一起的图像。“神经网络从未见过两个不同类别物体在同一图片中组合,我们不可能指望神经网络能够在测试时成功处理这类图像”该论文写道。
但该测试并不是一个不公平的测试,它凸显了神经网络的脆弱性,他们无法轻松适应不在其训练数据内的新图像。研究人员写道:“我们认为要求不同物体类别在训练集中成对出现是不合理的,无论是在实践还是理论层面。”
人工智能很难识别重复图像
当该研究团队复制图像中已有的目标对象时,API仍然难以识别。
该模型可以毫不费力地从原图片中挑选出在显示器前面的键盘上躺着的猫。然而,当在图片上再添加一张该猫的照片,并重新调整使它看起来像是直接放在第一只猫后面时,猫的脚掌被识别为狗,键盘的一角被识别为一本书。
该团队用不同的图像重复进行了实验,结果牛头成了马,棒球棍成了笔记本电脑,手提包成了杯子 - 你现在明白了吧。
添加图像中已有的相同对象也具有相同的效果。图片来源:Rosenfeld等。
该论文解释说,从不属于真正目标区域内的像素中获取的特征会使图像中的物体变得混乱。“对于目标感兴趣区域ROI内部的像素以及ROI之外的像素,都是如此。”
这是所有图像分类模型都面临的难题。它们都是通过给定区域上一系列像素的特征来识别对象,但这意味着来自其他对象的像素可以与之重叠,从而使它们混淆。
研究人员将此问题称为“局部遮挡”。“局部遮挡被普遍认为是物体检测面临的一大挑战。成功解决局部遮挡问题将是实现泛化的好兆头。”
“这里生成的图像可以看作是对抗样本的一种变体,其中一些小图像带来的干扰(人类难以察觉)会导致神经网络的输出结果出现大幅度变化,”该论文总结道。雷锋网雷锋网
本帖子中包含更多资源
您需要
登录
才可以下载或查看,没有帐号?
立即注册
x
回复
使用道具
举报
大神点评
6
steptg
2023-4-14 10:26:15
显示全部楼层
转发了
回复
使用道具
举报
给我闪
2023-4-14 10:26:54
显示全部楼层
转发了
回复
使用道具
举报
lyz205030
2023-4-14 10:27:04
显示全部楼层
转发了
回复
使用道具
举报
kulelala
2023-4-14 18:04:58
显示全部楼层
锄禾日当午,发帖真辛苦。谁知坛中餐,帖帖皆辛苦!
回复
使用道具
举报
好肚量醉鹅
2023-4-15 09:13:51
显示全部楼层
愣着干嘛,鼓掌啊
回复
使用道具
举报
maxincq
2023-4-15 16:37:26
显示全部楼层
我了个去,顶了
回复
使用道具
举报
发表新帖
回复
高级模式
B
Color
Image
Link
Quote
Code
Smilies
本版积分规则
发表回复
回帖后跳转到最后一页
漠然维权
注册会员
0
关注
0
粉丝
13
帖子
Ta的主页
发布
加好友
最近发表
定档8月16日 | 2024亚洲智能穿戴大会
华为智能眼镜 2评测:可能是上班族最好用的智能穿戴
2023年全球智能可穿戴腕带出货量及竞争格局分析
智能穿戴概念8日主力净流出24.84亿元,光启技术、立讯精密居前
智能穿戴概念11日主力净流入5.62亿元,三六零、兆易创新居前
智能穿戴概念10日主力净流出23.94亿元,立讯精密、中兴通讯居前
公社版块
版块推荐
更多版块
智能穿戴
智能家居
机器人
无人驾驶
无人机
反馈吐槽
闲聊灌水
大话智能
大数据
图像识别
自然语言
数据挖掘
大话智能
数据挖掘
北大讲座
清华讲座
网贷观察
股市评论
区块链
闲聊灌水
反馈吐槽
站务通知
关注我们