门户
图库
科技
数据
VR
区块链
学院
论坛
百科
导航
登录
注册
帮助
公社首页
中国人工智能社区
公社版块
公社群组
Group
升级会员
用户名
Email
自动登录
找回密码
密码
登录
立即注册
登录后你可以:
登录
首次使用?
点我去注册
搜索
搜索
本版
帖子
公社群组
用户
道具
勋章
任务
设置
我的收藏
退出
首页
›
智能技术
›
图像识别
›
谷歌 AI 新方法:可提升 10 倍图像辨认效率,关键还简单 ...
返回列表
谷歌 AI 新方法:可提升 10 倍图像辨认效率,关键还简单易用
[复制链接]
sheep之淼
2019-6-4 10:46:18
显示全部楼层
|
阅读模式
在开发以卷积神经网络(CNN)为核心的机器学习模型时,我们通常会先运用固定的资源成本,构建最后的模型,然后添加更多资源(层数)扩展模型,从而获得更高的准确率。
著名的 CNN 模型 ResNet(深度残差网络),就可以用添加层数的方法从ResNet-18 扩展到 ResNet-200。谷歌的 GPipe 模型也经过将基线 CNN 扩展 4 倍,在 ImageNet 数据库上达到 84.3% 的准确率,力压一切模型。
普通来说,模型的扩展和减少都是恣意添加 CNN 的深度或宽度,抑或是运用分辨率更大的图像停止训练和评价。虽然这些传统方法提高准确率的效果不错,但大多需求繁琐的手动调整,还能够无法达到最佳功能。
因此,谷歌AI团队最近提出了新的模型缩放方法“复合缩放(Compound Scaling)”和配套的 EfficientNet 模型。他们运用复合系数和 AutoML 从多个维度平衡缩放 CNN,综合思索深度和宽度等参数,而不是只单纯地思索一个,使得模型的准确率和效率大幅提升,图像辨认的效率甚至可以大幅提升 10 倍。
这项新方法的根本优势在于实际起来非常简单,背后的原理很好了解,甚至让人怀疑为什么没有被更早发现。该研讨成果以论文的方式被 ICML 2019(国际机器学习大会)接收,名为 EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks。EfficientNet 模型的相关代码和 TPU 训练数据也曾经在 GitHub 上开源。
寻觅复合系数
为了弄清楚神经网络缩放之后的效果,谷歌团队系统地研讨了改变不同维度对模型的影响,维度参数包括网络深度、宽度和图像分辨率。
首先他们停止了栅格搜索(Grid Search)。这是一种穷举搜索方法,可以在固定资源的限定下,列出一切参数之间的关系,显示出改变某一种维度时,基线网络模型会遭到什么样的影响。换句话说,假如只改变了宽度、深度或分辨率,模型的表现会发生什么变化。
图 | 以基线网络为基础,列出一切维度变化对模型的影响(来源:谷歌 AI)
综合思索所无状况之后,他们确定了每个维度最合适的调整系数,然后将它们一同运用到基线网络中,对每个维度都停止适当的缩放,并且确保其符合目的模型的大小和计算预算。
简单来说,就是分别找到宽度、深度和分辨率的最佳系数,然后将它们组合起来一同放入本来的网络模型中,对每一个维度都有所调整。从全体的角度缩放模型。
与传统方法相比,这种复合缩放法可以持续提高模型的准确性和效率。在现有模型 MobileNet 和 ResNet 上的测试结果显示,它分别提高了 1.4% 和 0.7% 的准确率。
高效的网络架构和功能
缩放模型的有效性也依赖于基线网络(架构)本身。
由于,为了进一步提高功能,谷歌 AI 团队还运用了 AutoML MNAS 框架停止神经架构搜索,优化准确性和效率。AutoML 是一种可以自动设计神经网络的技术,由谷歌团队在 2017 年提出,而且经过了多次优化更新。运用这种技术可以更简便地创造神经网络。
由此产生的架构运用了移动倒置瓶颈卷积(MBConv),相似于 MobileNetV2 和 MnasNet 模型,但由于计算力(FLOPS)预算添加,MBConv 模型体积略大。随后他们多次缩放了基线网络,组成了一系列模型,统称为 EfficientNets。
图 | EfficientNet-B0 基线网络架构(来源:谷歌 AI)
为了测试其功能,研讨人员与 ImageNet 上的其他现有 CNN 停止了比较。结果显示,EfficientNet 在大多数状况下表现亮眼,比现有 CNN 的准确率和效率都高,还将参数大小和计算力降低了一个数量级。
比如 EfficientNet-B7 在 ImageNet 上达到的 Top-1 最高准确率是 84.4%,Top-5 准确率是 97.1%。在 CPU 推理上,它的体积比最好的 CNN 模型 GPipe 小 8.4 倍,但速度快了 6.1 倍。与广泛运用的 ResNet-50 相比,EfficientNet-B4 运用了相似的计算力,但 Top-1 准确率从 76.3% 提升到了 82.6%。
图 | 参数运用量和 ImageNet Top-1 准确率对比(来源:谷歌 AI)
此外,EfficientNets 不只在 ImageNet 上表现出众,其才能还可以转移到其它数据集上。
他们在 8 个盛行的迁移学习数据集上测试了 EfficientNets。结果显示,它在其中的 5 个下面都拿到了顶尖成绩,例如在 CIFAR-100 上获得了 91.7% 的成绩,在 Flowers 上获得了 98.8% 的成绩,而且参数至少减少了一个数量级,甚至还可以最多减少 21 倍,阐明 EfficientNets 具有很强的迁移才能。
谷歌 AI 团队以为,EfficientNets 有望仰仗简单易操作的特点,成为将来计算机视觉义务的新基石。
本帖子中包含更多资源
您需要
登录
才可以下载或查看,没有帐号?
立即注册
x
回复
使用道具
举报
大神点评
4
wf7312
2019-6-4 10:55:04
显示全部楼层
幼儿园小冤家玩拼图的思想方法
回复
使用道具
举报
lianhean
2019-6-4 11:01:05
显示全部楼层
分享了
回复
使用道具
举报
ylx0402
2019-6-5 15:26:19
显示全部楼层
好,很好,非常好!
回复
使用道具
举报
za62
2019-6-6 20:14:07
来自手机
显示全部楼层
LZ帖子不给力,勉强给回复下吧
回复
使用道具
举报
发表新帖
回复
高级模式
B
Color
Image
Link
Quote
Code
Smilies
本版积分规则
发表回复
回帖后跳转到最后一页
sheep之淼
中级会员
0
关注
0
粉丝
87
帖子
Ta的主页
发布
加好友
最近发表
2023年全球智能可穿戴腕带出货量及竞争格局分析
智能穿戴概念8日主力净流出24.84亿元,光启技术、立讯精密居前
智能穿戴概念11日主力净流入5.62亿元,三六零、兆易创新居前
智能穿戴概念10日主力净流出23.94亿元,立讯精密、中兴通讯居前
智能穿戴概念9日主力净流入6998.51万元,水晶光电、九安医疗居前
云天励飞豪掷1.8亿收购智能穿戴IDH方案商,引领行业新潮流
公社版块
版块推荐
更多版块
智能穿戴
智能家居
机器人
无人驾驶
无人机
反馈吐槽
闲聊灌水
大话智能
大数据
图像识别
自然语言
数据挖掘
大话智能
数据挖掘
北大讲座
清华讲座
网贷观察
股市评论
区块链
闲聊灌水
反馈吐槽
站务通知
关注我们