找回密码
 立即注册
搜索

如何正确设置图像辨认义务?



你比图像辨认小吗?这些是您或您的开发人员运用小数据集构建图像辨认处理方案的最佳技巧和技巧。

机器学习还很年轻,但它每天都变得非常有用。Apple Vision SDK、谷歌Tensorflow或Vize图像分类器,便于定制辨认模型的训练。这篇文章是为那些正在构建图像分类器的人们提供的,协助他们定义义务,以最大限制地应用当今的技术。

基本规则

    二元分类-获得50-100 img/标签多达20个难以辨认的标签时,100个img/标签多达100个标签的定义良好的标签时,100 - 200 img/标签形式辨认-结构,x射线图像, 50-100 img/标签。笼统标签多达20个类别,~100 img/标签。

什么不起作用

多个标签具有小的数据集-超过20个标签需求每个标签至少100+图像来完成牢靠的结果。

结果的牢靠性

每个客户都在寻觅与准确性相等的牢靠性。假如你的目的是达到较高的准确度,请保持简单。技术照旧是相当愚笨的。在这个时辰,构建一个具有有限数量的训练图像的图像分类器需求一个迭代的方法。我建议遵照以下规则。
    把你的义务分解成简单的决议(是或否)使类别变小并以某种逻辑方式衔接它们运用普通类别的通用模型。每个标签都应该有相似数量的图像总是搜集图像来扩展数据集合并非常严密的类运用UI/人工反馈来改进数据维护数据集的质量

测试和消费差异

我们允许Vize.ai的用户训练每个标签至少20张图像的义务。经过将数据划分为训练和测试集,Vize运用训练集来学习分类器的最佳参数。我们在训练时期以几种方式对这些图像停止预测,以经过自动化扩展图像集。测试集用于计算分类器的准确性 - 您可以在义务屏幕上的Vize运用程序中看到的准确度。

请记住,每个标签20张图像是所需图像的基本要求,通常效果很差且精度较低。20张图片能够足以停止测试,但不合适消费。对于小型数据集,大多数状况下Vize的准确度能够非常高,容易超过80%。但是,在机器学习中常见的是,为了在消费中获得更波动和牢靠的结果,您应该运用更多图像。有些义务需求每个标签数百甚至数千个图像才能获得良好的消费模型功能。

最佳实际

末尾用更少的类别

我建议人们从大约50种鞋子类型末尾开发一款辨认鞋子的运用程序。这很容易训练每只鞋的100个图像。让用户在用户界面中添加和上传新鞋。同时,让他们给你的分类反馈。这样你就可以在一个月内得到一个惊人的真实图像数据集,然后更新你的运用程序。

运用类别较少的义务

用小型训练数据集为飞机类型构建一个分类器,将图像分成“空中”和“地面”图像。建立两种不同的空中和地面模型,以获得更好的全体效果。你甚至可以将相似的飞机合并到一个类中并训练另一个辨认器来对它们停止分类。一旦你有了更多的图片,你就可以合并这些类别。

对重要类运用二元分类

在电子商务中创建图片标题?为每个标记构建自定义义务。一个模型将对“圆形”“非圆形”等停止分类。这样你就可以为每个标签获得非常牢靠的公用分类器。

不要混合输入图像

假如训练和评价图像的分布是相反的,机器学习就会表现得更好。这意味着你需求有和你将要评价的图片一样的训练图片。你可以在一末尾就运用互联网图片来破解这个成绩,但是你应该尽快末尾搜集用户图片。这些标尺将使您的模型在将来愈加健壮。

总结

构建图像分类器不只是一项很好的深度学习义务,而且是一项很好的义务定义和良好的数据集。假如数据集的大小是有应战性的,那么从简单末尾,向目的迭代。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复

使用道具 举报

大神点评2

hhh336688 2018-12-16 18:27:19 显示全部楼层
路过
回复

使用道具 举报

DT170 2018-12-17 07:26:02 显示全部楼层
无论是不是沙发都得回复下
回复

使用道具 举报

高级模式
B Color Image Link Quote Code Smilies