机器如何学习？一个教师机器人担任数千名先生，测试100万道题

a182178653 · 2020-9-16 16:45:07

全文共3323字，估计学习时长9分钟

图源：unsplash

我们总能听到机器学习、深度学习、神经网络这样的词，但是你能否清楚这里的“学习”到底意味着什么？它只是销售软件和服务的营销词汇吗？还是说迷信家真的创造了相似人脑的组件并令其在机器外部运转呢？机器会占领世界吗？

别担心，还没到那个时分。本文就将为你祛魅机器学习，迷信家是如何教计算机完成人类的义务，甚至在某些状况下比人类做得还好。笔者将用最直白的话给大家解释这个成绩，努力让任何范畴的人都可以了解。

为什么需求学习？

在学习末尾之前，处理成绩离不开算法的编写。算法只是一组规则，往外面输入后得到的输入即可作为成绩的处理方案。

请思索以下状况：有一个数字列表，要求你按升序排序，有很多算法可以处理此义务。这些算法经过获取列表，执行一些规则和操作，然后返给你排好序的列表。对于计算机迷信家来说，这种成绩“很容易”处理。他们只需求思索并提出一种算法来处理义务。

但同时，有些成绩不是那么容易用算法处理。人们末尾对计算机有了更多的要求，他们希望机用具有处理艰巨义务的超才能，是那种连迷信家都完全不知道如何编程的义务。

例如：如何编写一种算法，以获取动物的图像并输入其类型？对于人类而言，这是一项非常容易的义务，但对于算法来讲就是一件很复杂的事儿了。人类知道如何对动物照片停止分类，但是他们不知道如何描画他们为获得答案所采取的步骤。因此，出现了一个重要的成绩——如何处理连人类都不知道如何描画的成绩？

算法的世界！

互联网中，算法无处不在。你正在阅读本文，是由于有一种算法把这篇文章呈如今了你眼前，能够是由于你点击了什么，然后算法会记录你打开的链接。该算法决议了你搜索查找照片所看到的内容，甚至可以为你制造一个小电影。

股市充满了算法，买卖需求停止。当你购买东西时，该算法确定价格，并且在你的账户监视买卖能否遭到欺诈。

这些小小的算法塑造了你的世界。当它们在过去的天然算法机器人中工作时，人类可以提供“假如这样，那么该那样”方式的解释阐明。但许多成绩太大而又难以简单阐明，例如在一秒钟的十亿次金融买卖中发现欺诈性买卖，算法能想办法发挥作用。

图源：unsplash

想象，一个航空公司如何设定飞机座位的最高价？用户如今要支付的价格由算法机器人确定。虽机器也并不完美，但比人类能做到的要好得多！没有人知道，甚至建造它们或将来将要建造它们的人都不知道他们是如何做到的。

人工算法的失败

图片中是什么？是蜜蜂，还是3？对于人类来说，即便是小孩子也很容易说出答案，但用一种机器人言语（一种逻辑门言语）告诉机器人就不太能够完成了。

不是3

不是蜜蜂

我们只知道那是蜜蜂和3，我们可以用言语来区分它们，但是机器人无法了解言语，而正是大脑中的联络才使我们分清二者。

虽然我们大脑中的单个神经元可以很容易被了解，但是组成大脑的神经元簇却很难被了解。虽然我们无法了解这个全体，但是它起着潜移默化的作用。所以，要想让一个机器人在蜜蜂和数字3之间停止分类，你不需求直接建造这样的机器人，只需求建造一个建造机器人的机器人和一个教授机器人的机器人。这些机器人的大脑非常简单，一个优秀程序员可以轻而易举做出来。

记住，建造机器人是用来建造的，但教师机器人并不用于教学，只用于测试先活力器人。

训练有素的教师机器人

实践上，先活力器人并不擅长测试。后来，建造机器人在恣意机器人的大脑中停止随机衔接，于是教师机器人接收到了一些非常特殊的先活力器人，教师机器人需讨教他们如何区分蜜蜂和数字3。人类首先需求给机器人教师一堆蜜蜂和数字3的照片，并告诉他们这是什么。

先活力器人参加了测试，但他们做得不好。这不是他们的错，他们被建造时就是这样的。他们被重新带回建造机器人那边，那些做得好的会被放在一边，其他的则会被回收应用。

建造机器人照旧不擅长建造机器人，但如今它将那些做得好的机器人留上去，并用新组合的变化停止复制，然后送回学校。新的先活力器人到了之后，教师机器人一次又一次地测试它们，建造机器人一次又一次地建造，平均测试分数一次又一次地提高，先是60%，最后直到99.99%的完美。

以前，人类可以为他们的机器和机器人编写算法，但如今，我们做到了让机器经过义务形式进而创建本人的算法

所以一个测试和试错的方法曾经完成了，这并不是针对一个或两个机器人，而是针对十亿个不同的机器人，有不同的随机衔接，而且测试题又有十亿页长。如前所述，这是针对那些bot言语中存在的成绩，那些我们无法告诉机器人的成绩。

人类无法训练的机器人

教师机器人并不是在监管一个有十几个先生的老校舍，而是一个有几千名先生的有限仓库，考试不是10道题，而是100万道题，他们终究考了多少次？

有限校舍

建造机器人会不断反复构建过程（随机衔接）。后来，留上去的先生只是侥幸而已。但是，经过组合足够多的侥幸机器人，只保留那些有用的，然后随机地组合出新的副本，最终一个先活力器人出现了，它不是靠运气，而且能够几乎不能区分蜜蜂和数字3。这一点被复制，并被运用到一切其他机器人。

渐渐地，平均测试分数上升，下一轮生活所需的分数也越来越高——从50%到60%，70%，80%，90%，95%，等等。

当我们继续这个循环，最终，从有限大的校舍里，一个可以分辨出照片中的一只蜜蜂和数字3的先活力器人会出现，准确率高达99.999%。这个数字意味着在假设的1000000张照片集合中，只要1张照片出错！

但是先活力器人是如何做到这一点的，无论是教师机器人，建造机器人，甚至是人类的监督者都无法了解，先活力器人本身也是如此。在保留了这么多有用的随机变化之后，它的线路和芯片就变得极其复杂。虽然一行代码不难了解，可代码簇就难了。就是由于这样，机器人的代码全体很难被我们了解。

这是可的，但也同时令人懊丧，特别是先活力器人只擅长曾经被教过的成绩。假如照片是倒置的，或者照片不是蜜蜂，比如猫，它就会觉得很困惑。我们的机器人教师不能教一切的东西，一切的人类监工能做的是给它更多的成绩，使测试更长，连最好的机器人会出的错也要训练到。

了解这一点很重要，这也是公司非常喜欢搜集数据的一个缘由——更多的数据等于更多的测试，等于更好的机器人。当你在网站上做“你是人类吗”的测试时，你不只证明了你是人类，而且也在协助建立这个测试，让机器人可以读、数、分辨山峦上的交通灯、马和人。

在互联网上的任何地方，后台都有一些测试来添加用户的互动，或者设定合适的价格来使得收益最大化，或者从你一切的冤家那里“偷钱”。你喜欢冤家分享的文章，这是让机器人根据你的联络人了解你喜欢什么的一种方式。假如它是可测试的，那么它就是可被教的!

至少在一段工夫内，教师和先活力器人将从数据备选库中毕业，正式成为范畴中的算法。我们习气了这样的想法：我们运用的工具，即便本人不懂但总有人懂，但随着机器学习发展，我们越来越处在一个人类运用工具或被工具运用的地位，没有人、甚至它们的创造者也不懂。我们只能希望可以用测试来指点工具，并且用起来随手。

辨认蜜蜂和3只是一个简单的例子。理想世界的一些运用包括：早期发现癌症，我们训练机器人了解各种癌症发展和分类形式，辨别恶性癌症（严重、紧急医疗)或良性(稍不严重、最小的医疗保健)；处理航空公司座位价格；提早数月预测风险的龙卷风；还有自动除颤器的运用等等。

自动除颤器

虽然对人类来说一些算法已成黑箱，但也不用担心机器人会占领世界。正如机器学习专家Andrew Ng所说：“担心机器人接管世界就像担心火星上的人口过剩一样。我们还没到那时分呢！”

留言点赞关注

我们一同分享AI学习与发展的干货

如转载，请后台留言，遵守转载规范

hometo · 2020-9-16 22:48:19

……

没有去办棕 · 2020-9-17 21:55:31

有点兴趣，要有详细介绍就好啦。

a胡大雄 · 2020-9-18 21:05:14

OMG！介是啥东东！！！

		自动登录	找回密码
密码			立即注册

机器如何学习？一个教师机器人担任数千名先生，测试100万道题

本帖子中包含更多资源

大神点评3

最近发表

公社版块

关注我们