找回密码
 立即注册
搜索

机器如何学习?一个教师机器人担任数千名先生,测试100万道题


全文共3323字,估计学习时长9分钟




图源:unsplash



我们总能听到机器学习、深度学习、神经网络这样的词,但是你能否清楚这里的“学习”到底意味着什么?它只是销售软件和服务的营销词汇吗?还是说迷信家真的创造了相似人脑的组件并令其在机器外部运转呢?机器会占领世界吗?

别担心,还没到那个时分。本文就将为你祛魅机器学习,迷信家是如何教计算机完成人类的义务,甚至在某些状况下比人类做得还好。笔者将用最直白的话给大家解释这个成绩,努力让任何范畴的人都可以了解。



为什么需求学习?


在学习末尾之前,处理成绩离不开算法的编写。算法只是一组规则,往外面输入后得到的输入即可作为成绩的处理方案。

请思索以下状况:有一个数字列表,要求你按升序排序,有很多算法可以处理此义务。这些算法经过获取列表,执行一些规则和操作,然后返给你排好序的列表。对于计算机迷信家来说,这种成绩“很容易”处理。他们只需求思索并提出一种算法来处理义务。

但同时,有些成绩不是那么容易用算法处理。人们末尾对计算机有了更多的要求,他们希望机用具有处理艰巨义务的超才能,是那种连迷信家都完全不知道如何编程的义务。

例如:如何编写一种算法,以获取动物的图像并输入其类型?对于人类而言,这是一项非常容易的义务,但对于算法来讲就是一件很复杂的事儿了。人类知道如何对动物照片停止分类,但是他们不知道如何描画他们为获得答案所采取的步骤。因此,出现了一个重要的成绩——如何处理连人类都不知道如何描画的成绩?



算法的世界!


互联网中,算法无处不在。你正在阅读本文,是由于有一种算法把这篇文章呈如今了你眼前,能够是由于你点击了什么,然后算法会记录你打开的链接。该算法决议了你搜索查找照片所看到的内容,甚至可以为你制造一个小电影。

股市充满了算法,买卖需求停止。当你购买东西时,该算法确定价格,并且在你的账户监视买卖能否遭到欺诈。

这些小小的算法塑造了你的世界。当它们在过去的天然算法机器人中工作时,人类可以提供“假如这样,那么该那样”方式的解释阐明。但许多成绩太大而又难以简单阐明,例如在一秒钟的十亿次金融买卖中发现欺诈性买卖,算法能想办法发挥作用。



图源:unsplash



想象,一个航空公司如何设定飞机座位的最高价?用户如今要支付的价格由算法机器人确定。虽机器也并不完美,但比人类能做到的要好得多!没有人知道,甚至建造它们或将来将要建造它们的人都不知道他们是如何做到的。




人工算法的失败


图片中是什么?是蜜蜂,还是3?对于人类来说,即便是小孩子也很容易说出答案,但用一种机器人言语(一种逻辑门言语)告诉机器人就不太能够完成了。



不是3





不是蜜蜂



我们只知道那是蜜蜂和3,我们可以用言语来区分它们,但是机器人无法了解言语,而正是大脑中的联络才使我们分清二者。

虽然我们大脑中的单个神经元可以很容易被了解,但是组成大脑的神经元簇却很难被了解。虽然我们无法了解这个全体,但是它起着潜移默化的作用。所以,要想让一个机器人在蜜蜂和数字3之间停止分类,你不需求直接建造这样的机器人,只需求建造一个建造机器人的机器人和一个教授机器人的机器人。这些机器人的大脑非常简单,一个优秀程序员可以轻而易举做出来。

记住,建造机器人是用来建造的,但教师机器人并不用于教学,只用于测试先活力器人。



训练有素的教师机器人



实践上,先活力器人并不擅长测试。后来,建造机器人在恣意机器人的大脑中停止随机衔接,于是教师机器人接收到了一些非常特殊的先活力器人,教师机器人需讨教他们如何区分蜜蜂和数字3。人类首先需求给机器人教师一堆蜜蜂和数字3的照片,并告诉他们这是什么。

先活力器人参加了测试,但他们做得不好。这不是他们的错,他们被建造时就是这样的。他们被重新带回建造机器人那边,那些做得好的会被放在一边,其他的则会被回收应用。

建造机器人照旧不擅长建造机器人,但如今它将那些做得好的机器人留上去,并用新组合的变化停止复制,然后送回学校。新的先活力器人到了之后,教师机器人一次又一次地测试它们,建造机器人一次又一次地建造,平均测试分数一次又一次地提高,先是60%,最后直到99.99%的完美。

以前,人类可以为他们的机器和机器人编写算法,但如今,我们做到了让机器经过义务形式进而创建本人的算法

所以一个测试和试错的方法曾经完成了,这并不是针对一个或两个机器人,而是针对十亿个不同的机器人,有不同的随机衔接,而且测试题又有十亿页长。如前所述,这是针对那些bot言语中存在的成绩,那些我们无法告诉机器人的成绩。



人类无法训练的机器人



教师机器人并不是在监管一个有十几个先生的老校舍,而是一个有几千名先生的有限仓库,考试不是10道题,而是100万道题,他们终究考了多少次?



有限校舍



建造机器人会不断反复构建过程(随机衔接)。后来,留上去的先生只是侥幸而已。但是,经过组合足够多的侥幸机器人,只保留那些有用的,然后随机地组合出新的副本,最终一个先活力器人出现了,它不是靠运气,而且能够几乎不能区分蜜蜂和数字3。这一点被复制,并被运用到一切其他机器人。

渐渐地,平均测试分数上升,下一轮生活所需的分数也越来越高——从50%到60%,70%,80%,90%,95%,等等。

当我们继续这个循环,最终,从有限大的校舍里,一个可以分辨出照片中的一只蜜蜂和数字3的先活力器人会出现,准确率高达99.999%。这个数字意味着在假设的1000000张照片集合中,只要1张照片出错!

但是先活力器人是如何做到这一点的,无论是教师机器人,建造机器人,甚至是人类的监督者都无法了解,先活力器人本身也是如此。在保留了这么多有用的随机变化之后,它的线路和芯片就变得极其复杂。虽然一行代码不难了解,可代码簇就难了。就是由于这样,机器人的代码全体很难被我们了解。





这是可的,但也同时令人懊丧,特别是先活力器人只擅长曾经被教过的成绩。假如照片是倒置的,或者照片不是蜜蜂,比如猫,它就会觉得很困惑。我们的机器人教师不能教一切的东西,一切的人类监工能做的是给它更多的成绩,使测试更长,连最好的机器人会出的错也要训练到。

了解这一点很重要,这也是公司非常喜欢搜集数据的一个缘由——更多的数据等于更多的测试,等于更好的机器人。当你在网站上做“你是人类吗”的测试时,你不只证明了你是人类,而且也在协助建立这个测试,让机器人可以读、数、分辨山峦上的交通灯、马和人。





在互联网上的任何地方,后台都有一些测试来添加用户的互动,或者设定合适的价格来使得收益最大化,或者从你一切的冤家那里“偷钱”。你喜欢冤家分享的文章,这是让机器人根据你的联络人了解你喜欢什么的一种方式。假如它是可测试的,那么它就是可被教的!

至少在一段工夫内,教师和先活力器人将从数据备选库中毕业,正式成为范畴中的算法。我们习气了这样的想法:我们运用的工具,即便本人不懂但总有人懂,但随着机器学习发展,我们越来越处在一个人类运用工具或被工具运用的地位,没有人、甚至它们的创造者也不懂。我们只能希望可以用测试来指点工具,并且用起来随手。

辨认蜜蜂和3只是一个简单的例子。理想世界的一些运用包括:早期发现癌症,我们训练机器人了解各种癌症发展和分类形式,辨别恶性癌症(严重、紧急医疗)或良性(稍不严重、最小的医疗保健);处理航空公司座位价格;提早数月预测风险的龙卷风;还有自动除颤器的运用等等。



自动除颤器



虽然对人类来说一些算法已成黑箱,但也不用担心机器人会占领世界。正如机器学习专家Andrew Ng所说:“担心机器人接管世界就像担心火星上的人口过剩一样。我们还没到那时分呢!”





留言点赞关注

我们一同分享AI学习与发展的干货

如转载,请后台留言,遵守转载规范

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复

使用道具 举报

大神点评3

hometo 2020-9-16 22:48:19 显示全部楼层
……
回复

使用道具 举报

没有去办棕 2020-9-17 21:55:31 来自手机 显示全部楼层
有点兴趣,要有详细介绍就好啦。
回复

使用道具 举报

a胡大雄 2020-9-18 21:05:14 显示全部楼层
OMG!介是啥东东!!!
回复

使用道具 举报

高级模式
B Color Image Link Quote Code Smilies