找回密码
 立即注册
搜索

错觉:AI如何经过数据发掘误导我们|周末读书


内容简介

在人工智能异常火热的明天,很多人以为我们生活在一个不可思议的历史时期,人工智能和大数据能够比工业革命更能改变人的终身。但是这种说法不免言过其实。我们过于武断地以为计算机搜索和处理堆积如山的数据时不会出差错,但计算机只是擅长搜集、储存和搜索数据,它们没有常识或智慧,不知道数字和词语的意思,无法评价数据库中内容的相关性和有效性,它们没有区分真数据、假数据和坏数据所需的人类判别力,没有分辨有理有据和虚伪伪造的统计学模型所需的人类智能。

计算机发掘大数据风行一时,但数据发掘是人为而非智能,也是非常艰巨、风险的人工智能方式。数据发掘先是经过大量的数据走势、相关关系来发现让我们内心愉悦的模型,然后创造实际来解释这些模型。作者经过“史密斯测试”和“得州神枪手错误”等实例阐明,假如你发掘和拷问数据的工夫够长、数量够大,你总能得到本人想要的结果,但是这是相关关系却并不是因果关系,只是自我选择偏好,并没有实际基础也没有适用价值。

在人工智能时代,我们对计算机的热爱不应该掩盖我们对其局限性的思索,真正的风险不是计算机比我们更聪明,而是我们以为计算机具有人类的智慧和常识,数据发掘就是“知识发现”,从而信任计算机为我们做出重要决议。更多的计算才能和更多的数据并不意味着更多的智能,我们需求对人类的智慧有更多的决计。

作者简介

加里·史密斯,波莫纳学院经济学教授,曾获弗莱彻·琼斯基金奖。他是耶鲁大学经济学博士,曾在耶鲁大学担任助理教授一职长达7年,两度获得教学奖,撰写(或合著)过80多篇学术论文和12本书,包括《数据迷信的9个圈套》《基本统计、回归和计量经济学》《标准偏向:有缺陷的假设,歪曲的数据,以及其他诈骗统计数据的方法》《简单统计学:如何轻松识破一本正派的胡说八道》《运气爆棚?必然性在我们日常生活中的惊人作用》《货币机器:价值投资出奇简单的力气》。他的研讨曾被彭博网、CNBC、《福布斯》《纽约时报》《华尔街日报》《旧事周刊》和《商业周刊》竞相报道。

目录

第一章 智能还是服从

第二章 盲从

第三章 无语境的符号

第四章 坏数据

第五章 随机性形式

第六章 假如你拷问数据的工夫足够长

第七章 包罗万象的“厨房水槽法”

第八章 新瓶装旧酒

第九章 先吃两片阿司匹林

第十章 完胜股市(上)

第十一章 完胜股市(下)

第十二章 我们都在监视着你

编辑引荐

在人工智能异常火爆的明天,本书另辟蹊径,从反面讨论了AI研讨中存在的一系列成绩。创始性地提出了“得州神枪手错误”和“史密斯测试”等来批判那些先有数据后有实际和模型的迷信研讨方式——数据发掘。如今数据发掘以相关关系取代了因果关系,AI到底是真的有智能还是只在服从?本书为你解答。

精彩书摘

《风险边缘》是一档抢手的电视智力竞赛节目,有多个版本,开播至今已有50多年。该节目的比赛内容为百科知识问答,其巧妙之处在于:参赛者要根据以答案方式提供的各种线索,给出与这个答案相对应的成绩。例如,线索是“美国第16任总统”,正确的成绩就是:“谁是亚伯拉罕·林肯?”每期节目均有三名参赛者,以摁按钮的方式行动抢答(除了最后一轮“终极风险边缘”以外,在其他环节三名参赛者均有30秒工夫书写作答)。

从很多方面来看,这档节目都合适计算机参与,由于计算机能准确无误地存储和检索大量信息。在《风险边缘》青少年组比赛中,一名男孩因将“谁是安尼·弗兰克”误写成“谁是安妮·弗兰克”而痛失冠军。而计算机就不会犯这样的错误。

另外,线索有时粗浅易懂,有时却晦涩难解。例如,线索是“把它打出来,你就输了比赛”,对只是材料库的计算机来说,很难得出以下正确成绩:“什么是(台球)母球?”

还有一个难解的线索是:“翻译时,这支大联盟棒球队的名字会反复一次。”正确成绩为:“什么是洛杉矶天使队?”(What is the Los Angeles angels?)

2005年,15名IBM(国际商用机器公司)的工程师合作设计了一款能与《风险边缘》最佳玩家同台对擂的计算机,取名“沃森”,以纪念IBM的首任CEO(首席执行官)托马斯·J·沃森。沃森在1914年接手IBM时,IBM还只是一家仅有1300名员工、年支出不足500万美元的小公司,到了1956年他逝世的时分,IBM曾经发展成为一家有7.25万名员工、年支出9亿美元的公司。

“沃森”程序存储了相当于2亿页纸的内容,每秒可处理相当于100万本书的信息。除了拥有海量内存和高速处理才能外,“沃森”还能了解自然言语,运用合成语音停止交流。与罗列相关文档或网站的搜索引擎不同,“沃森”可按照程序并根据线索得出详细答案。

“沃森”运用数百个软件程序,先辨认线索中的关键字和词组,再与海量数据库中的关键字和词组相婚配,最后得出合理答案。按照编好的程序,假如线索是某个名字(如亚伯拉罕·林肯),“沃森”就会写出以“谁是……”扫尾的成绩;假如线索为某一事情,它就会写出以“什么是……”扫尾的成绩。单个软件程序与某个答案的分歧性越高,“沃森”就越能确定此为正确答案。

该程序能轻而易举地得出与“美国第16任总统”这么直白的线索对应的成绩,但要处理有多重含义的词语时就有些困难了,比如,线索是“把它打出来,你就输了比赛”之类的成绩。但是,“沃森”不会感到紧张,也绝不会遗忘。

2008年,“沃森”做好了参加《风险边缘》的预备,但还有些成绩需求协商。IBM团队担心该节目的工作人员会运用包含双关语和具有双重含义的线索,给“沃森”下圈套。这一担心也恰恰揭示了人类与计算机的宏大差异。人类可以根据语境了解词义,所以能了解双关语、笑话、谜语和讽刺批判。而目前的计算机,充其量只能检查出数据库中能否含有双关语、笑话、谜语或讽刺批判。

对此,节目工作人员赞同随机抽取以往编写但未运用的线索。而节目工作人员也担心,假如“沃森”一得到答案就可以发出电子信号,会比必须经过摁按钮来答题的参赛者更有优势。对此,IBM团队赞同给“沃森”装根电子手指来摁按钮,但它还是比人类快,这也让“沃森”占据决议性优势。摁按钮快算是聪明的表现吗?假如“沃森”的反应速度降为与人类的分歧,比赛结果又会如何?

接上去,在2011年的人机大战中,“沃森”与《风险边缘》的两名前冠军肯·詹宁斯和布拉德·鲁特展开了两轮比赛。首轮比赛“终极风险边缘”的线索是:它最大的机场以第二次世界大战的英雄命名,它的第二大机场以第二次世界大战的战役命名。

两名前冠军给出的成绩为:“芝加哥是什么?”而“沃森”给出的成绩是:“多伦多是什么?????”显然,“沃森”辨认出了“最大的机场”、“第二次世界大战的英雄”和“第二次世界大战的战役”这些词组,然后在其数据库中查找相反主题,但没能了解线索的第二部分(“它的第二大”)指的是该市的第二大机场。“沃森”给成绩添加了多个问号,由于它计算出的这一答案的正确概率仅为14%。

虽然如此,“沃森”还是以77147美元轻松获胜,詹宁斯和鲁特的赛果分别为24000美元和21600美元。“沃森”夺得了100万美元的冠军奖金(IBM将其捐赠给了慈善机构),詹宁斯和鲁特也各自将奖金的一半捐赠给了慈善机构 。“沃森”在《风险边缘》的取胜是一次价值数百万美元的宣传良机。在获得艳惊四座的成功后,IBM宣称,相比在《风险边缘》中与掌管人亚历克斯·特雷贝克较量,“沃森”的问答技能将运用于更重要的范畴。IBM 不断将“沃森”运用于医疗、银行、技术支持以及其他能应用庞大的数据库来处理详细成绩的范畴。

对许多人来说,“沃森”击败《风险边缘》的两名前冠军无疑证明弱小的“沃森”一无所知!计算机比人类更聪明,我们应该依托它,置信它的决策。也许我们还应该担心,计算机会在不久的将来降服甚至消灭人类。

“沃森”真的比我们聪明吗?它的成功恰恰反映了计算机的优势和弱点。作为才能超强的搜索引擎,“沃森”可以在其庞大的数据库中疾速查找单词和短语(它还有可以疾速点触的电子手指)。我之所以没有运用“解读”这个词,是由于“沃森”并不了解那些单词和短语的含义,比如“第二次世界大战”和“多伦多”,它也不明白语境中的词义,比如“它的第二大”。“沃森”的实力被过分夸张了,正如很多电脑程序一样,它的智能不过是假象罢了。

从很多方面来说,“沃森”的表现就是骗人的把戏,只不过是在范围极小的某些技能上看似具有超人的发挥罢了。想象有一个不懂英语,但有有限工夫翻阅大型文库(藏有2亿页英语单词和短语)找出婚配单词和短语的人。我们会以为这个人聪明吗?计算机仅因能比人类更快地停止搜索婚配,就阐明它聪明绝顶吗?

连IBM“沃森”团队担任人戴夫·费鲁奇也坦承:“我们在开发‘沃森’,设法让其仿造人类认知时,有坐上去好好谈过吗?根本没有。我们不过是想发明一台可以在《风险边缘》中获胜的机器而已。”

计算机不只击败了《风险边缘》中的人类玩家,还击败了国际跳棋、国际象棋和围棋的世界冠军,这滋长了人们以为计算机比最聪明的人类还要聪明的普遍观念。想要玩好这些战略型棋盘游戏,仅靠婚配单词和短语的弱小搜索引擎是远远不够的,还要能分析棋盘格局、制定创意策略、做到未雨绸缪。这难道不是真正的智能吗?

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复

使用道具 举报

大神点评3

广告位,,坐下看看
回复

使用道具 举报

ab23700 2020-3-30 14:22:59 显示全部楼层
珍爱生命,果断回帖。
回复

使用道具 举报

纪秀一 2020-3-31 13:20:03 显示全部楼层
这帖子写的不错
回复

使用道具 举报

高级模式
B Color Image Link Quote Code Smilies