我们描画了不能用数学标准公理证明或反驳可学习性的简单场景。我们的证明是基于一个理想,即延续统假说既不能被证明,也不能被反驳。他们是怎样表现出来的?研讨人员本·大卫对学习成绩停止了极大的简化。他们称之为估计最大值成绩(EMX),并给出了一个例子:
想象一个被各种各样的用户访问的网站。用X表示该网站一切潜在访问者的集合。该网站的一切者希望在下面发布广告。发布的广告将从给定的广告池中选择。广告池中的每个广告A针对特定的用户群体F(A) ⊆ X。例如,假如A是一个体育广告,则F(A)是体育爱好者的集合。目的是放置一个目的人群访问网站最频繁的广告。应战在于事前不知道哪些访客会来访问这个网站。这个为你的网站找到最佳广告的简单成绩可以被概括为一个触及集合族和概率分布的数学成绩。给定定义域D上的子集集合F,以及在D上的一个概率分布,在F中找到具有最高概率的集合。真正困难的是我们事前不知道概率分布。
所运用的函数是恣意的,与任何可辨认的算法有关。(K.P.哈特,《机器学习与延续体假说》)。哈特指出,本·大卫和他的合著者曾经看法到了这一点。然后他建议让成绩愈加准确:
一种分离“算法”函数的能够方法是要求它们具有良好的描画性属性。假如用“nice”表示“波莱尔可测性”,则希冀的函数不存在。(K.P.哈特,《机器学习与延续体假说》)。波莱尔可测性是函数所具有的一个性质。定义的准确细节在这里并不重要。但是,运用标准的算法方式(例如图灵机),并将算法函数视为根据算法将某些输入映射到某些输入的函数,可以得出这样的结论:算法是波莱尔可测函数。
结果表明波莱尔可测学习函数不存在。这意味着标题《可学习性可以是不可断定的》应该修订为《估计最大值学习是不能够的》。(K.P.哈特,《机器学习与延续体假说》)我们应该如何了解呢?不管估计最大值学习成绩是不是学习成绩不可定性的恰当例子,我的结论是,数学和逻辑的基础有时看起来是多么笼统和模糊,它们是如此基础,以致于它们影响了像机器学习这样最适用的学科。
欢迎光临 智客公社 (http://bbs.cnaiplus.com/) | Powered by Discuz! X3.4 |