智客公社
标题:
大白话讲AI:什么是机器学习?
[打印本页]
作者:
ab0125
时间:
2024-12-18 17:28
标题:
大白话讲AI:什么是机器学习?
现在AI火的一塌糊涂,很多人知道AI是人工智能,却不知道机器学习是啥。
机器学习是人工智能领域的一个重要分支,涉及概率论、统计学等多个学科。机器学习主要的一个作用,就是让计算机能够通过算法,从数据中进行学习,并调整一些参数,然后用来处理相应的预测分类或决策任务。
大白话点说,你可以理解机器学习就是个模拟人脑的过程。
[attach]838329[/attach]
例如一个小朋友想要学习不同的水果都叫什么名字,父母就可以给孩子准备两批不同的水果图片。
第一批水果图片,需要父母一张一张的教给小朋友图片上的水果,都叫什么名字,这个过程就是机器学习中的模型训练阶段,这第一批水果图片,就是训练集。
父母告诉孩子每一张图片上的水果叫什么,这就好比是给图片打标签,专业点说就是给数据做标注,然后让机器学习数据的标注结果,这种训练方式在机器学习里,就叫做有监督学习。
等小朋友把第一批图片学了几遍之后,就可以再找第二批水果图片来让小朋友辨认,第二批图片也被称为验证集。
这个过程在机器学习中被称为“验证阶段”,它帮助评估模型(在这里是孩子的认知能力)对未见过的数据(新的水果图片)的泛化能力。
如果孩子在验证集上的表现令人满意,说明他已经掌握了基本的水果图片识别技能,相当于机器学习模型完成了初步训练。
这个时候就可以用第三批数据集来进行测试,比如让孩子到超市中进行实地辨认,相当于是让孩子投入实战,这第三批数据集,就是测试集,用来检验模型的实际训练成果。
除了有监督学习,还有无监督学习、半监督学习的训练方式,并且都会涉及到一些算法和参数的配置,但总体其实都是对人脑的模拟。
有监督学习是利用有标注的数据进行训练,那么无监督学习自然就是利用无标注的数据进行训练,也就是说数据集中并没有明确的结果标签。
比如,有一组客户的购物数据,包括购买的商品、价格、频率等,但没有预先定义这些数据应该被划分成什么类别,有可能会被分成购买频率高但价格低购买频率低但价格高的,也有可能会被分成生活用品和文具用品等。
无监督学习的这个特征常被用来进行分类预处理,比如在面对一些不能被事先明确分类的图像或购买数据,就可以利用无监督学习的训练方式,将数据进行处理分类。
至于半监督学习,其实并不是一半有标注数据,一半没有标注数据,而是一小部分有标注数据,和一大部分无标注数据。
相较于有监督学习主要依赖有标注数据的训练方式,半监督学习的训练方式更加复杂一些。
比如,在半监督学习训练时,会首先使用有标注数据训练一个初始模型,然后用这个模型对未标注的数据进行预测或分类,将预测结果作为新的有标注数据加入到训练集中,再次训练模型,这个过程可能会反复进行。
这样的训练方式,能够在一定程度上,提升模型的泛化能力,让模型变得更聪明,同时还能缓解有标注数据量不足的问题,比如像医疗研究领域中,获取有标注数据比较困难,或者成本比较高。
“泛化能力”四个字,你就可以简单理解为让模型不仅知道“1+1=2”,也能知道“1+1+1=3”,也就是不那么死板。
除了有监督学习、无监督学习、半监督学习,其实还有强化学习的训练方式,后续会用单独的一篇文章来讲,敬请期待。
作者:
fragrant白玫瑰
时间:
2024-12-18 22:49
1v1飘过
作者:
飘啊飘
时间:
2024-12-19 11:29
顶顶更健康
作者:
狼の呐喊
时间:
2024-12-21 07:02
不聊了,又该去搬砖了。。。
欢迎光临 智客公社 (https://bbs.cnaiplus.com/)
Powered by Discuz! X3.5