KNN 经过查找查询与数据中一切输入之间的间隔来工作。接上去,它选择最接近查询的指定数量的输入,如 K 。然后它投票给最频繁的标签(在分类的状况下)或平均标签(在回归的状况下)。
[attach]294271[/attach]
KNN无监督最近邻示例
[attach]294272[/attach]
KNN最近邻分类示例
[attach]294273[/attach]
KNN最近邻回归示例
kNN 算法:
加载数据将 k 初始化为数据中选定的邻居数对于数据中的每个示例,计算查询示例与来自数据的当前输入之间的间隔将该间隔添加到输入的索引以停止有序集合按间隔按升序对间隔和索引的有序集合停止排序从排序的集合中选择前 K 个条目获取所选 K 项的标签假如是回归,则前往 K 标签的平均值;假如是分类,则前往 K 标签的形式
kNN 在理想世界中的运用:
指纹检测
预测股票市场
货币汇率
银行破产
信誉评级
贷款管理
洗钱分析
从糖尿病人血液的红外吸收光谱中估计糖尿病人血液中的葡萄糖含量。
根据临床和人口统计学变量确定癌症的风险要素.
7.K-均值聚类
K-均值聚类是最简单和最盛行的无监督机器学习算法之一。
我们没有谈到相似的事情吗?
最近邻和 k-均值聚类之间的差异
K-均值算法辨认 k 个质心,然后将每个数据点分配给最近的群集,同时使质心尽能够小。K-均值中的“方法”指的是数据的平均,即找到质心。