什么是K-近邻算法等机器学习分类算法及其交叉验证和朴素贝叶斯应用？

2026-05-19 19:020阅读0评论SEO资源

本文共计2672个文字，预计阅读时间需要11分钟。

1. K-近邻算法（KNN）

1.1 定义（KNN，K-Nearest Neighbor）

如果一个新的样本在特征空间中与+k个最近的样本中大多数属于某一类别，则该样本也属于该类别。

1.2 距离

1、K-近邻算法(KNN) 1.1 定义

（KNN，K-NearestNeighbor）

如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别，则该样本也属于这个类别。

1.2 距离公式

两个样本的距离可以通过如下公式计算，又叫欧式距离。

简单理解这个算法：

这个算法是用来给特征值分类的，是属于有监督学习的领域，根据不断计算特征值和有目标值的特征值的距离来判断某个样本是否属于某个目标值。

可以理解为根据你的邻居来判断你属于哪个类别。

1.3 API

sklearn.neighbors.KNeighborsClassifier(n_neighbors=5,algorithm='auto')
- n_neighbors：int,可选（默认= 5），k_neighbors查询默认使用的邻居数
- algorithm：{‘auto’，‘ball_tree’，‘kd_tree’，‘brute’}，可选用于计算最近邻居的算法：‘ball_tree’将会使用 BallTree，‘kd_tree’将使用 KDTree。‘auto’将尝试根据传递给fit方法的值来决定最合适的算法。