如何使用Python实现DBSCAN算法？

2026-05-23 14:550阅读0评论SEO资源

内容介绍
文章标签
相关推荐

本文共计1019个文字，预计阅读时间需要5分钟。

接上一篇：探索宇宙的奥秘，人类对星辰大海的向往从未停歇。随着科技的进步，我们有了更多的机会去揭开宇宙的神秘面纱。以下是一些关于宇宙探索的最新进展。

接上一篇：

#### DBSCAN

from sklearn.cluster import DBSCAN
X, y = make_blobs(random_state=0, n_samples=12)

dbscan = DBSCAN()
clusters = dbscan.fit_predict(X)
print("Cluster memberships:\n{}".format(clusters))

# 所有数据点都被分配了标签-1，这代表噪声。这是eps和min_samples默认参数设置的结果，对于小型的玩具数据集并没有调节这些参数
Cluster memberships:
[-1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1]
mglearn.plots.plot_dbscan()

# min_samples和eps取不同值时的簇分类如下所示

# 在这张图中，属于簇的点是实心的，而噪声点则显示为空心的。核心样本显示为较大的标记，
# 而边界点则显示为较小的标记。增大eps（在图中从左到右），更多的点会被包含在一个簇中。
# 这让簇变大，但可能也会导致多个簇合并成一个。
# 增大min_samples（在图中从上到下），核心点会变得更少，更多的点被标记为噪声。

# 参数eps在某种程度上更加重要，因为它决定了点与点之间“接近”的含义。
# 将eps设置得非常小，意味着没有点是核心样本，可能会导致所有点都被标记为噪声。

阅读全文