Sklearn中隐藏的实用功能有哪些?

2026-04-13 12:420阅读0评论SEO问题
  • 内容介绍
  • 文章标签
  • 相关推荐

本文共计4794个文字,预计阅读时间需要20分钟。

Sklearn中隐藏的实用功能有哪些?

1. `Covariance EllipticEnvelope`:通常,在我们的数据处理中存在异常值是很常见的,并且许多算法都可以处理离群值。而`EllipticalEnvelope`是`Sklearn`中直接内置的一个例子。该算法的优势在于:

1 .covariance.EllipticEnvelope

通常,在我们的所处理的数据分布中有异常值是很常见的,并且许多算法都可以处理离群值,而 EllipticalEnvelope 就是 Sklearn 中直接内置的一个例子。该算法的优势在于,它在检测正态分布(高斯)特征中的异常点时表现得非常好:

import numpy as np from sklearn.covariance import EllipticEnvelope # 创建一个样本正态分布 X = np.random.normal(loc=5, scale=2, size=50).reshape(-1, 1) # 拟合估计量 ee = EllipticEnvelope(random_state=0) _ = ee.fit(X) # 测试 test = np.array([6, 8, 20, 4, 5, 6, 10, 13]).reshape(-1, 1) # Predict返回1作为内嵌值,返回-1作为异常值 >>> ee.predict(test) array([ 1, 1, -1, 1, 1, 1, -1, -1])

为了验证评估结果,我们生成了一个均值为5,标准差为2的正态分布。训练完成后,将一些随机数传递给它的预测方法。该方法返回-1表示测试中的异常值,即20、10、13。

阅读全文

本文共计4794个文字,预计阅读时间需要20分钟。

Sklearn中隐藏的实用功能有哪些?

1. `Covariance EllipticEnvelope`:通常,在我们的数据处理中存在异常值是很常见的,并且许多算法都可以处理离群值。而`EllipticalEnvelope`是`Sklearn`中直接内置的一个例子。该算法的优势在于:

1 .covariance.EllipticEnvelope

通常,在我们的所处理的数据分布中有异常值是很常见的,并且许多算法都可以处理离群值,而 EllipticalEnvelope 就是 Sklearn 中直接内置的一个例子。该算法的优势在于,它在检测正态分布(高斯)特征中的异常点时表现得非常好:

import numpy as np from sklearn.covariance import EllipticEnvelope # 创建一个样本正态分布 X = np.random.normal(loc=5, scale=2, size=50).reshape(-1, 1) # 拟合估计量 ee = EllipticEnvelope(random_state=0) _ = ee.fit(X) # 测试 test = np.array([6, 8, 20, 4, 5, 6, 10, 13]).reshape(-1, 1) # Predict返回1作为内嵌值,返回-1作为异常值 >>> ee.predict(test) array([ 1, 1, -1, 1, 1, 1, -1, -1])

为了验证评估结果,我们生成了一个均值为5,标准差为2的正态分布。训练完成后,将一些随机数传递给它的预测方法。该方法返回-1表示测试中的异常值,即20、10、13。

阅读全文