Java如何实现等频分箱算法?
- 内容介绍
- 文章标签
- 相关推荐
本文共计1160个文字,预计阅读时间需要5分钟。
目录等频离散法Python 实现方式Java 实现方式测试结果对比总结等频离散法根据数据数据的频率分布进行排序,然后按照频率进行离散。好处是数据变为均匀分布,但会更改原有的数据。
目录- 等频离散法
- Python 实现方式
- Java 实现方式
- 测试结果对比
- 总结
根据数据的频率分布进行排序,然后按照频率进行离散,好处是数据变为均匀分布,但是会更改原有的数据结构。区间的边界值要经过选择,使得每个区间包含大致相等的实例数量。比如说 N=10 , 每个区间应该包含大约 10% 的实例。
Python 实现方式等频法是将相同数量的记录放在每个区间,保证每个区间的数量基本一致。即将属性值分为具有相同宽度的区间,区间的个数 boxSize 根据实际情况来决定。比如有 60 个样本,我们要将其分为boxSize=10 部分,则每部分的长度为 6 个样本。
本文共计1160个文字,预计阅读时间需要5分钟。
目录等频离散法Python 实现方式Java 实现方式测试结果对比总结等频离散法根据数据数据的频率分布进行排序,然后按照频率进行离散。好处是数据变为均匀分布,但会更改原有的数据。
目录- 等频离散法
- Python 实现方式
- Java 实现方式
- 测试结果对比
- 总结
根据数据的频率分布进行排序,然后按照频率进行离散,好处是数据变为均匀分布,但是会更改原有的数据结构。区间的边界值要经过选择,使得每个区间包含大致相等的实例数量。比如说 N=10 , 每个区间应该包含大约 10% 的实例。
Python 实现方式等频法是将相同数量的记录放在每个区间,保证每个区间的数量基本一致。即将属性值分为具有相同宽度的区间,区间的个数 boxSize 根据实际情况来决定。比如有 60 个样本,我们要将其分为boxSize=10 部分,则每部分的长度为 6 个样本。

