如何区分pandas.cut和pandas.qcut的适用场景及操作技巧?
- 内容介绍
- 相关推荐
本文共计2704个文字,预计阅读时间需要11分钟。
Pandas的`cut`函数用于将连续值分割成多个区间。用法如下:
pythonpandas.cut(x, bins, right=True, labels=None, retbins=False, precision=3, include_lowest=False)
参数说明:
1.`x`:必须是一维的`array`对象,用于待切分的值。
2.`bins`:整数、序列或索引器。用于指定切分的区间。
例如:
- `bins`可以是整数,表示等宽区间数。- `bins`可以是序列,表示区间端点。- `bins`也可以是索引器,例如`pd.cut(x, bins=[-float('inf'), 0, float('inf')])`,用于定义区间边界。pandas.cut:
pandas.cut(x, bins, right=True, labels=None, retbins=False, precision=3, include_lowest=False)
参数:
1. x,类array对象,且必须为一维,待切割的原形式
2. bins, 整数、序列尺度、或间隔索引。如果bins是一个整数,它定义了x宽度范围内的等宽面元数量,但是在这种情况下,x的范围在每个边上被延长1%,以保证包括x的最小值或最大值。如果bin是序列,它定义了允许非均匀bin宽度的bin边缘。在这种情况下没有x的范围的扩展。
3. right,布尔值。是否是左开右闭区间
4. labels,用作结果箱的标签。必须与结果箱相同长度。
本文共计2704个文字,预计阅读时间需要11分钟。
Pandas的`cut`函数用于将连续值分割成多个区间。用法如下:
pythonpandas.cut(x, bins, right=True, labels=None, retbins=False, precision=3, include_lowest=False)
参数说明:
1.`x`:必须是一维的`array`对象,用于待切分的值。
2.`bins`:整数、序列或索引器。用于指定切分的区间。
例如:
- `bins`可以是整数,表示等宽区间数。- `bins`可以是序列,表示区间端点。- `bins`也可以是索引器,例如`pd.cut(x, bins=[-float('inf'), 0, float('inf')])`,用于定义区间边界。pandas.cut:
pandas.cut(x, bins, right=True, labels=None, retbins=False, precision=3, include_lowest=False)
参数:
1. x,类array对象,且必须为一维,待切割的原形式
2. bins, 整数、序列尺度、或间隔索引。如果bins是一个整数,它定义了x宽度范围内的等宽面元数量,但是在这种情况下,x的范围在每个边上被延长1%,以保证包括x的最小值或最大值。如果bin是序列,它定义了允许非均匀bin宽度的bin边缘。在这种情况下没有x的范围的扩展。
3. right,布尔值。是否是左开右闭区间
4. labels,用作结果箱的标签。必须与结果箱相同长度。

