如何使用pandas进行复杂的数据处理并实现高效率的绘图展示?
- 内容介绍
- 文章标签
- 相关推荐
本文共计671个文字,预计阅读时间需要3分钟。
Pandas是Python中常用的数据处理工具,使用起来非常方便。它建立在NumPy数组结构之上,通过NumPy或Pandas自带的扩展模块编写,并使用Cython编写并编译为C代码。
Pandas是Python中非常常用的数据处理工具,使用起来非常方便。它建立在NumPy数组结构之上,所以它的很多操作通过NumPy或者Pandas自带的扩展模块编写,这些模块用Cython编写并编译到C,并且在C上执行,因此也保证了处理速度。
今天我们就来体验一下它的强大之处。
1.创建数据
使用pandas可以很方便地进行数据创建,现在让我们创建一个5列1000行的pandas DataFrame:
mu1, sigma1 = 0, 0.1 mu2, sigma2 = 0.2, 0.2 n = 1000df = pd.DataFrame( { "a1": pd.np.random.normal(mu1, sigma1, n), "a2": pd.np.random.normal(mu2, sigma2, n), "a3": pd.np.random.randint(0, 5, n), "y1": pd.np.logspace(0, 1, num=n), "y2": pd.np.random.randint(0, 2, n), } )
- a1和a2:从正态(高斯)分布中抽取的随机样本。
- a3:0到4中的随机整数。
- y1:从0到1的对数刻度均匀分布。
- y2:0到1中的随机整数。
本文共计671个文字,预计阅读时间需要3分钟。
Pandas是Python中常用的数据处理工具,使用起来非常方便。它建立在NumPy数组结构之上,通过NumPy或Pandas自带的扩展模块编写,并使用Cython编写并编译为C代码。
Pandas是Python中非常常用的数据处理工具,使用起来非常方便。它建立在NumPy数组结构之上,所以它的很多操作通过NumPy或者Pandas自带的扩展模块编写,这些模块用Cython编写并编译到C,并且在C上执行,因此也保证了处理速度。
今天我们就来体验一下它的强大之处。
1.创建数据
使用pandas可以很方便地进行数据创建,现在让我们创建一个5列1000行的pandas DataFrame:
mu1, sigma1 = 0, 0.1 mu2, sigma2 = 0.2, 0.2 n = 1000df = pd.DataFrame( { "a1": pd.np.random.normal(mu1, sigma1, n), "a2": pd.np.random.normal(mu2, sigma2, n), "a3": pd.np.random.randint(0, 5, n), "y1": pd.np.logspace(0, 1, num=n), "y2": pd.np.random.randint(0, 2, n), } )
- a1和a2:从正态(高斯)分布中抽取的随机样本。
- a3:0到4中的随机整数。
- y1:从0到1的对数刻度均匀分布。
- y2:0到1中的随机整数。

