如何使用点绘制pandas数据框的两列?
我有一个pandas数据框架,并想绘制一列的值与另一列的值。 幸运的是,有一些与数据框架相关的plot
方法似乎正在做我所需要的:
df.plot(x='col_name_1', y='col_name_2')
不幸的是,它看起来像情节样式(在kind
参数后面列出)没有点。 我可以使用线条或条纹,甚至可以使用密度而不是点数。 有没有办法可以帮助解决这个问题。
调用df.plot
时可以指定绘制线的style
:
df.plot(x='col_name_1', y='col_name_2', style='o')
style
参数也可以是dict
或list
,例如:
import numpy as np import pandas as pd d = {'one' : np.random.rand(10), 'two' : np.random.rand(10)} df = pd.DataFrame(d) df.plot(style=['o','rx'])
所有可接受的样式格式都列在matplotlib.pyplot.plot
的文档中。
对于这个(和大多数阴谋)我不会依赖pandas包装matplotlib。 相反,直接使用matplotlib:
import matplotlib.pyplot as plt plt.scatter(df['col_name_1'], df['col_name_2']) plt.show() # Depending on whether you use IPython or interactive mode, etc.
并记住,例如,您可以使用df.col_name_1.values
访问列值的NumPy数组。
在一列Timestamp数值的情况下,使用Pandas默认绘图时,我遇到了麻烦,精度为毫秒级。 在试图将对象转换为datetime64
types时,我还发现了一个令人讨厌的问题:< Pandas在询问Timestamp列值是否具有attrtypes > 时会给出不正确的结果 。