Tag: 数据框

pandas iloc vs ix vs loc解释?

有人可以解释这三种切片的方法是不同的吗? 我看过这些文档 ,而且我看到了这些 答案 ,但是我仍然发现自己无法解释三者是如何不同的。 对我来说,他们似乎是可以互换的,因为他们处于较低层次的切片。 例如,假设我们想获得DataFrame的前五行。 这三个工作怎么样? df.loc[:5] df.ix[:5] df.iloc[:5] 有人可以提出三个使用区分更清楚的案例吗?

如何获得pandas数据框的行数?

我试图得到与Pandas的dataframeDF的行数,这里是我的代码。 方法1: total_rows = df.count print total_rows +1 方法2: total_rows = df['First_columnn_label'].count print total_rows +1 这两个代码片段给我这个错误: TypeError:不支持的操作数types为+:'instancemethod'和'int' 我究竟做错了什么? 根据@root给出的答案 ,检查df长度的最佳(最快)方法是调用: len(df.index)

如何删除某些列中的值为NaN的Pandas DataFrame的行

我有一个DataFrame : >>> df STK_ID EPS cash STK_ID RPT_Date 601166 20111231 601166 NaN NaN 600036 20111231 600036 NaN 12 600016 20111231 600016 4.3 NaN 601009 20111231 601009 NaN NaN 601939 20111231 601939 2.5 NaN 000001 20111231 000001 NaN NaN 然后我只想要EPS不是NaN的logging,也就是df.drop(….)将返回dataframe如下: STK_ID EPS cash STK_ID RPT_Date 600016 20111231 600016 4.3 NaN 601939 20111231 601939 2.5 NaN […]

在pandas数据框中select列

我有不同的列中的数据,但我不知道如何提取它保存在另一个variables。 index abc 1 2 3 4 2 3 4 5 如何select'b' , 'c'并将其保存到df1中? 我试过了 df1 = df['a':'b'] df1 = df.ix[:, 'a':'b'] 似乎没有工作。 任何想法将有助于感谢。

如何迭代Pandas中的DataFrame中的行?

我有pandas的数据框: import pandas as pd inp = [{'c1':10, 'c2':100}, {'c1':11,'c2':110}, {'c1':12,'c2':120}] df = pd.DataFrame(inp) print df 输出: c1 c2 0 10 100 1 11 110 2 12 120 现在我想遍历上面的帧的行。 对于每一行,我都希望能够通过列的名称访问其元素(单元格中的值)。 所以,例如,我想有这样的事情: for row in df.rows: print row['c1'], row['c2'] pandas可以这样做吗? 我发现了类似的问题 。 但这并不能给我我需要的答案。 例如,build议在那里使用: for date, row in df.T.iteritems(): 要么 for row in df.iterrows(): 但是我不明白row对象是什么,以及我如何使用它。

如何从数据框的单元格中获取值?

我已经构build了一个条件,从我的数据框中提取一行: d2 = df[(df['l_ext']==l_ext) & (df['item']==item) & (df['wn']==wn) & (df['wd']==1)] 现在我想从一个特定的栏目中获得价值: val = d2['col_name'] 但是,结果我得到一个包含一行和一列( 即一个单元格)的数据框。 这不是我所需要的。 我需要一个值(一个浮点数)。 我怎么能在pandas呢?

如何重置pandas数据框中的索引?

我有一个数据框从中删除了一些行。 因此,我得到一个数据框,其索引是这样的: [1,5,6,10,11] ,我想重置它到[0,1,2,3,4] 。 我该怎么做? 添加 以下似乎工作: df = df.reset_index() del df['index'] 以下不起作用: df = df.reindex()

pandasread_csv low_memory和dtype选项

打电话时 df = pd.read_csv('somefile.csv') 我得到: /Users/josh/anaconda/envs/py27/lib/python2.7/site-packages/pandas/io/parsers.py:1130:DtypeWarning:列(4,5,7,16)有混合types。 在导入时指定dtype选项或设置low_memory = False。 为什么low_memory选项与low_memory有关,为什么会使这个问题low_memory呢?

用Pandas条形图上的值来标注条形图

我正在寻找一种方法在我的DataFrame中使用值(舍入)在Pandas条形图中标注我的条形图。 >>> df=pd.DataFrame({'A':np.random.rand(2),'B':np.random.rand(2)},index=['value1','value2'] ) >>> df AB value1 0.440922 0.911800 value2 0.588242 0.797366 我想得到这样的东西: 我尝试了这个,但注释都集中在xthicks: >>> ax = df.plot(kind='bar') >>> for idx, label in enumerate(list(df.index)): for acc in df.columns: value = np.round(df.ix[idx][acc],decimals=2) ax.annotate(value, (idx, value), xytext=(0, 15), textcoords='offset points')

在pandas的数据框中查找非数字行?

我在pandas有一个很大的数据框,除了作为索引使用的列应该只有数值: df = pd.DataFrame({'a': [1, 2, 3, 'bad', 5], 'b': [0.1, 0.2, 0.3, 0.4, 0.5], 'item': ['a', 'b', 'c', 'd', 'e']}) df = df.set_index('item') 我怎样才能find数据框df中有一个非数字值的行? 在这个例子中,它是数据框中的第四行,在a列中有string'bad' 。 如何可以通过编程find这一行?