pandas – 获取给定列的第一行值
这似乎是一个可笑的简单的问题…但我没有看到我期待的简单答案。
那么,怎样才能得到Pandas给定列第n行的价值呢? (我对第一行特别感兴趣,但也会对更一般的实践感兴趣)。
例如,假设我想把Btime中的1.2值作为一个variables。
什么是正确的方法来做到这一点?
df_test =
ATime XYZ Btime CDE 0 1.2 2 15 2 1.2 12 25 12 1 1.4 3 12 1 1.3 13 22 11 2 1.5 1 10 6 1.4 11 20 16 3 1.6 2 9 10 1.7 12 29 12 4 1.9 1 1 9 1.9 11 21 19 5 2.0 0 0 0 2.0 8 10 11 6 2.4 0 0 0 2.4 10 12 15
要select第ith
行,请使用iloc
:
In [31]: df_test.iloc[0] Out[31]: ATime 1.2 X 2.0 Y 15.0 Z 2.0 Btime 1.2 C 12.0 D 25.0 E 12.0 Name: 0, dtype: float64
要selectBtime
列中的第i个值,您可以使用:
In [30]: df_test['Btime'].iloc[0] Out[30]: 1.2
警告 :我曾经build议df_test.ix[i, 'Btime']
。 但是,这并不能保证给你第ith
值,因为ix
试图按照标签索引,然后尝试按位置索引。 所以如果DataFrame有一个不是从0开始的sorting顺序的整数索引,那么使用ix[i]
将返回标记为 i
的行而不是第ith
行。 例如,
In [1]: df = pd.DataFrame({'foo':list('ABC')}, index=[0,2,1]) In [2]: df Out[2]: foo 0 A 2 B 1 C In [4]: df.ix[1, 'foo'] Out[4]: 'C'
请注意@unutbu的答案是正确的,直到你想把这个值设置为新的东西,那么如果你的数据框是一个视图,它将不会工作。
In [4]: df = pd.DataFrame({'foo':list('ABC')}, index=[0,2,1]) In [5]: df['bar'] = 100 In [6]: df['bar'].iloc[0] = 99 /opt/local/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/site-packages/pandas-0.16.0_19_g8d2818e-py2.7-macosx-10.9-x86_64.egg/pandas/core/indexing.py:118: SettingWithCopyWarning: A value is trying to be set on a copy of a slice from a DataFrame See the the caveats in the documentation: http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy self._setitem_with_indexer(indexer, value)
另一种方法将持续与设置和获取是:
In [7]: df.loc[df.index[0], 'foo'] Out[7]: 'A' In [8]: df.loc[df.index[0], 'bar'] = 99 In [9]: df Out[9]: foo bar 0 A 99 2 B 100 1 C 100
-
df.iloc[0].head(1)
– 仅从整个第一行开始的第一个数据集。 -
df.iloc[0]
– 整列中的第一行。
一般来说,如果你想从pandas数据框的J列中选取前N行,最好的办法是:
data = dataframe [0:N] [:,J]