Python – 在pandas中查找带有NaN的行的整数索引
我有一个像这样的pandasDataFrame:
ab 2011-01-01 00:00:00 1.883381 -0.416629 2011-01-01 01:00:00 0.149948 -1.782170 2011-01-01 02:00:00 -0.407604 0.314168 2011-01-01 03:00:00 1.452354 NaN 2011-01-01 04:00:00 -1.224869 -0.947457 2011-01-01 05:00:00 0.498326 0.070416 2011-01-01 06:00:00 0.401665 NaN 2011-01-01 07:00:00 -0.019766 0.533641 2011-01-01 08:00:00 -1.101303 -1.408561 2011-01-01 09:00:00 1.671795 -0.764629
有没有一种有效的方法来查找带有NaN的行的“整数”索引? 在这种情况下,所需的输出应该是[3, 6]
。
对于DataFrame df
:
import numpy as np index = df['b'].index[df['b'].apply(np.isnan)]
会给你回MultiIndex
,你可以使用索引回到MultiIndex
,例如:
df['a'].ix[index[0]] >>> 1.452354
对于整数索引:
df_index = df.index.values.tolist() [df_index.index(i) for i in index] >>> [3, 6]
这是一个更简单的解决scheme:
inds = pd.isnull(df).any(1).nonzero()[0]
In [9]: df Out[9]: 0 1 0 0.450319 0.062595 1 -0.673058 0.156073 2 -0.871179 -0.118575 3 0.594188 NaN 4 -1.017903 -0.484744 5 0.860375 0.239265 6 -0.640070 NaN 7 -0.535802 1.632932 8 0.876523 -0.153634 9 -0.686914 0.131185 In [10]: pd.isnull(df).any(1).nonzero()[0] Out[10]: array([3, 6])
以防万一,如果你想find所有列的'南'的坐标,而不是(假设他们都是数字),在这里你去:
df = pd.DataFrame([[0,1,3,4,np.nan,2],[3,5,6,np.nan,3,3]]) df 0 1 2 3 4 5 0 0 1 3 4.0 NaN 2 1 3 5 6 NaN 3.0 3 np.where(np.asanyarray(np.isnan(df))) (array([0, 1]), array([4, 3]))