将nan值转换为零

我有一个2D numpy数组。 这个数组中的一些值是NaN 。 我想要使​​用这个数组来执行某些操作。 例如考虑数组:

 [[ 0. 43. 67. 0. 38.] [ 100. 86. 96. 100. 94.] [ 76. 79. 83. 89. 56.] [ 88. NaN 67. 89. 81.] [ 94. 79. 67. 89. 69.] [ 88. 79. 58. 72. 63.] [ 76. 79. 71. 67. 56.] [ 71. 71. NaN 56. 100.]] 

我试图每次取一行,按照相反的顺序sorting,从行中获取最大值3并取其平均值。 我试过的代码是:

 # nparr is a 2D numpy array for entry in nparr: sortedentry = sorted(entry, reverse=True) highest_3_values = sortedentry[:3] avg_highest_3 = float(sum(highest_3_values)) / 3 

这对包含NaN行不起作用。 我的问题是,是否有一个快速的方法来在二维numpy数组中的所有NaN值转换为零,所以我没有问题sorting和其他事情,我正在尝试做。

这应该工作:

 from numpy import * a = array([[1, 2, 3], [0, 3, NaN]]) where_are_NaNs = isnan(a) a[where_are_NaNs] = 0 

在以上情况下,其中_are_NaNs是:

 In [12]: where_are_NaNs Out[12]: array([[False, False, False], [False, False, True]], dtype=bool) 

其中A是您的二维arrays:

 import numpy as np A[np.isnan(A)] = 0 

函数isnan产生一个布尔数组,指示NaN值在哪里。 一个布尔数组可以被用来索引相同形状的数组。 把它想成一个面具。

怎么样nan_to_num() ?

nan_to_num 的答案使用nan_to_num代码示例:

 >>> import numpy as np >>> A = np.array([[1, 2, 3], [0, 3, np.NaN]]) >>> A = np.nan_to_num(A) >>> A array([[ 1., 2., 3.], [ 0., 3., 0.]]) 

南永远不等于南

 if z!=z:z=0 

所以对于二维数组

 for entry in nparr: if entry!=entry:entry=0 

你可以使用numpy.nan_to_num :

numpy.nan_to_num(x):将nanreplace为有限数字的 inf

示例(请参阅doc):

 >>> np.set_printoptions(precision=8) >>> x = np.array([np.inf, -np.inf, np.nan, -128, 128]) >>> np.nan_to_num(x) array([ 1.79769313e+308, -1.79769313e+308, 0.00000000e+000, -1.28000000e+002, 1.28000000e+002]) 

你可以使用np.where来find你有NaN

 import numpy as np a = np.array([[ 0, 43, 67, 0, 38], [ 100, 86, 96, 100, 94], [ 76, 79, 83, 89, 56], [ 88, np.nan, 67, 89, 81], [ 94, 79, 67, 89, 69], [ 88, 79, 58, 72, 63], [ 76, 79, 71, 67, 56], [ 71, 71, np.nan, 56, 100]]) b = np.where(np.isnan(a), a, 0) In [20]: b Out[20]: array([[ 0., 43., 67., 0., 38.], [ 100., 86., 96., 100., 94.], [ 76., 79., 83., 89., 56.], [ 88., 0., 67., 89., 81.], [ 94., 79., 67., 89., 69.], [ 88., 79., 58., 72., 63.], [ 76., 79., 71., 67., 56.], [ 71., 71., 0., 56., 100.]]) 

你可以使用lambda函数,一维数组的例子:

 import numpy as np a = [np.nan, 2, 3] map(lambda v:0 if np.isnan(v) == True else v, a) 

这会给你结果:

 [0, 2, 3] 

出于你的目的,如果所有的项目都存储为str ,你只是使用sorting,因为你正在使用,然后检查第一个元素,并将其replace为'0'

 >>> l1 = ['88','NaN','67','89','81'] >>> n = sorted(l1,reverse=True) ['NaN', '89', '88', '81', '67'] >>> import math >>> if math.isnan(float(n[0])): ... n[0] = '0' ... >>> n ['0', '89', '88', '81', '67']