replace大于某个值的Python NumPy数组的所有元素

我有一个2D NumPy数组,并希望用255.0replace大于或等于阈值T的所有值。 据我所知,最根本的方法是:

shape = arr.shape result = np.zeros(shape) for x in range(0, shape[0]): for y in range(0, shape[1]): if arr[x, y] >= T: result[x, y] = 255 
  1. 什么是最简洁和pythonic的方式来做到这一点?

  2. 有没有更快(可能不那么简洁和/或pythonicless)的方式来做到这一点?

这将成为人体头部MRI扫描窗口/等级调整子程序的一部分。 2D numpyarrays是图像像素数据。

我认为最快和最简洁的方法是使用Numpy的内置索引。 如果你有一个名为arrndarray你可以用值xreplace所有>255元素,如下所示:

 arr[arr > 255] = x 

我用500×500的随机matrix在我的机器上运行这个,用5代替所有> 0.5的值,平均耗时7.59ms。

 In [1]: import numpy as np In [2]: A = np.random.rand(500, 500) In [3]: timeit A[A > 0.5] = 5 100 loops, best of 3: 7.59 ms per loop 

因为你实际上需要一个不同的数组, arr < 255arr < 255arr < 255 ,否则,这可以简单地完成:

 result = np.minimum(arr, 255) 

更一般地,对于下限和/或上限:

 result = np.clip(arr, 0, 255) 

如果你只想访问255以上的值,或者更复杂的话,@ mtitan8的答案更一般,但是np.clipnp.minimum (或np.maximum )更好,更快。

 In [292]: timeit np.minimum(a, 255) 100000 loops, best of 3: 19.6 µs per loop In [293]: %%timeit .....: c = np.copy(a) .....: c[a>255] = 255 .....: 10000 loops, best of 3: 86.6 µs per loop 

如果你想在原地进行(即修改arr而不是创buildresult ),可以使用np.minimumout参数:

 np.minimum(arr, 255, out=arr) 

要么

 np.clip(arr, 0, 255, arr) 

out= name是可选的,因为参数的顺序与函数的定义相同。)

对于就地修改,布尔索引加速了很多(不必分别修改和拷贝),但是仍然没有minimum速度:

 In [328]: %%timeit .....: a = np.random.randint(0, 300, (100,100)) .....: np.minimum(a, 255, a) .....: 100000 loops, best of 3: 303 µs per loop In [329]: %%timeit .....: a = np.random.randint(0, 300, (100,100)) .....: a[a>255] = 255 .....: 100000 loops, best of 3: 356 µs per loop 

为了比较,如果你想限制你的价值观以及最大限度的,没有clip你将不得不这样做两次,有像

 np.minimum(a, 255, a) np.maximum(a, 0, a) 

要么,

 a[a>255] = 255 a[a<0] = 0 

你可以考虑使用numpy.putmask

 np.putmask(arr, arr>=T, 255.0) 

下面是与Numpy内置索引的性能比较:

 In [1]: import numpy as np In [2]: A = np.random.rand(500, 500) In [3]: timeit np.putmask(A, A>0.5, 5) 1000 loops, best of 3: 1.34 ms per loop In [4]: timeit A[A > 0.5] = 5 1000 loops, best of 3: 1.82 ms per loop 

我认为你可以通过使用where函数来达到最快的效果:

例如,在numpy数组中查找大于0.2的项目,并用0代替它们:

 import numpy as np nums = np.random.rand(4,3) print np.where(nums > 0.2, 0, nums)