如何添加一个新的行到一个空的numpy数组
使用标准的Python数组,我可以做到以下几点:
arr = [] arr.append([1,2,3]) arr.append([4,5,6]) # arr is now [[1,2,3],[4,5,6]]
但是,我不能在numpy中做同样的事情。 例如:
arr = np.array([]) arr = np.append(arr, np.array([1,2,3])) arr = np.append(arr, np.array([4,5,6])) # arr is now [1,2,3,4,5,6]
我也研究过vstack
,但是当我在一个空数组上使用vstack
时,我得到:
ValueError: all the input array dimensions except for the concatenation axis must match exactly
那么我怎么做一个新的行添加到numpy中的空数组?
“开始”你想要的数组的方式是:
arr = np.empty((0,3), int)
这是一个空arrays,但它具有适当的维度。
>>> arr array([], shape=(0, 3), dtype=int64)
然后一定要沿轴0追加:
arr = np.append(arr, np.array([[1,2,3]]), axis=0) arr = np.append(arr, np.array([[4,5,6]]), axis=0)
但@jonrsharpe是对的。 实际上,如果你要在一个循环中追加,追加到列表中会比第一个例子快得多,然后在最后转换为一个numpy数组,因为你真的不使用numpy作为在循环期间打算:
In [210]: %%timeit .....: l = [] .....: for i in xrange(1000): .....: l.append([3*i+1,3*i+2,3*i+3]) .....: l = np.asarray(l) .....: 1000 loops, best of 3: 1.18 ms per loop In [211]: %%timeit .....: a = np.empty((0,3), int) .....: for i in xrange(1000): .....: a = np.append(a, 3*i+np.array([[1,2,3]]), 0) .....: 100 loops, best of 3: 18.5 ms per loop In [214]: np.allclose(a, l) Out[214]: True
这样做的numpythonic方式取决于您的应用程序,但它更像是:
In [220]: timeit n = np.arange(1,3001).reshape(1000,3) 100000 loops, best of 3: 5.93 µs per loop In [221]: np.allclose(a, n) Out[221]: True
在这种情况下,您可能需要使用函数np.hstack和np.vstack
arr = np.array([]) arr = np.hstack((arr, np.array([1,2,3]))) # arr is now [1,2,3] arr = np.vstack((arr, np.array([4,5,6]))) # arr is now [[1,2,3],[4,5,6]]
你也可以使用np.concatenate函数。
干杯
这是我的解决scheme:
arr = [] arr.append([1,2,3]) arr.append([4,5,6]) np_arr = np.array(arr)
使用自定义的dtype定义,对我有效的是:
import numpy # define custom dtype type1 = numpy.dtype([('freq', numpy.float64, 1), ('amplitude', numpy.float64, 1)]) # declare empty array, zero rows but one column arr = numpy.empty([0,1],dtype=type1) # store row data, maybe inside a loop row = numpy.array([(0.0001, 0.002)], dtype=type1) # append row to the main array arr = numpy.row_stack((arr, row)) # print values stored in the row 0 print float(arr[0]['freq']) print float(arr[0]['amplitude'])