如何添加一个新的行到一个空的numpy数组

使用标准的Python数组,我可以做到以下几点:

arr = [] arr.append([1,2,3]) arr.append([4,5,6]) # arr is now [[1,2,3],[4,5,6]] 

但是,我不能在numpy中做同样的事情。 例如:

 arr = np.array([]) arr = np.append(arr, np.array([1,2,3])) arr = np.append(arr, np.array([4,5,6])) # arr is now [1,2,3,4,5,6] 

我也研究过vstack ,但是当我在一个空数组上使用vstack时,我得到:

 ValueError: all the input array dimensions except for the concatenation axis must match exactly 

那么我怎么做一个新的行添加到numpy中的空数组?

“开始”你想要的数组的方式是:

 arr = np.empty((0,3), int) 

这是一个空arrays,但它具有适当的维度。

 >>> arr array([], shape=(0, 3), dtype=int64) 

然后一定要沿轴0追加:

 arr = np.append(arr, np.array([[1,2,3]]), axis=0) arr = np.append(arr, np.array([[4,5,6]]), axis=0) 

但@jonrsharpe是对的。 实际上,如果你要在一个循环中追加,追加到列表中会比第一个例子快得多,然后在最后转换为一个numpy数组,因为你真的不使用numpy作为在循环期间打算:

 In [210]: %%timeit .....: l = [] .....: for i in xrange(1000): .....: l.append([3*i+1,3*i+2,3*i+3]) .....: l = np.asarray(l) .....: 1000 loops, best of 3: 1.18 ms per loop In [211]: %%timeit .....: a = np.empty((0,3), int) .....: for i in xrange(1000): .....: a = np.append(a, 3*i+np.array([[1,2,3]]), 0) .....: 100 loops, best of 3: 18.5 ms per loop In [214]: np.allclose(a, l) Out[214]: True 

这样做的numpythonic方式取决于您的应用程序,但它更像是:

 In [220]: timeit n = np.arange(1,3001).reshape(1000,3) 100000 loops, best of 3: 5.93 µs per loop In [221]: np.allclose(a, n) Out[221]: True 

在这种情况下,您可能需要使用函数np.hstack和np.vstack

 arr = np.array([]) arr = np.hstack((arr, np.array([1,2,3]))) # arr is now [1,2,3] arr = np.vstack((arr, np.array([4,5,6]))) # arr is now [[1,2,3],[4,5,6]] 

你也可以使用np.concatenate函数。

干杯

这是我的解决scheme:

 arr = [] arr.append([1,2,3]) arr.append([4,5,6]) np_arr = np.array(arr) 

使用自定义的dtype定义,对我有效的是:

 import numpy # define custom dtype type1 = numpy.dtype([('freq', numpy.float64, 1), ('amplitude', numpy.float64, 1)]) # declare empty array, zero rows but one column arr = numpy.empty([0,1],dtype=type1) # store row data, maybe inside a loop row = numpy.array([(0.0001, 0.002)], dtype=type1) # append row to the main array arr = numpy.row_stack((arr, row)) # print values stored in the row 0 print float(arr[0]['freq']) print float(arr[0]['amplitude'])