二维数组与一维数组的性能
在C中,m×n二维数组与长度为m×n的一维数组(m和n的大数值)之间在时间和空间上是否存在差异? 使用1维数组访问元素会更快吗?
在C中,二维数组只是一维数组的简洁索引scheme。 就像使用一维数组一样,2D数组分配一个连续内存块, A[row][col]
符号类似于A[row*NCOLS+col]
。
通常,如果要使用单维数组来实现自己的multidimensional array,您可以编写一个索引函数:
int getIndex(int row, int col) { return row*NCOLS+col; }
假设你的编译器内嵌了这个函数,这里的性能就好像你使用了二维数组的内build“索引函数”一样。
为了显示:
#define NROWS 10 #define NCOLS 20
这个:
int main(int argc, char *argv[]) { int myArr[NROWS*NCOLS]; for (int i=0; i<NROWS; ++i) { for (int j=0; j<NCOLS; ++j) { myArr[getIndex(i,j)] = i+j; } } return 0; }
应该像这样执行相同的操作:
int main(int argc, char *argv[]) { int myArr[NROWS][NCOLS]; for (int i=0; i<NROWS; ++i) { for (int j=0; j<NCOLS; ++j) { myArr[i][j] = i+j; } } return 0; }
虽然正如AraK所 指出的那样 ,如果你跳过很多行,并且行很大,可能会遇到很多页面错误…在这种情况下,自定义索引函数(行和列转换)可以帮助,但是也可以简单地改变一个二维数组中的哪一个维度,你把它当作行,哪一个当作列处理。
实际上,如果你在C中使用所谓的二维数组,编译器会为你做一维数组映射。 如果使用一维数组,并且想将其视为二维数组,则必须自己编写映射。
唯一需要注意的是你应该按行访问数组,因为C编译器会在你的行之后存储你的二维数组。 如果您按列方式访问“大”二维数组,则页面错误可能会发生。 即使您使用仅支持一维数组的语言进行编程,也可以轻松地将映射写入任意数量的维度。
看看这个维基百科文章,如果你想按行进行映射 。 您的映射可能是列式的,比如FORTRANmatrix。
我不认为有任何区别。 在内部,c按照几个一维数组顺序处理二维数组。
但是,与所有performance一样,您的里程可能会有所不同。 可能会有某种微妙的指针算术差异。 在两种情况下运行定时testing。 无论哪一个跑得快赢。
罗伯特是正确的。 索引expression式被编译为指针算术expression式,所以没有区别。
然而,可以产生影响的是访问顺序,因此您可能需要自己实现,以便控制访问顺序。 例如列第一列和第一列的forms。
在现代处理器上,以各种方式访问大型arrays可能会产生意想不到的性能差异。 顺序访问总是最快的,由于caching交互,其他步幅可能会降低30倍。 内部维度是2的幂的multidimensional array通常具有差的性能,因为它们与caching关联性相互作用的方式。 要了解这些问题,没有什么真正的替代做测量。
正如其他人所说的,不同之处在于你如何访问你的项目:如果你的项目是在内存中的布局,至less在通用架构上是线性的,那么重要的是什么。 因此,所有你真正的是1d数组,2d等等“只是”一个方便,一个合理的编译器应该优化索引 – 但实际上,一旦你有不止一个variables,编译器往往会失败比如x86,因为寄存器不足。
现在,这取决于你的应用程序,但我认为你应该默认使用1d布局,特别是如果你需要处理多个维度的话。 C语言中multidimensional array的第一个问题是你不能dynamic地分配它们,如果你按照行的方式进行分配,你将会有非常糟糕的performance,因为你没有连续的内存。 有关详细信息,请参阅FFTW文档 。
请注意,你总是可以用方便的数组索引来描述你的单个内存块(你分配一个大的nxm内存块,然后为每一行创build一个n指针数组)。
我只是猜测,但我会说1D数组比2D数组快。 但是,这不会显着加快。 有点像$ 1,000,000.01超过$ 1,000,000。
我会使用任何更容易编码。