有两种方法可以将整数/浮点数组清零: memset(array, 0, sizeof(int)*arraysize); 要么: for (int i=0; i <arraysize; ++i) array[i]=0; 显然,对于大型arraysize ,memset更快。 但是,memset的开销实际上大于for循环的开销? 例如,对于大小为5的数组 – 这将是最好的? 第一个,第二个,或者甚至是未滚动的版本: array[0] = 0; array[1] = 0; array[2] = 0; array[3] = 0; array[4] = 0;
我正在使用MPI,我想测量通信成本,以便将其与“处理”成本进行比较,例如,需要多less时间通过n个进程分散列表,然后将其与多less进行比较我需要对它进行sorting。 有没有人知道任何工具来衡量这种沟通成本? (例如分散) 有没有什么可以测量MPI的通信成本,比如PAPI来分析代码的性能? 提前致谢!