Tag: 性能

从Javastring中去除所有不可打印字符的最快方法: 什么是从Java中的String中去除所有不可打印字符的最快方法？到目前为止，我已经尝试和测量了138字节，131字符的string： String的replaceAll() – 最慢的方法 517009结果/秒预编译模式，然后使用匹配器的replaceAll() 637836结果/秒使用StringBuffer，使用codepointAt()逐个获取代码codepointAt()并追加到StringBuffer 711946结果/秒使用StringBuffer，使用charAt()逐个获取字符并追加到StringBuffer 1052964结果/秒预先分配一个char[]缓冲区，使用charAt()逐个获取字符并填充此缓冲区，然后转换回string 2022653结果/秒预先分配2个char[]缓冲区 – 旧的和新的，使用getChars()立即获取现有string的所有字符， getChars()迭代旧缓冲区并填充新缓冲区，然后将新缓冲区转换为string – 我自己的最快版本每秒2502502个结果与2缓冲区相同的东西 – 只使用byte[] ， getBytes()和指定编码为“utf-8” 857485结果/秒与2 byte[]缓冲区相同的东西，但指定编码作为一个常量Charset.forName("utf-8") 791076结果/秒与2 byte[]缓冲区相同的东西，但指定编码为1字节的本地编码（只是一个理智的事情） 370164结果/秒我最好的尝试是以下几点： char[] oldChars = new char[s.length()]; s.getChars(0, s.length(), oldChars, 0); char[] newChars = new char[s.length()]; int newLen = 0; for (int j […]

int运算符！=和==比较时为零: 我发现！=和==不是testing零或非零的最快方法。 bool nonZero1 = integer != 0; xor eax, eax test ecx, ecx setne al bool nonZero2 = integer < 0 || integer > 0; test ecx, ecx setne al bool zero1 = integer == 0; xor eax, eax test ecx, ecx sete al bool zero2 = !(integer < 0 || integer > 0); test […]

我如何衡量AngularJS应用程序摘要循环的性能？: 什么是测量angularjs摘要周期持续时间的简单方法？有各种方法来分析摘要循环的性能，但是每个都有自己的坑： Chrome Profiler：太多的细节，并没有以简单易懂的方式打破文摘循环 Batarang（AngularJS浏览器插件）：开销太大，刷新速度慢，大应用程序爆炸。 …一定有更好的办法？！1？

如何计算我的程序的运行时间？: 可能重复：如何在Java中计算方法的执行时间？我写了一个程序，现在我想计算我的程序从开始到结束的总运行时间。我怎样才能做到这一点？

使Visual Studio 2010更快的性能提示？: 我不知道其他人是否有与Visual Studio 2010的性能问题，但我每天closures它，并重新打开它，一个小时，它开始真正陷入困境，甚至不能跟上我的打字。有没有一些明显的设置，我失踪，这将有助于加快？我也使用ReSharper，但即使我删除了它，它只是稍微提高速度。由于有几个人要求我的机器规格： Intel Q9550 @ 2.83 GHz 4 Cores 8GB Physical RAM 2x 60GB SSD in RAID0 combination for solution/project VS2010 RTM Ultimate Windows Server 2008 x64 R2 (Performance set for Applications) 虽然听到这个答案是“买更快的硬件”，但是我的硬件实际上还不错的时候很遗憾。编辑：包括由TimothyPbuild议的Visual Studio性能诊断工具的链接

为什么memmove比memcpy更快？: 我正在调查一个应用程序中的性能热点，这个应用程序在memmove（3）中花费了50％的时间。应用程序将数百万个4字节的整数插入到已sorting的数组中，并使用memmove将数据“向右移动”，以便为插入值腾出空间。我的期望是复制记忆速度非常快，我惊讶于花费了太多的时间。但是后来我有一个想法，就是memmove很慢，因为它正在移动重叠的区域，必须在严格的循环中执行，而不是复制大量的内存。我写了一个小的微型基准来看看memcpy和memmove之间是否存在性能差异，希望memcpy赢得双手。我在两台机器（核心i5，核心i7）上运行我的基准testing，看到memmove实际上比memcpy更快，在旧的核心i7上甚至快了近一倍！现在我正在寻找解释。这是我的基准。它用memcpy复制100 MB，然后用memmove移动大约100 MB。来源和目的地重叠。尝试了源和目的地的各种“距离”。每个testing运行10次，平均时间打印。 https://gist.github.com/cruppstahl/78a57cdf937bca3d062c 以下是Core i5（Linux 3.5.0-54-generic＃81〜precise1-Ubuntu SMP x86_64 GNU / Linux，gcc是4.6.3（Ubuntu / Linaro 4.6.3-1ubuntu5）的结果。括号内的数字是源和目标之间的距离（间隙大小）： memcpy 0.0140074 memmove (002) 0.0106168 memmove (004) 0.01065 memmove (008) 0.0107917 memmove (016) 0.0107319 memmove (032) 0.0106724 memmove (064) 0.0106821 memmove (128) 0.0110633 Memmove是作为SSE优化的汇编代码实现的，从后向前复制。它使用硬件预取将数据加载到caching中，并将128个字节复制到XMM寄存器，然后将其存储在目标处。（ memcpy-ssse3-back.S ，第1650行ff） L(gobble_ll_loop): […]

在编译32位和64位时性能差异巨大（快26倍）: 我试图衡量在访问值types和引用types列表时使用for和foreach的区别。我使用下面的类来进行分析。 public static class Benchmarker { public static void Profile(string description, int iterations, Action func) { Console.Write(description); // Warm up func(); Stopwatch watch = new Stopwatch(); // Clean up GC.Collect(); GC.WaitForPendingFinalizers(); GC.Collect(); watch.Start(); for (int i = 0; i < iterations; i++) { func(); } watch.Stop(); Console.WriteLine(" average time: {0} ms", watch.Elapsed.TotalMilliseconds / iterations); […]

numpy怎么能比我的Fortran程序快得多呢？: 我从一个模拟（用Fortran编写）得到一个表示温度分布的512 ^ 3数组。该数组存储在大小约为1 / 2G的二进制文件中。我需要知道这个数组的最小值，最大值和平均值，因为无论如何，我将很快需要了解Fortran代码，所以我决定给它一个提示，并提出以下非常简单的例程。 integer gridsize,unit,j real mini,maxi double precision mean gridsize=512 unit=40 open(unit=unit,file='T.out',status='old',access='stream',& form='unformatted',action='read') read(unit=unit) tmp mini=tmp maxi=tmp mean=tmp do j=2,gridsize**3 read(unit=unit) tmp if(tmp>maxi)then maxi=tmp elseif(tmp<mini)then mini=tmp end if mean=mean+tmp end do mean=mean/gridsize**3 close(unit=unit) 这在我使用的机器上每个文件需要约25秒。这让我感到相当长，所以我继续前进，在Python中做了以下事情： import numpy mmap=numpy.memmap('T.out',dtype='float32',mode='r',offset=4,\ shape=(512,512,512),order='F') mini=numpy.amin(mmap) maxi=numpy.amax(mmap) mean=numpy.mean(mmap) 现在，我认为这当然会更快，但是我真的被吹走了。在相同的条件下需要不到一秒的时间。平均数偏离我的Fortran例程发现的数据（我也用128位浮点数运行，所以我以某种方式相信它），但是仅在第7位有效数字左右。 numpy怎么能这么快？我的意思是你必须看看数组的每一个条目来find这些值，对吧？我在Fortran程序中做了一些非常愚蠢的事情，因为它需要更长的时间？编辑：要回答评论中的问题： […]

我如何在C＃中进行日志logging？: 我想在我的应用程序中实现日志logging，但宁愿不使用任何外部框架，如log4net。所以我想做一些像DOS的回应文件。什么是最有效的方法呢？有没有办法login未经处理的exceptionlogging而不使用外部框架？

使用lambdaexpression式处理事件: 我目前有一个页面，声明如下： public partial class MyPage : System.Web.UI.Page { protected void Page_Load(object sender, EventArgs e) { //snip MyButton.Click += (o, i) => { //snip } } } 我只是最近才从1.1版本移植到.NET 3.5，所以我习惯于在Page_Load之外编写事件处理程序。我的问题是是否有任何性能缺陷或缺陷，我应该留意当使用lambda方法呢？我更喜欢它，因为它确实更简洁，但我不想牺牲性能来使用它。谢谢。