博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
使用System.Diagnostics.Stopwatch对程序的运行时间精确地测量
阅读量:6223 次
发布时间:2019-06-21

本文共 4286 字,大约阅读时间需要 14 分钟。

介绍

    每个使用System.Diagnostics命名空间下的Stopwatch类做性能优化的人迟早会遇到一些麻烦。每个人都可以看到了,在同一台电脑相同功能的测试在运行时间上会有25% -30%不同。本文介绍如何使用Stopwatch类设计单线程测试程序获得0.1% - 0.2%准确性。有了这个精度,算法才可以进行测试和比较。

背景

    现代CPU有多个内核,大容量高速缓存,指令管道和许多其他的东西影响特定测试场景一个算法的运行时间。白盒测试技术-如附加的调试器或者分析器-关闭CPU的高速缓存线路,管道等。真正的运行时间是隐藏的,这样这些现代超标量处理器优化的计算方法执行速度要比使用分析器的没有优化的还要慢(由于更多的指令)。黑盒测试没有附加的调试器或分析器(运行时间测量),能发现算法的实际性能,并完成了算法的性能分析。

设置测试方案

    最重要的是防止CPU内核或处理器之间的切换。对性能测试有很大的影响。这可以通过设置进程的ProcessorAffinity来实现:

Process.GetCurrentProcess().ProcessorAffinity 
=
 
new
 IntPtr(
2
); 
//
 Use only the second core 

    为了能独占CPU内核,我们必须防止其他线程可以使用此CPU内核。我们设置进程和线程的优先级,来实现这一目标:

Process.GetCurrentProcess().PriorityClass 
=
 ProcessPriorityClass.High;
Thread.CurrentThread.Priority 
=
 ThreadPriority.Highest;

    最后,但并非不重要的,在我们的测试需要热身阶段。在我的系统中,1000-1500毫秒热身阶段之后结果是稳定的。我们可以用stopwatch自己来控制热身(这里至少1200mS):

stopwatch.Start();
while
 (stopwatch.ElapsedMilliseconds 
<
 
1200
)
{
    result 
=
 TestFunction(seed, count); 
}
stopwatch.Stop(); 

    下面是完整的示例:

using
 System;
using
 System.Diagnostics;
using
 System.Threading;
namespace
 PreciseMeasure
{
    
class
 Program
    {
        
static
 
void
 Main(
string
[] args)
        {
            Stopwatch stopwatch 
=
 
new
 Stopwatch();
            
long
 seed 
=
 Environment.TickCount;     
//
 Prevents the JIT Compiler 
                    
//
 from optimizing Fkt calls away
            
long
 result 
=
 
0
;
            
int
 count 
=
 
100000000
;
            Console.WriteLine(
"
20 Tests without correct preparation
"
); 
            Console.WriteLine(
"
Warmup
"
);
            
for
 (
int
 repeat 
=
 
0
; repeat 
<
 
20
++
repeat)
            {
                stopwatch.Reset();
                stopwatch.Start();
                result 
^=
 TestFunction(seed, count);
                stopwatch.Stop();
                Console.WriteLine(
"
Ticks: 
"
 
+
 stopwatch.ElapsedTicks 
+
 
                
"
 mS: 
"
 
+
stopwatch.ElapsedMilliseconds);
            }
            // Uses the second Core or Processor for the Test
            Process.GetCurrentProcess().ProcessorAffinity 
=
 
new
 IntPtr(
2
); 
            // Prevents "Normal" processes 
            // from interrupting Threads
            Process.GetCurrentProcess().PriorityClass 
=
 ProcessPriorityClass.High;     
            // Prevents "Normal" Threads 
            
Thread.CurrentThread.Priority 
=
 ThreadPriority.Highest;     
                    
            //
 from interrupting this thread
            Console.WriteLine();
            Console.WriteLine();
            Console.WriteLine(
"
20 Tests with correct preparation
"
); 
            Console.WriteLine(
"
Warmup
"
);
            stopwatch.Reset();
            stopwatch.Start();
            
while
 (stopwatch.ElapsedMilliseconds 
<
 
1200
)  
//
 A Warmup of 1000-1500 mS 
                                                          
//
 stabilizes the CPU cache and pipeline.
            {
                result 
=
 TestFunction(seed, count);       
//
 Warmup
            }
            stopwatch.Stop();
            
for
 (
int
 repeat 
=
 
0
; repeat 
<
 
20
++
repeat)
            {
                stopwatch.Reset();
                stopwatch.Start();
                result 
^=
 TestFunction(seed, count);
                stopwatch.Stop();
                Console.WriteLine(
"
Ticks: 
"
 
+
 stopwatch.ElapsedTicks 
+
 
                
"
 mS: 
"
 
+
 stopwatch.ElapsedMilliseconds);
            }
            Console.WriteLine(result); 
//
 prevents optimizations (current compilers are 
        
//
 too silly to analyze the dataflow that deep, but we never know )
        }
        
public
 
static
 
long
 TestFunction(
long
 seed, 
int
 count)
        {
            
long
 result 
=
 seed;
            
for
 (
int
 i 
=
 
0
; i 
<
 count; 
++
i)
            {
                result 
^=
 i 
^
 seed; 
//
 Some useless bit operations
            }
            
return
 result;
        }
    }
}

结果:

没有正确的准备

  1. Ticks: 1580367 mS: 572 <-- highest Value
  2. Ticks: 1577003 mS: 571
  3. Ticks: 1576140 mS: 571
  4. Ticks: 1560964 mS: 565
  5. Ticks: 1351663 mS: 489
  6. Ticks: 1248383 mS: 452
  7. Ticks: 1115361 mS: 404
  8. Ticks: 1112813 mS: 403
  9. Ticks: 1113112 mS: 403
  10. Ticks: 1112012 mS: 402 <-- lowest Value
  11. Ticks: 1330444 mS: 482
  12. Ticks: 1558493 mS: 564
  13. Ticks: 1501097 mS: 543
  14. Ticks: 1517796 mS: 549
  15. Ticks: 1542712 mS: 558
  16. Ticks: 1574959 mS: 570
  17. Ticks: 1483975 mS: 537
  18. Ticks: 1390578 mS: 503
  19. Ticks: 1546904 mS: 560
  20. Ticks: 1349507 mS: 488

运行时间在402ms572ms之间不等。存在170 mS 或者42%差距。很显然,这些结果是没有用的。

正确的准备:

  1. Ticks: 1110518 mS: 402
  2. Ticks: 1110540 mS: 402
  3. Ticks: 1110543 mS: 402
  4. Ticks: 1110684 mS: 402 <-- highest Value
  5. Ticks: 1110508 mS: 402
  6. Ticks: 1110553 mS: 402
  7. Ticks: 1110600 mS: 402
  8. Ticks: 1110433 mS: 402 <-- lowest Value
  9. Ticks: 1110509 mS: 402
  10. Ticks: 1110508 mS: 402
  11. Ticks: 1110489 mS: 402
  12. Ticks: 1110568 mS: 402
  13. Ticks: 1110503 mS: 402
  14. Ticks: 1110566 mS: 402
  15. Ticks: 1110625 mS: 402
  16. Ticks: 1110474 mS: 402
  17. Ticks: 1110571 mS: 402
  18. Ticks: 1110448 mS: 402
  19. Ticks: 1110555 mS: 402
  20. Ticks: 1110495 mS: 402

    有20个相同的结果:402 ms ,只能用tick(内部CPU性能计数器值)分辨。测试结果存在251tick或者0,02 %差距。在我的系统中,Stopwatch的频率是每秒2760029 tick。测试之间的运行差别只有0,09毫秒。这用于衡量和比较算法运行是非常好的。

兴趣点:

    其中一个很重要的事情应该牢记。没有做准备的最好(最低)结果值还没有做了准备的最差结果值好。CPU的上下文和核心交换对应用程序运行会产生巨大影响。

英文版:

本文转自麒麟博客园博客,原文链接:http://www.cnblogs.com/zhuqil/archive/2010/03/01/stopwatch-measure-precise.html,如需转载请自行联系原作者

你可能感兴趣的文章
OpenCV 图片人脸检测
查看>>
数据结构与算法-链表(下)
查看>>
[基础] JavaScript 类型转换及面试题
查看>>
Javascript设计模式
查看>>
手机/移动前端开发需要注意的20个要点
查看>>
高级单例模式:(利用自执行函数,可以通过return暴露私有变量,方法或者是通过window.方式暴露私有变量和方法)...
查看>>
iOS基于WebSocket的聊天机制(转)
查看>>
Nodejs文件上传
查看>>
关于v-for的一点小总结
查看>>
Nest.js 4.6.6 发布,更优雅的下一代 Node.js 开发框架
查看>>
CSS盒模型与BFC
查看>>
JS事件循环EventLoop初探
查看>>
Mac开发环境配置
查看>>
Telegram源码之安卓客户端配置
查看>>
Java精讲:生产者-消费者
查看>>
磊哥测评之数据库SaaS篇:腾讯云控制台、DMC和小程序
查看>>
JS中定时器线程理解
查看>>
记一次PMML文件的处理过程
查看>>
阿里云移动端播放器高级功能---视频下载
查看>>
后端_计算机网络
查看>>