per 发表于 2013-8-12 11:36:59

C++库研究笔记[1] Profile->程序执行时间统计

研究nvidia 的cusp 库,可见到这样的代码: view plaincopy



[*]template <typename Array1,                                                                        
[*]380         typename Array2,                                                                     
[*]381       typename ScalarType>                                                                           
[*]382 void axpy(const Array1& x,                                                                              
[*]383         const Array2& y,                                                                  
[*]384         ScalarType alpha)                                                               
[*]385 {                                                                                                
[*]386   CUSP_PROFILE_SCOPED();                                                                        
[*]387   detail::assert_same_dimensions(x, y);                                                            
[*]388   cusp::blas::detail::axpy(x.begin(), x.end(), y.begin(), alpha);                                 
[*]389 }   

view plaincopy



[*]<span style="font-family: Arial, Helvetica, sans-serif;">这一行</span>

view plaincopy



[*]386   CUSP_PROFILE_SCOPED();                                                                        

即为时间统计
参考:
主要:High Performance C++ Profiling :http://floodyberry.wordpress.com/2009/10/07/high-performance-cplusplus-profiling/
clock() 函数相当的严重不准确
Resolution Problems inclock():http://www.guyrutenberg.com/2007/09/10/resolution-problems-in-clock/Profiling Code Using clock_gettime

http://www.guyrutenberg.com/2007/09/22/profiling-code-using-clock_gettime/

页: [1]
查看完整版本: C++库研究笔记[1] Profile->程序执行时间统计