如何正确地测量时间?(关于C语言)

8
这是一个“算法”,但当我想测量执行时间时,它会显示为零。为什么?
#define ARRAY_SIZE 10000
...

clock_t start, end;

start = clock();

for( i = 0; i < ARRAY_SIZE; i++) 
{
non_parallel[i] = vec[i] * vec[i];
}
end = clock();
printf( "Number of seconds: %f\n", (end-start)/(double)CLOCKS_PER_SEC );

那么,我应该怎样测量时间呢?

2个回答

14

两件事:

  1. 10000 在现代计算机上不算多。因此那个循环可能会在不到一毫秒的时间内运行完毕,这比 clock() 函数的精度还要低。因此它将返回零。

  2. 如果你没有使用 non_parallel 的结果,编译器有可能会优化掉整个循环。

很可能,你只需要一个更昂贵的循环。尝试将 ARRAY_SIZE 增加到更大的值。


这里是在我的机器上使用更大的数组大小进行的测试:

#define ARRAY_SIZE 100000000

int main(){

    clock_t start, end;

    double *non_parallel = (double*)malloc(ARRAY_SIZE * sizeof(double));
    double *vec          = (double*)malloc(ARRAY_SIZE * sizeof(double));

    start = clock();

    for(int i = 0; i < ARRAY_SIZE; i++) 
    {
        non_parallel[i] = vec[i] * vec[i];
    }

    end = clock();
    printf( "Number of seconds: %f\n", (end-start)/(double)CLOCKS_PER_SEC );


    free(non_parallel);
    free(vec);
    return 0;
}

输出:

Number of seconds: 0.446000

5
这种方式并不可靠,因为 clock() 函数的精度相对较低,并且你的循环没有执行足够大量的工作。你可以让循环执行更多的操作以使它运行更长时间,或者使用更好的计时方法。
更高精度的计时方法是依赖于平台的。对于 Windows,请参见 如何使用 QueryPerformanceCounter? ,对于 Linux,请参见 C++ 和 Linux 的高分辨率计时器?

3
不,原帖已经将其中一个操作数转换为“double”类型。 - Mysticial
@Mysticial 我的失误,已经修正了我的回答。 - jli

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接