malloc()
和free()
的性能问题知之甚少。我的问题是:如果我在一个循环内部调用malloc()
然后再调用free()
,这个循环会比在循环外部调用free()
运行得更慢吗?假设这个循环需要执行20次。实际上,我正在使用第一种方法来为缓冲区分配内存,从文件中读取可变长度的字符串,进行一些字符串操作,然后在每次迭代结束后清空缓冲区。如果我的方法产生了大量开销,那么我想请教有没有更好的方法来达到相同的结果。
malloc()
和free()
的性能问题知之甚少。我的问题是:如果我在一个循环内部调用malloc()
然后再调用free()
,这个循环会比在循环外部调用free()
运行得更慢吗?假设这个循环需要执行20次。肯定会更慢。(但请记住你需要平衡malloc
和free
的次数,否则可能会导致内存泄漏。)
如果长度变化,您可以使用realloc
来扩展缓冲区大小。
void* v = malloc(1024);
size_t bufsize = 1024;
while(cond) {
size_t reqbufsize = get_length();
if (reqbufsize > bufsize) {
bufsize = reqbufsize * 2;
v = realloc(v, bufsize);
}
// you may shrink it also.
do_something_with_buffer(v);
}
free(v);
bufsize = reqbufsize * 2;
有点过分吗? :P - Billy ONeal如果你在调用malloc内存分配函数时,不能在循环外部调用free释放内存:
char * buffer;
for (int i = 0; i < num_files; i++) {
buffer = malloc(proper_length(i));
// do some things with buffer
}
free(buffer);
num_files
次 malloc,但只释放了一次 - 你泄漏了除最后一个以外的所有内存!char * buffer = NULL;
for (int i = 0; i < num_files; i++) {
buffer = realloc(proper_length(i));
// do some things with buffer
}
free(buffer);
在前20次迭代中,您不必担心malloc/free的性能。
即使进行更多迭代(数个数量级),在分析代码并了解哪些内容较慢之前,也不应开始考虑优化。
最后,如果您要释放缓冲区,就没有必要先清除它。即使您将malloc/free移至循环外部(使用Justin建议的最大缓冲区),也不需要显式清除缓冲区。
如果您知道缓冲区的最大长度,或者可以设置一个合理的最大长度,则可以在每次迭代中使用相同的缓冲区。否则,您目前的做法应该是可行的。
这取决于您需要缓冲区的用途。
您是否真的需要在每次迭代后清除它,或者仅使用\0
字符标记字符串的结尾即可?毕竟这就是各种str
库调用的方式。
如果您确实需要清除它,可以使用bzero()
。每次迭代都进行malloc和free是浪费资源的,因为您可以愉快地重复使用缓冲区。
如果您要并行化for循环(即有多个并发线程使用它),则会出现不同的问题。
简单的现实例子:使用桶来运输水。假设您需要多次使用该桶:拿起它,使用它,放下它,再次拿起它,使用它等等...是否有意义?您可以尽可能多地重复使用桶。 另一方面,如果需要其他人使用该桶,则需要组织访问该桶或需要更多的桶。
最后一个建议:现在不要担心性能问题。他们说早期优化是万恶之源,您很快就会明白为什么。
首先,了解问题:编写可丢弃的代码。试验。
其次,测试它。确保它可以满足您的需求。
第三,优化它。使循环运行一万次并测量所需时间。然后将malloc移动到外面,并再次测量(如果在UNIX下,请使用shell命令time
)。
第四,重新编写代码,因为您的第一个实验很可能是一堆补丁、尝试-重试-不起作用的代码。
反复实践。
附:同时享受乐趣。这应该是有趣的,而不是令人沮丧的。
通常,任何可以移出循环的内容都应该被移出。为什么要重复相同的操作,当你只需要执行一次呢?
Justin Ethier是正确的,分配一个足够容纳最大字符串的缓冲区,并重复使用它。
更好地处理它。这里有一些伪代码:
#define BLOCK_SIZE 1024 // or about the bigger size of your strings.
char *buffer = (char *) malloc(BLOCK_SIZE)
for(int i=0; i<20; i++)
{
while (more bytes left to read)
{
read full string or BLOCK_SIZE bytes at max // most calls work this way
proces bytes in buffer
}
}
free(buffer);
这取决于malloc和free的实现方式。
回答你的问题最好的方法是建立一个基准测试...