除其他外,调用规范中有两种类型-stdcall和cdecl。我对它们有一些问题:
- 当调用一个cdecl函数时,调用者如何知道是否应该释放堆栈?在调用点,调用者是否知道被调用的函数是cdecl还是stdcall函数?它是如何工作的?调用者如何知道是否应该释放堆栈?还是链接器有责任?
- 如果一个声明为stdcall的函数调用一个具有cdecl调用约定的函数(或者反过来),是否合适?
- 通常来说,我们可以说哪个调用更快-cdecl还是stdcall?
除其他外,调用规范中有两种类型-stdcall和cdecl。我对它们有一些问题:
Raymond Chen提供了一个很好的概述,介绍了__stdcall
和__cdecl
的作用。
(1) 调用者“知道”在调用函数后清理堆栈,因为编译器知道该函数的调用约定并生成必要的代码。
void __stdcall StdcallFunc() {}
void __cdecl CdeclFunc()
{
// The compiler knows that StdcallFunc() uses the __stdcall
// convention at this point, so it generates the proper binary
// for stack cleanup.
StdcallFunc();
}
调用约定可能不匹配, 就像这样:
LRESULT MyWndProc(HWND hwnd, UINT msg,
WPARAM wParam, LPARAM lParam);
// ...
// Compiler usually complains but there's this cast here...
windowClass.lpfnWndProc = reinterpret_cast<WNDPROC>(&MyWndProc);
很多代码示例都做错了,这甚至不好笑。应该像这样:
// CALLBACK is #define'd as __stdcall
LRESULT CALLBACK MyWndProc(HWND hwnd, UINT msg
WPARAM wParam, LPARAM lParam);
// ...
windowClass.lpfnWndProc = &MyWndProc;
__cdecl
是Visual C++编译器中C和C++程序的默认设置,而WinAPI函数使用__stdcall
约定。CDECL 调用约定会将参数按照相反的顺序压入栈中,调用方会清除栈,并通过寄存器 A 返回结果。STDCALL 调用约定与此不同,调用方不会清除栈,而是由被调用方清除。
你想知道哪一种调用约定更快。其实都不一定比另外一种更快。只要可以使用本地调用约定,就应该使用本地调用约定。只有当使用需要特定调用约定的外部库时,才应该改变调用约定。
此外,编译器可能会选择其他默认调用约定,例如 Visual C++ 编译器使用 FASTCALL,因为它更多地使用了处理器寄存器,理论上更快。
通常必须为传递给某些外部库的回调函数提供正确的调用约定签名,例如从 C 库到 qsort
的回调必须使用 CDECL(如果编译器默认使用其他约定,则必须标记回调为 CDECL),或者各种 WinAPI 回调必须使用 STDCALL(整个 WinAPI 都使用 STDCALL)。
另一个常见情况是当您存储指向某些外部函数的指针时,例如要创建指向 WinAPI 函数的指针,其类型定义必须标记为 STDCALL。
下面是一个示例,展示了编译器如何执行:
/* 1. calling function in C++ */
i = Function(x, y, z);
/* 2. function body in C++ */
int Function(int a, int b, int c) { return a + b + c; }
CDECL:
/* 1. calling CDECL 'Function' in pseudo-assembler (similar to what the compiler outputs) */
push on the stack a copy of 'z', then a copy of 'y', then a copy of 'x'
call (jump to function body, after function is finished it will jump back here, the address where to jump back is in registers)
move contents of register A to 'i' variable
pop all from the stack that we have pushed (copy of x, y and z)
/* 2. CDECL 'Function' body in pseudo-assembler */
/* Now copies of 'a', 'b' and 'c' variables are pushed onto the stack */
copy 'a' (from stack) to register A
copy 'b' (from stack) to register B
add A and B, store result in A
copy 'c' (from stack) to register B
add A and B, store result in A
jump back to caller code (a, b and c still on the stack, the result is in register A)
STDCALL:
/* 1. calling STDCALL in pseudo-assembler (similar to what the compiler outputs) */
push on the stack a copy of 'z', then a copy of 'y', then a copy of 'x'
call
move contents of register A to 'i' variable
/* 2. STDCALL 'Function' body in pseaudo-assembler */
pop 'a' from stack to register A
pop 'b' from stack to register B
add A and B, store result in A
pop 'c' from stack to register B
add A and B, store result in A
jump back to caller code (a, b and c are no more on the stack, result in register A)
我注意到有人发布文章称,如果从 __stdcall
到 __cdecl
或者从 __cdecl
到 __stdcall
调用函数是无关紧要的。但实际上是有区别的。
原因在于,对于 __cdecl
,被调用函数的参数由调用函数从栈中移除;而对于 __stdcall
,被调用函数自己从栈中移除其参数。如果你使用 __stdcall
调用一个 __cdecl
函数,则栈不会被清空,因此当 __cdecl
使用基于栈的引用来处理参数或返回地址时,它将使用当前栈指针处的旧数据。如果你使用 __cdecl
调用一个 __stdcall
函数,那么 __stdcall
将清空栈上的参数,然后 __cdecl
再次清空栈,可能会删除调用函数的返回信息。
微软的 C 函数惯例通过修改名称来避免这种问题。 __cdecl
函数以下划线为前缀。 __stdcall
函数以下划线为前缀并以“@”符号和需要移除的字节数结尾。例如,__cdecl f(x)
链接为 _f
,__stdcall f(int x)
链接为 _f@4
,其中 sizeof(int)
是 4 字节。
如果你成功通过了链接器,那么就可以享受调试时的困扰了。
__stdcall
函数作为__cdecl
函数调用,而不是从__cdecl
函数中调用。例如,__stdcall foo(int x)
可以编写为调用printf
。您的答案是正确的,除了第一段陈述与另一件事不同的不同意见。 >.< - Peter Cordesret
指令弹出(在这种情况下会使用ret 12
),一下子跳回调用者并同时从堆栈中弹出'a','b'和'c'。STDCALL:
/* 1. calling STDCALL in pseudo-assembler (similar to what the compiler outputs) */
push on the stack a copy of 'z', then copy of 'y', then copy of 'x'
call
move contents of register A to 'i' variable
/* 2. 在伪汇编语言中,STDCALL '函数'主体 */ 将堆栈中的'a'复制到寄存器A中 将堆栈中的'b'复制到寄存器B中 将A和B相加,并将结果存储在A中 将堆栈中的'c'复制到寄存器B中 将A和B相加,并将结果存储在A中 跳转回调用者代码,同时从堆栈中弹出'a'、'b'和'c'(在这一步中,a、b和c从堆栈中移除,结果存储在寄存器A中)
这在函数类型中有明确规定。当你拥有一个函数指针时,如果没有明确指定为stdcall,那么就默认为cdecl。这意味着,如果你有一个stdcall指针和一个cdecl指针,你不能互换它们。两种函数类型可以相互调用而不会出现问题,只是在期望的类型上可能会出现问题。至于速度,它们都扮演同样的角色,只是在稍微不同的位置上,这真的不重要。
呼叫者和被呼叫者在调用点必须使用相同的约定 - 这是它能够可靠工作的唯一方式。呼叫者和被呼叫者都遵循预定义的协议 - 例如,谁需要清理堆栈。如果协议不匹配,您的程序会遇到未定义行为 - 可能只是崩溃得非常惊人。
每个调用点才需要这样做 - 调用代码本身可以是任何调用约定的函数。
您不应该在这些约定之间注意到任何真正的性能差异。如果这成为问题,通常需要减少调用次数 - 例如,更改算法。
这些东西是编译器和平台特定的。C和C++标准除了在C++中的extern "C"
之外,没有关于调用约定的任何规定。
调用者如何知道是否应该释放堆栈?
调用者知道函数的调用约定并相应地处理调用。
在调用现场,调用者是否知道被调用的函数是cdecl还是stdcall函数?
是的。
它是如何工作的?
这是函数声明的一部分。
调用者如何知道是否应该释放堆栈?
调用者知道调用约定并可以相应地采取行动。
或者这是链接器的责任吗?
不是,调用约定是函数声明的一部分,因此编译器知道它需要知道的所有内容。
如果一个声明为stdcall的函数调用一个具有cdecl调用约定的函数(或反过来),这是否不合适?
不是。为什么会呢?
一般来说,我们可以说哪个调用会更快 - cdecl 还是 stdcall?调用约定与C/C++编程语言无关,而是关于编译器如何实现给定语言的具体细节。如果您始终使用相同的编译器,则无需担心调用约定。
然而,有时我们希望由不同编译器编译的二进制代码能够正确地互操作。这时我们需要定义一些称为应用程序二进制接口(ABI)的东西。ABI定义了编译器将C/C++源代码转换为机器码的方式。这将包括调用约定、名称重整和虚函数表布局。cdelc和stdcall是在x86平台上常用的两种不同的调用约定。
通过将调用约定信息放入源头文件中,编译器将知道需要生成什么代码才能与给定的可执行文件正确地互操作。