应用位运算符"~"后将"int"转换为"unsigned short"

Question

应用位运算符"~"后将"int"转换为"unsigned short"

13

我使用的静态分析工具对这段代码提出了警告：

uint16 var1 = 1U;
uint16 var2 = ~var1;

我查看了MISRA C 2004的规则，发现了10.5条规定：

如果按位运算符~和<<应用于底层类型为unsigned char或unsigned short的操作数，则结果应立即转换为操作数的底层类型。

好的，这不是问题，隐式转换会被应用（我认为“转换”指的是隐式或显式转换）。但是10.1条规则说：

整数类型的表达式的值，在表达式比较复杂时不得隐式转换为不同的底层类型。

之前的一个复杂操作的例子是：~u16a

我修改了我的代码：

uint16 var1 = 1U;
uint16 var2 = (uint16) ~var1;

我收到了另一个警告：我认为将负值的int转换为unsigned int值不安全。我查看了C99标准（ISO C99）§6.3.1.3，但我不明白int与unsigned short的转换是否已经明确定义。

在EmbeddedGurus 文章中我读到：

c = (unsigned int) a; /* Since a is positive, this cast is safe */

我的问题：

signed int 转换为 unsigned short 是否存在未定义行为？
如果存在，如何在安全的方式下使用补码运算符与 unsigned short?

- no_name

这里有一些很好的答案解释了C语言中的移位运算符如何进行数值提升。 - chouaib

2个回答

5

有符号整数向无符号短整型的显式转换会出现未指定行为吗？从C99草案的第6.3.1.3节"有符号和无符号整数"可以看出，由于模算术的缘故，有符号值向无符号值的转换是经过良好规定的：如果新类型是无符号类型，则通过重复加上或减去新类型中可以表示的最大值加一，直到该值在新类型的范围内。⁴⁹⁾ 因此，在您的情况下，负数将通过反复添加来进行转换：

UMAX + 1

将负结果转换为无符号类型的范围内。

例如，将-1转换为无符号类型总是导致最大的无符号值，因为-1 + UMAX + 1始终为UMAX。

如果可以，如何以安全的方式使用补码运算符和无符号短整数？

应用~运算符时，发生的情况是该值由于应用了操作数的整数提升而被提升为int，这在第6.5.3.3节单目算术运算符中有所涵盖，其中说（我强调）：

对操作数进行整数提升，并且结果具有晋升类型。如果晋升类型是无符号类型，则表达式~E等效于该类型中可表示的最大值减去E。

考虑到引用段落中的最后一句话，也许首先进行unsigned int强制转换可能会导致更直观的结果：

uint16 var2 = ~((unsigned int)var1);

由于需要应用显式转换，因此您最终会得到以下结果：

uint16 var2 = (uint16) ~((unsigned int)var1);

- Shafik Yaghmour

问题在于~1的值取决于int的表示方式（例如，使用补码表示时为-1，在二进制补码下为-2等），因此将其转换为unsigned short时结果也可能不同。 - T.C.

@T.C. 我删除了那个语句，因为你指出它太宽泛了。 - Shafik Yaghmour

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Kerrek SB · Accepted Answer

算术和位运算符的操作数在计算值之前始终遵循标准提升。任何比int类型更短的东西都将被提升为int或unsigned int，具体取决于平台（即取决于int是否能表示正在提升的类型的所有值）。

在您的平台上，uint16_t被标准提升为int，因为您的int可以表示uint16_t的所有值。然后对该int值应用按位取反，这是问题的原因。

为了获得与平台无关的确定性结果，请自己将该值转换为unsigned int：

 uint16_t var2 = (uint16_t) ~((unsigned int) var1);

请注意，这始终是正确的，因为要求unsigned int能够表示uint16_t的所有值。