memset如何通过-1来初始化整数数组？

Question

memset如何通过-1来初始化整数数组？

66

manpage中关于memset的说明：

#include <string.h>
void *memset(void *s, int c, size_t n)
The memset() function fills the first n bytes of the memory area pointed to by s with the constant byte c.

很明显，memset 不能用于像下面展示的初始化 int 数组：

int a[10];
memset(a, 1, sizeof(a));

这是因为int类型使用4个字节来表示（假设），在数组a中无法得到所需的整数值。
但我经常看到程序员使用memset函数将int数组元素设置为0或-1。

int a[10];
int b[10];
memset(a, 0, sizeof(a));  
memset(b, -1, sizeof(b));

据我的理解，使用整数0进行初始化是可以的，因为0可以用1字节表示（在这种情况下可能我是错误的）。但如何将b初始化为-1（一个4字节的值）呢？

- haccks

你对使用0进行初始化的原因有些错误。这样做是可以的，因为0适合于unsigned char（所以在作为memset的第二个参数时不会被截断），并且因为sizeof(int)字节零的位模式与sizeof(int)个一字节零的位模式相同。这两个条件必须同时满足才能起作用。实际上，在二进制补码算术中，只有两个数字符合这些条件：0和-1。 - zwol

@zwol：嗯？第一句话提到了零，因此对于-1来说并不是字面上的真实情况。所以你可能想要隐含地给第一句话加上参数：如果一个int类型的值x的位与一个sizeof(int)个unsigned char类型的值相同，且这些unsigned char类型的值都等于x，那么它就适用于x。此外，我们必须将值为x的unsigned char视为从x转换而来，因为-1无法表示。如果是这样的话，那么0和-1并不是唯一的这样的值。16,843,009 • x适用于任何整数0 ≤ x < 256。（16,843,009是十六进制1010101）。 - Eric Postpischil

@EricPostpischil 哦，你依赖于对 memset 的第二个参数的内部截断。我认为这是作弊，因为如果不考虑与传统 C 的向后兼容性，memset 将采用 unsigned char 第二个参数。 - zwol

@zwol：但是您使用了-1。memset需要一个int，将其转换为unsigned char，并将其复制到每个字节中。-1不能表示为“unsigned char”；它会被转换为UCHAR_MAX。因此，如果您允许，那么0x34343434（或类似值，对于更大的字节C实现）将以同样的方式工作。 - Eric Postpischil

1

@zwol：memset是基于unsigned char定义的。在发布的问题或C规范中不存在signed char或char。 - Eric Postpischil

显示剩余4条评论

2个回答

8

当一个数字的所有位都是`0`时，它的值也为0。但是，如果所有位都是`1`，那么该值为-1。

如果我们写int a[2]，将分配4x2字节的内存，其中包含随机/垃圾位-

00110000 00100101 11100011 11110010    11110101 10001001 00111000 00010001

然后，我们写下memset(a, 0, sizeof(a))。现在，memset()按字节处理，一个字节的表示形式(unsigned char)为0是00000000。因此，它变成-

00000000 00000000 00000000 00000000    00000000 00000000 00000000 00000000

因此，a[0]和a[1]都被初始化为0。

现在，让我们看一下 memset(a, -1, sizeof(a))：一个字节的-1是11111111。最终结果如下：

11111111 11111111 11111111 11111111    11111111 11111111 11111111 11111111

在这里，a [0] 和 a [1] 的值都将是 -1 。

然而，对于memset（a，1，sizeof（a））：字节中的 1 是00000001 -

00000001 00000001 00000001 00000001    00000001 00000001 00000001 00000001

因此，该值将为- 16843009。

- Minhas Kamal

void *memset( void *dest, int ch, size_t count ); => 将值 ch（转换为 unsigned char 后）复制到指向 dest 对象的前 count 个字符中。 - Minhas Kamal

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Sergey Kalinichenko · Accepted Answer

奇怪的是，使用-1的原因与使用零的原因完全相同：在二进制补码表示法中，无论整数的大小如何，-1的所有位都是1，因此填充一个区域的字节与所有1的产生的结果是一个由-1有符号的int、long和short组成的区域，在二进制补码硬件上工作时。

在与二进制补码不同的硬件上，结果将会有所不同。-1整数常量将转换为一个unsigned char，该字符为全部为1。因为标准规定了转换的具体操作方式。然而，一个所有位都被设置为1的字节区域将根据平台的规则被解释为整数值。例如，在分别处理正负号的硬件上，数组的所有元素都将包含相应类型的最小负值。

memset如何通过-1来初始化整数数组？

当一个数字的所有位都是0时，它的值也为0。但是，如果所有位都是1，那么该值为-1。

当一个数字的所有位都是`0`时，它的值也为0。但是，如果所有位都是`1`，那么该值为-1。