在结构体上使用"new"关键字会将其分配到堆还是栈上？

Question

在结构体上使用"new"关键字会将其分配到堆还是栈上？

c#.netmemory-management

310

当你使用new操作符创建一个类的实例时，内存会在堆上分配。如果你使用new操作符创建一个结构体的实例，内存会分配在哪里？是在堆上还是在栈上？

当你使用new操作符创建一个结构体的实例时，内存会被分配在堆上。

- kedar kamthe

8个回答

45

根据情况，结构体字段所在的内存可以分配在堆栈或堆上。如果结构体类型的变量是本地变量或参数，并且不被某些匿名委托或迭代器类所捕获，则它将在堆栈上分配。如果变量是某个类的一部分，则将在堆上的类中分配。

如果结构体在堆上分配，则实际上不需要调用 new 运算符来分配内存。唯一的目的是根据构造函数中的值设置字段值。如果未调用构造函数，则所有字段都将获取其默认值（0 或 null）。

对于在堆栈上分配的结构体也是同样的，除了C#要求先设置局部变量的值后再使用，因此您必须调用自定义构造函数或默认构造函数（始终为结构体提供不带参数的构造函数）。

- Jeffrey L Whitledge

14

简单来说，对于struct而言，“new”是一个错误的术语，调用“new”实际上只是调用了构造函数。结构体唯一的存储位置就是它的定义位置。

如果它是一个成员变量，它将直接存储在定义它的对象中，如果它是一个局部变量或参数，它将存储在堆栈中。

与之相比，类在其整体存储在应该存储结构体的地方有一个引用，而这个引用指向堆中某个位置。（成员变量在类内，局部变量/参数在堆栈中）

可能需要深入研究C++，因为在C++中，class和struct之间没有真正的区别。（语言中有类似的名称，但它们只是指事物的默认可访问性）当您调用“new”时，会得到指向堆位置的指针，而如果您有一个非指针引用，则它将直接存储在堆栈中或在其他对象中，如C＃中的结构体。

- Guvante

8

与所有值类型一样，结构体始终在它们被声明的位置。
有关何时使用结构体的更多详细信息，请参见此处的问题。
以及有关结构体的一些更多信息，请参见此处的问题。
编辑：我错误地回答了它们总是在堆栈中。这是不正确的。

- Esteban Araya

1

不，我认为这是完全正确的 - 即使它与引用类型不同。变量的值存在于它声明的位置。引用类型变量的值是一个引用而不是实际数据，仅此而已。 - Jon Skeet

总之，无论何时您在方法中创建（声明）值类型，它都会始终在堆栈上创建。 - Ash

@Ash（最近）：false；如果变量被“捕获”（进入lambda/匿名方法），那么它实际上是编译器生成类的字段，即在堆上。 - Marc Gravell

2

Jon，你没有理解我的观点。这个问题首先被提出的原因是许多开发人员（包括我在内，直到我读了CLR Via C#）不清楚如果使用new运算符创建结构体，它会被分配到哪里。说“结构体总是去它们声明的地方”并不是一个清晰的答案。 - Ash

1

@Ash：如果我有时间，到了工作地点我会尝试写一篇答案。不过这个话题太大了，在火车上讨论不太方便:) - Jon Skeet

显示剩余8条评论

3

我可能在这里漏掉了什么，但我们为什么关心分配？

值类型是按值传递的 ;) 因此不能在定义它们的范围之外的不同范围中进行变异。要能够变异该值，必须添加 [ref] 关键字。

引用类型是按引用传递的，可以进行变异。

当然也有不可变的引用类型，其中字符串是最受欢迎的一种。

数组布局/初始化：值类型 -> 零内存 [name,zip][name,zip] 引用类型 -> 零内存 -> 空 [ref][ref]

- user18579

5

引用类型并不是通过引用传递的，而是通过值传递的。这是非常不同的。 - Jon Skeet

引用是按值传递的，这里指的是一个引用（但这与通过引用传递 ref 类型不同）。 - user1234567

2

一个 class 或 struct 声明就像一个蓝图，用于在运行时创建实例或对象。如果你定义了一个名为 Person 的 class 或 struct，Person 就是该类型的名称。如果你声明并初始化一个类型为 Person 的变量 p，那么 p 就被称为 Person 的对象或实例。可以创建多个相同 Person 类型的实例，每个实例的 properties 和 fields 可以有不同的值。 class 是引用类型。当创建 class 的对象时，分配给对象的变量只保存对该内存的引用。当对象引用分配给新变量时，新变量引用原始对象。通过一个变量所做的更改会反映在另一个变量中，因为它们都引用相同的数据。 struct 是值类型。创建 struct 时，分配给 struct 的变量保存结构的实际数据。当 struct 分配给新变量时，它会被复制。因此，新变量和原变量包含两个单独的相同数据的副本。对一个副本所做的更改不会影响另一个副本。

一般来说，classes 用于模拟更复杂的行为或在创建 class 对象后打算修改的数据。Structs 最适合包含主要不打算在创建 struct 后修改的数据的小型数据结构。更多信息...

- Sujit

1

结构体被分配到堆栈中。这里有一个有用的解释：

结构体

此外，在.NET中实例化的类会在堆或.NET保留的内存空间上分配内存。而结构体由于在堆栈上分配，因此在实例化时产生更高的效率。此外，应注意通过值传递结构体中的参数。

- DaveK

7

这并不包括结构体是类的一部分的情况 - 这时它与对象的其他数据一起存在于堆上。 - Jon Skeet

1

是的，但它实际上关注并回答了被问的问题。被投票赞同。 - Ash

1

尽管仍然不正确和具有误导性，但这个问题没有简短的答案 - Jeffrey的回答是唯一完整的答案。 - Marc Gravell

1

基本上，被视为值类型的结构体会分配在堆栈上，而对象则分配在堆上，而对象引用（指针）则分配在堆栈上。

- bashmohandes

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Jon Skeet · Accepted Answer

好的，让我们看看能否更清晰地解释一下。

首先，Ash是对的：问题不在于值类型“变量”分配在哪里。那是一个不同的问题，答案不仅仅是“在栈上”。它比那更复杂（而且由C# 2更加复杂）。我有一篇关于这个主题的文章，如果需要，我会进一步扩展它，但现在只处理new运算符。

其次，所有这些都取决于你所讨论的级别。我正在研究编译器如何处理源代码，以及它创建的中间语言（IL）。很有可能JIT编译器会通过优化掉相当多的“逻辑”分配来做出聪明的事情。

第三，我忽略了泛型，主要是因为我实际上不知道答案，并且部分原因是它会使事情变得太复杂。

最后，所有这些都只是当前实现。C#规范没有指定大部分内容-它实际上是实现细节。有人认为托管代码开发人员真的不应该关心这些。我不确定我会走得那么远，但值得想象一个世界，在这个世界里，实际上所有本地变量都存储在堆上-这仍然符合规范。

使用值类型的new运算符有两种不同情况：您可以调用无参数构造函数（例如new Guid()）或带参数的构造函数（例如new Guid(someString)）。它们生成显着不同的IL。要理解原因，您需要比较C#和CLI规范：根据C#，所有值类型都有无参数构造函数。根据CLI规范，没有值类型有无参数构造函数（尝试使用反射获取值类型的构造函数-您找不到无参数构造函数）。

对于C#来说，将“使用零初始化值”视为构造函数是有意义的，因为它保持了语言的一致性-您可以将new(...)视为始终调用构造函数。对于CLI来说，将其视为不同的东西也是有意义的，因为没有真正的代码可供调用-当然也没有类型特定的代码。

你打算在初始化之后做什么也很重要。用于它的IL取决于您是否将其传递给方法，或者是否将其存储在本地变量中以备稍后使用。因为值类型通常很小，所以不必担心大对象堆（LOH）的问题。

Guid localVariable = new Guid(someString);

与用于以下的IL不同:

myInstanceOrStaticVariable = new Guid(someString);

此外，如果该值用作中间值，例如方法调用的参数，则情况又略有不同。为了展示所有这些差异，这里有一个简短的测试程序。它没有显示静态变量和实例变量之间的区别：IL 将在 stfld 和 stsfld 之间不同，但仅此而已。

using System;

public class Test
{
    static Guid field;

    static void Main() {}
    static void MethodTakingGuid(Guid guid) {}


    static void ParameterisedCtorAssignToField()
    {
        field = new Guid("");
    }

    static void ParameterisedCtorAssignToLocal()
    {
        Guid local = new Guid("");
        // Force the value to be used
        local.ToString();
    }

    static void ParameterisedCtorCallMethod()
    {
        MethodTakingGuid(new Guid(""));
    }

    static void ParameterlessCtorAssignToField()
    {
        field = new Guid();
    }

    static void ParameterlessCtorAssignToLocal()
    {
        Guid local = new Guid();
        // Force the value to be used
        local.ToString();
    }

    static void ParameterlessCtorCallMethod()
    {
        MethodTakingGuid(new Guid());
    }
}

这是该类的IL代码，不包括不相关的部分（如nops）：

.class public auto ansi beforefieldinit Test extends [mscorlib]System.Object    
{
    // Removed Test's constructor, Main, and MethodTakingGuid.

    .method private hidebysig static void ParameterisedCtorAssignToField() cil managed
    {
        .maxstack 8
        L_0001: ldstr ""
        L_0006: newobj instance void [mscorlib]System.Guid::.ctor(string)
        L_000b: stsfld valuetype [mscorlib]System.Guid Test::field
        L_0010: ret     
    }

    .method private hidebysig static void ParameterisedCtorAssignToLocal() cil managed
    {
        .maxstack 2
        .locals init ([0] valuetype [mscorlib]System.Guid guid)    
        L_0001: ldloca.s guid    
        L_0003: ldstr ""    
        L_0008: call instance void [mscorlib]System.Guid::.ctor(string)    
        // Removed ToString() call
        L_001c: ret
    }

    .method private hidebysig static void ParameterisedCtorCallMethod() cil  managed    
    {   
        .maxstack 8
        L_0001: ldstr ""
        L_0006: newobj instance void [mscorlib]System.Guid::.ctor(string)
        L_000b: call void Test::MethodTakingGuid(valuetype [mscorlib]System.Guid)
        L_0011: ret     
    }

    .method private hidebysig static void ParameterlessCtorAssignToField() cil managed
    {
        .maxstack 8
        L_0001: ldsflda valuetype [mscorlib]System.Guid Test::field
        L_0006: initobj [mscorlib]System.Guid
        L_000c: ret 
    }

    .method private hidebysig static void ParameterlessCtorAssignToLocal() cil managed
    {
        .maxstack 1
        .locals init ([0] valuetype [mscorlib]System.Guid guid)
        L_0001: ldloca.s guid
        L_0003: initobj [mscorlib]System.Guid
        // Removed ToString() call
        L_0017: ret 
    }

    .method private hidebysig static void ParameterlessCtorCallMethod() cil managed
    {
        .maxstack 1
        .locals init ([0] valuetype [mscorlib]System.Guid guid)    
        L_0001: ldloca.s guid
        L_0003: initobj [mscorlib]System.Guid
        L_0009: ldloc.0 
        L_000a: call void Test::MethodTakingGuid(valuetype [mscorlib]System.Guid)
        L_0010: ret 
    }

    .field private static valuetype [mscorlib]System.Guid field
}

正如您所看到的，有许多不同的指令用于调用构造函数：

newobj：在堆栈上分配值，并调用参数化构造函数。用于中间值，例如赋值给字段或用作方法参数。
call instance：使用已分配的存储位置（无论是否在堆栈上）。在上面的代码中用于分配给局部变量。如果使用几个new调用多次分配相同的局部变量，则它只是在旧值的顶部初始化数据-每次都不会分配更多的堆栈空间。
initobj：使用已分配的存储位置，只是擦除数据。这用于我们所有的无参数构造函数调用，包括那些分配给局部变量的调用。对于方法调用，实际上引入了一个中间局部变量，并通过initobj清除其值。

我希望这说明了这个主题是多么复杂，同时也使它变得更加容易理解。在某些概念意义上，每次对new的调用都会在堆栈上分配空间-但正如我们所看到的，在IL级别上并不是这样发生的。我想强调一种特殊情况。看这个方法：

void HowManyStackAllocations()
{
    Guid guid = new Guid();
    // [...] Use guid
    guid = new Guid(someBytes);
    // [...] Use guid
    guid = new Guid(someString);
    // [...] Use guid
}

这个“逻辑上”有4个堆栈分配——一个用于变量，另外三个用于每个new调用——但实际上（对于特定的代码）堆栈只分配一次，然后重复使用相同的存储位置。

编辑：为了明确起见，这只在某些情况下成立……特别是，如果Guid构造函数引发异常，则guid的值不可见，这就是为什么C#编译器能够重用相同的堆栈插槽。有关详细信息和不能应用的情况，请参阅Eric Lippert关于值类型构造的博客文章。

在编写本答案时，我学到了很多东西——如果有不清楚的地方，请要求澄清！