编译器优化导致代码错误

3
在过去的几个小时中,我一直试图追踪我的程序中的一个错误,这个错误只会在运行发布模式时发生。我已经解决了所有级别为4的编译器警告,并且没有任何未初始化的变量(这通常是我在这种情况下的首要嫌疑对象)。
这是一个难以解释的问题,因为我甚至不知道到底发生了什么,所以请耐心等待。
经过大量调试,我将错误的原因缩小到以下函数的某个地方:
void CModelSubMesh::Update()
{
    ModelSubMesh::Update();

    auto bHasAlphas = (GetAlphaCount() > 0) ? true : false;
    auto bAnimated = (!m_vertexWeights.empty() || !m_weightBoneIDs.empty()) ? true : false;
    if(bHasAlphas == false && bAnimated == false)
        m_glMeshData = std::make_unique<GLMeshData>(m_vertices,m_normals,m_uvs,m_triangles);
    else
    {
        m_glmesh = GLMesh();
        auto bufVertex = OpenGL::GenerateBuffer();
        auto bufUV = OpenGL::GenerateBuffer();
        auto bufNormal = OpenGL::GenerateBuffer();
        auto bufIndices = OpenGL::GenerateBuffer();
        auto bufAlphas = 0;
        if(bHasAlphas == true)
            bufAlphas = OpenGL::GenerateBuffer();

        auto vao = OpenGL::GenerateVertexArray();

        m_glmesh.SetVertexArrayObject(vao);
        m_glmesh.SetVertexBuffer(bufVertex);
        m_glmesh.SetUVBuffer(bufUV);
        m_glmesh.SetNormalBuffer(bufNormal);
        if(bHasAlphas == true)
            m_glmesh.SetAlphaBuffer(bufAlphas);
        m_glmesh.SetIndexBuffer(bufIndices);
        m_glmesh.SetVertexCount(CUInt32(m_vertices.size()));
        auto numTriangles = CUInt32(m_triangles.size()); // CUInt32 is equivalent to static_cast<unsigned int>
        m_glmesh.SetTriangleCount(numTriangles);
        // PLACEHOLDER LINE

        OpenGL::BindVertexArray(vao);

        OpenGL::BindBuffer(bufVertex,GL_ARRAY_BUFFER);
        OpenGL::BindBufferData(CInt32(m_vertices.size()) *sizeof(glm::vec3),&m_vertices[0],GL_STATIC_DRAW,GL_ARRAY_BUFFER);

        OpenGL::EnableVertexAttribArray(SHADER_VERTEX_BUFFER_LOCATION);
        OpenGL::SetVertexAttribData(
            SHADER_VERTEX_BUFFER_LOCATION,
            3,
            GL_FLOAT,
            GL_FALSE,
            (void*)0
        );

        OpenGL::BindBuffer(bufUV,GL_ARRAY_BUFFER);
        OpenGL::BindBufferData(CInt32(m_uvs.size()) *sizeof(glm::vec2),&m_uvs[0],GL_STATIC_DRAW,GL_ARRAY_BUFFER);

        OpenGL::EnableVertexAttribArray(SHADER_UV_BUFFER_LOCATION);
        OpenGL::SetVertexAttribData(
            SHADER_UV_BUFFER_LOCATION,
            2,
            GL_FLOAT,
            GL_FALSE,
            (void*)0
        );

        OpenGL::BindBuffer(bufNormal,GL_ARRAY_BUFFER);
        OpenGL::BindBufferData(CInt32(m_normals.size()) *sizeof(glm::vec3),&m_normals[0],GL_STATIC_DRAW,GL_ARRAY_BUFFER);

        OpenGL::EnableVertexAttribArray(SHADER_NORMAL_BUFFER_LOCATION);
        OpenGL::SetVertexAttribData(
            SHADER_NORMAL_BUFFER_LOCATION,
            3,
            GL_FLOAT,
            GL_FALSE,
            (void*)0
        );

        if(!m_vertexWeights.empty())
        {
            m_bufVertWeights.bufWeights = OpenGL::GenerateBuffer();
            OpenGL::BindBuffer(m_bufVertWeights.bufWeights,GL_ARRAY_BUFFER);
            OpenGL::BindBufferData(CInt32(m_vertexWeights.size()) *sizeof(float),&m_vertexWeights[0],GL_STATIC_DRAW,GL_ARRAY_BUFFER);

            OpenGL::EnableVertexAttribArray(SHADER_BONE_WEIGHT_LOCATION);
            OpenGL::BindBuffer(m_bufVertWeights.bufWeights,GL_ARRAY_BUFFER);
            OpenGL::SetVertexAttribData(
                SHADER_BONE_WEIGHT_LOCATION,
                4,
                GL_FLOAT,
                GL_FALSE,
                (void*)0
            );
        }
        if(!m_weightBoneIDs.empty())
        {
            m_bufVertWeights.bufBoneIDs = OpenGL::GenerateBuffer();
            OpenGL::BindBuffer(m_bufVertWeights.bufBoneIDs,GL_ARRAY_BUFFER);
            OpenGL::BindBufferData(CInt32(m_weightBoneIDs.size()) *sizeof(int),&m_weightBoneIDs[0],GL_STATIC_DRAW,GL_ARRAY_BUFFER);

            OpenGL::EnableVertexAttribArray(SHADER_BONE_WEIGHT_ID_LOCATION);
            OpenGL::BindBuffer(m_bufVertWeights.bufBoneIDs,GL_ARRAY_BUFFER);
            glVertexAttribIPointer(
                SHADER_BONE_WEIGHT_ID_LOCATION,
                4,
                GL_INT,
                0,
                (void*)0
            );
        }

        if(bHasAlphas == true)
        {
            OpenGL::BindBuffer(bufAlphas,GL_ARRAY_BUFFER);
            OpenGL::BindBufferData(CInt32(m_alphas.size()) *sizeof(glm::vec2),&m_alphas[0],GL_STATIC_DRAW,GL_ARRAY_BUFFER);

            OpenGL::EnableVertexAttribArray(SHADER_USER_BUFFER1_LOCATION);
            OpenGL::SetVertexAttribData(
                SHADER_USER_BUFFER1_LOCATION,
                2,
                GL_FLOAT,
                GL_FALSE,
                (void*)0
            );
        }
        OpenGL::BindBuffer(bufIndices,GL_ELEMENT_ARRAY_BUFFER);
        OpenGL::BindBufferData(numTriangles *sizeof(unsigned int),&m_triangles[0],GL_STATIC_DRAW,GL_ELEMENT_ARRAY_BUFFER);

        OpenGL::BindVertexArray(0);
        OpenGL::BindBuffer(0,GL_ARRAY_BUFFER);
        OpenGL::BindBuffer(0,GL_ELEMENT_ARRAY_BUFFER);

    }
    ComputeTangentBasis(m_vertices,m_uvs,m_normals,m_triangles);
}

我的程序是一个图形应用程序,这段代码生成了后续渲染所需的对象缓冲区。当满足特定条件时,该 bug 会导致特定网格的顶点渲染错误。该 bug 是稳定的,每次都会发生在同一网格上。
不幸的是,我无法进一步缩小代码范围,因为这样会使 bug 消失,并且解释每行代码所做的事情需要相当长的时间,这里也不太相关。我几乎可以肯定这是编译器优化的问题,因此实际 bug 在这种情况下更像是副作用。
使用上述代码,bug 将会在 release 模式下出现,但只有在我标记为“占位符行”的那一行代码中才会出现。
如果我将代码更改为以下三个变体之一, bug 将会消失:
void CModelSubMesh::Update()
{
    [...]
    // PLACEHOLDER LINE
    std::cout<<numTriangles<<std::endl;
    [...]
}

#2:

#pragma optimize( "", off )
void CModelSubMesh::Update()
{
    [...] // No changes to the code
}
#pragma optimize( "", on ) 

#3:

static void test()
{
    auto *f = new float; // Do something to make sure the compiler doesn't optimize this function away; Doesn't matter what
    delete f;
}
void CModelSubMesh::Update()
{
    [...]
    // PLACEHOLDER LINE
    test()
    [...]
}

特别是变体#2表明正在优化不应该被优化的东西。

我并不指望有人能够神奇地知道问题的根源,因为那需要对代码有更深入的了解。但是,也许一些更好地了解编译器优化过程的人可以给我一些提示,这里可能会发生什么情况?

由于几乎任何对代码的更改都会消除错误,我不确定我该怎么做才能找到它的原因。


4
我99.9(9)%确定编译器在这里没有问题。只出现在发布版中的错误通常与内存或多线程相关。而且,即使您进行了所述的代码更改,该错误也不会消失,它只是变得隐藏起来。也就是说,您可能没有注意到它,但如果更改其他内容,它将再次出现。 - Violet Giraffe
1
如果是内存损坏,它可能出现在您的应用程序的任何地方,而不仅仅是您在这里发布的代码片段中。 - Violet Giraffe
1
你错了,它解释了一切。我猜你没有太多处理内存损坏问题的经验...但是。当你修改代码或移动它时,你改变了代码和数据在内存中的布局,因此损坏的内存片段也不同,导致不同的症状(或缺乏症状)。 - Violet Giraffe
1
我建议你尝试简化代码,直到它既能展示问题,又足够简短适合在这里提问。我同意Violet Giraffe的观点,很有可能是"其他原因"。(例如,删除未使用的代码片段,比如bHasAlpha,似乎是一个不错的开始) - Mats Petersson
当您添加任意不相关的内容时,问题消失是未定义行为的一个强烈指示。(他说,他脑海中急速闪过通过“错误地”不删除调试打印输出完成大学作业的回忆。) - molbdnilo
显示剩余3条评论
1个回答

3
我通常遇到在调试模式下能够工作但在发布版本中无法正常运行的问题是未初始化的变量。大多数编译器会在调试构建时将变量初始化为0x00,但开启优化后就会失去这个功能。

这可能可以解释修改程序会改变行为的原因:通过调整应用程序的内存映射,您最终会得到一些不同的随机未初始化内存块,这些内存块以某种方式掩盖了该问题。

如果您保持良好的内存管理卫生习惯,您可能会使用像 valgrind 这样的工具快速找到问题所在。从长远来看,您可能需要考虑利用检测内存滥用的内存管理框架(请参见Ogre MemoryTrackerTCMallocClang Memory Sanitizer)。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接