在C++中处理浮点异常

12

我发现浮点数模型/错误问题相当令人困惑。这是我不熟悉的领域,我也不是低级C/asm程序员,所以我希望能得到一些建议。

我有一个使用VS2012(VC11)构建的较大的C++应用程序,并配置为抛出浮点异常(更准确地说,允许C++运行时和/或硬件抛出fp-exceptions) - 并且它在发布(优化)版本中抛出了很多异常,但在调试版本中没有。我认为这是由于优化和可能的浮点模型引起的(尽管编译器/fp:precise开关设置了发行版和调试版构建)。

我的第一个问题涉及管理应用程序的调试。我想控制fp-exceptions的抛出位置和屏蔽位置。这是必要的,因为我正在调试(经过优化的)发行版构建(其中发生了fp-exceptions) - 我想在某些函数中禁用fp-exceptions,在那里我检测到问题,以便我可以定位新的FP问题。但是我对使用_controlfp_s来完成此操作(可以正常工作)和编译器(和#pragma float_control)开关“/fp:except”之间的差异感到困惑(似乎没有任何影响)。这两种机制之间的区别是什么?它们是否应该对fp exceptions产生相同的影响?

其次,我收到了许多“浮点数堆栈检查”异常 - 其中一个异常似乎是在调用GDI+ dll时抛出的。在网上搜索时,关于此异常的少数提及似乎表明这是由于编译器错误引起的。一般情况下是这样吗?如果是这样,我该如何解决问题?最好是为问题函数禁用编译器优化,还是仅针对代码中存在的问题区域禁用fp-exceptions(如果没有返回坏的浮点数值的话)?例如,在引发此异常的GDI+调用(GraphicsPath :: GetPointCount)中,实际返回的整数值似乎是正确的。目前,我正在使用_controlfp_s直接在GDI+调用之前禁用fp-exceptions - 然后再次使用_controlfp_s直接在调用之后重新启用异常。

最后,我的应用程序确实进行了很多浮点数计算,并且需要具有鲁棒性和可靠性,但不一定需要非常准确。该应用程序的性质是,浮点值通常表示概率,因此本质上有些不精确。但是,我希望捕获任何纯逻辑错误,例如除以零。对于此情况,哪种浮点模型最好?目前我正在使用以下方法:

  • 使用 _controlfp_s 和 SIGFPE 信号处理程序捕获所有浮点异常(即 EM_OVERFLOW | EM_UNDERFLOW | EM_ZERODIVIDE | EM_DENORMAL | EM_INVALID),
  • 启用 denormals-are-zero (DAZ) 和 flush-to-zero (FTZ) (即 _MM_SET_FLUSH_ZERO_MODE(_MM_DENORMALS_ZERO_ON)),并且
  • 使用默认的VC11编译器设置/fp:precise,未指定/fp:except。

这是最好的模型吗?

谢谢和问候!


“我想控制fp异常抛出和屏蔽的位置。” 异常永远不应该被屏蔽。如果它们应该被屏蔽,那么首先就不应该抛出异常。如果你所说的屏蔽是指处理异常,那么在调试和发布时处理方式应该是相同的。 - Ram
嗨Ram。这主要是为了调试我的应用程序 - 我想在我检测到问题的某些函数中禁用fp-exceptions,以便我可以找到新的问题。 我还遇到了GDI +调用引发的fp-exception问题。目前,我使用_controlfp_s在调用之前立即禁用fp-exceptions,然后在直接重新启用异常之后使用它。 而且我不确定所有的fp-exceptions都是必要的(例如EM_DENORMAL) - 这就是为什么VC(和其他编译器?)默认禁用它们的原因。我需要关于此的建议 - 因此上面的最后一个问题。 - Jools99
3
@Ram:这些异常不是在软件中引发的,而是由于FPU故障而产生的。掩码确定故障是否变成异常。不要考虑C++异常处理、try/catch或栈展开。这些也是异常,但其行为与C++异常不同。 - Ben Voigt
有很多库期望FPU在关闭异常的情况下进行初始化。它们将期望除以零生成无穷大,使用NaN来跟踪“未初始化”状态等等。除非您在调用之前显式更改FPU控制字,否则您不能使用这些库。这是不切实际的。 - Hans Passant
你可能需要考虑使用一个类,它将有理数存储为 {enumerator,denominator} 并支持 C++ 中提供的所有算术操作。我可以给你发送这样的类,它完全不执行任何 FP 操作。但是,如果你正在运行实时/嵌入式系统,那么它可能无法满足你的要求,无论是时间(速度)还是空间(内存)。当然,如果它适用于你,就可以随时更改内部实现以适合你的系统要求。 - barak manos
FP堆栈检查异常意味着存在错误,不一定在异常附近。如果一个函数返回一个浮点数,并且你通过一个声明返回一个整数的函数指针来调用它,那么它将把结果留在8元素x87 FPU堆栈上,调用者将不知道要弹出它。这样做八次,FPU堆栈就满了,会发生糟糕的事情。调试这些问题很麻烦。注意FPU堆栈指针的变化。或者,切换到64位,其中不使用x87堆栈。 - Bruce Dawson
3个回答

4
大部分以下信息来自Bruce Dawson在该主题上的博客文章(link)。
由于您正在使用C ++,因此可以创建一个RAII类,以使浮点异常在作用域范围内启用或禁用。这样,您就可以更好地控制,只将异常状态暴露给您的代码,而不是手动管理调用_controlfp_s()。此外,以这种方式设置的浮点异常状态是系统范围内的,因此建议记住控制字的先前状态,并在需要时恢复它。 RAII可以为您处理此问题,并且是描述您所描述的GDI +问题的良好解决方案。
异常标志_EM_OVERFLOW、_EM_ZERODIVIDE和_EM_INVALID是最重要的需要考虑的。当计算结果为正或负无穷大时,会触发_EM_OVERFLOW;而当结果为信号NaN时,则会触发_EM_INVALID。_EM_UNDERFLOW可以安全地忽略;它在计算结果为非零且介于-FLT_MIN和FLT_MIN之间(换句话说,生成了一个非规格化数)时发出信号。_EM_INEXACT由于浮点运算的性质而被频繁触发,因此在实际应用中没有任何实用价值,尽管在某些情况下,如果试图追踪不精确的结果,它可能会提供信息。
SIMD代码增加了更多的复杂性;由于您没有明确指示使用SIMD,因此我将省略讨论,除了注意,在VS 2012中指定除/fp:fast以外的任何内容都可能禁用代码的自动向量化,请参见this answer获取详细信息。

感谢在我的博客文章中提到我。controlfp 函数族设置 FPU 中掩码标志的状态,打开或关闭它们。这就控制了 FPU 异常是否被掩盖(默认情况下都被掩盖)。我相信 /fp:except 和 #pragma float_control 告诉编译器生成与浮点异常兼容的代码很重要,如果你想捕获它们、处理它们并继续执行。如果你只是用它们来查找错误(如果你不打算在此之后继续),那么它们并不重要。 - Bruce Dawson

1
我可以帮忙翻译这段有关编程的中文内容。这段内容涉及如何掩盖浮点数异常,但不包括前两个问题。建议使用以下函数。
_statusfp()  (x64 and Win32)
_statusfp2() (Win32 only)
_fpreset()
_controlfp_s()
_clearfp()
_matherr()

在调试FPU异常和交付稳定快速产品时非常有用。

在调试时,我会选择性地取消掩码以帮助隔离代码中生成fpu异常的行,其中我无法避免调用其他不可预测地生成fpu异常的代码(如.NET JIT的除零操作)。

在发布的产品中,我使用它们来提供一个稳定的程序,可以容忍严重的浮点数异常,检测到它们发生时,优雅地恢复。

当我必须调用无法更改、没有可靠异常处理并且偶尔生成FPU异常的代码时,我屏蔽所有FPU异常。

示例:

#define BAD_FPU_EX (_EM_OVERFLOW | _EM_ZERODIVIDE | _EM_INVALID)
#define COMMON_FPU_EX (_EM_INEXACT | _EM_UNDERFLOW | _EM_DENORMAL)
#define ALL_FPU_EX (BAD_FPU_EX | COMMON_FPU_EX)

发布代码:
_fpreset();
Use _controlfp_s() to mask ALL_FPU_EX 
_clearfp();
... calculation
unsigned int bad_fpu_ex = (BAD_FPU_EX  & _statusfp());
_clearfp(); // to prevent reacting to existing status flags again
if ( 0 != bad_fpu_ex )
{
  ... use fallback calculation
  ... discard result and return error code
  ... throw exception with useful information
}

调试代码:
_fpreset();
_clearfp();
Use _controlfp_s() to mask COMMON_FPU_EX and unmask BAD_FPU_EX 
... calculation
  "crash" in debugger on the line of code that is generating the "bad" exception.

根据编译器选项,发布版本可能使用内在调用 FPU 操作,而调试版本可能调用数学库函数。这两种方法对于无效操作(如 sqrt(-1.0))具有显着不同的错误处理行为。
在 64 位 Windows 7 上使用 VS2010 构建的可执行文件中,在 Win32 和 x64 平台上使用相同的代码时,我生成了略有不同的双精度算术值。即使是使用 /fp::precise 的非优化调试构建,fpu 精度控制明确设置为 _PC_53,fpu 舍入控制明确设置为 _RC_NEAR。我不得不调整一些回归测试来比较双精度值以考虑平台因素。我不知道这是否仍然是 VS2012 的问题,但请注意。

0
我一直在努力获取有关在Linux上处理浮点异常的信息,我可以告诉你我学到了什么: 有几种启用异常机制的方法:
  1. fesetenv(FE_NOMASK_ENV); 启用所有异常
  2. feenableexcept(FE_ALL_EXCEPT);
 fpu_control_t fw;
 _FPU_GETCW(fw);
 fw |=FE_ALL_EXCEPT;
 _FPU_SETCW(fw);

4.

> fenv_t envp; include bits/fenv.h   
> fegetenv(&envp);    
 envp.__control_word |= ~_FPU_MASK_OM;   
> fesetenv(&envp);

5.

> fpu_control_t cw;
> __asm__ ("fnstcw %0" : "=m" (*&cw));get config word
>cw |= ~FE_UNDERFLOW;
> __asm__ ("fldcw %0" : : "m" (*&cw));write config word

6.C++模式:std::feclearexcept(FE_ALL_EXCEPT);

以下是一些有用的链接: http://frs.web.cern.ch/frs/Source/MAC_headers/fpu_control.h http://en.cppreference.com/w/cpp/numeric/fenv/fetestexcept http://technopark02.blogspot.ro/2005/10/handling-sigfpe.html


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接