在C++中处理浮点异常

Question

在C++中处理浮点异常

12

我发现浮点数模型/错误问题相当令人困惑。这是我不熟悉的领域，我也不是低级C/asm程序员，所以我希望能得到一些建议。

我有一个使用VS2012（VC11）构建的较大的C++应用程序，并配置为抛出浮点异常（更准确地说，允许C++运行时和/或硬件抛出fp-exceptions） - 并且它在发布（优化）版本中抛出了很多异常，但在调试版本中没有。我认为这是由于优化和可能的浮点模型引起的（尽管编译器/fp：precise开关设置了发行版和调试版构建）。

我的第一个问题涉及管理应用程序的调试。我想控制fp-exceptions的抛出位置和屏蔽位置。这是必要的，因为我正在调试（经过优化的）发行版构建（其中发生了fp-exceptions） - 我想在某些函数中禁用fp-exceptions，在那里我检测到问题，以便我可以定位新的FP问题。但是我对使用_controlfp_s来完成此操作（可以正常工作）和编译器（和#pragma float_control）开关“/fp：except”之间的差异感到困惑（似乎没有任何影响）。这两种机制之间的区别是什么？它们是否应该对fp exceptions产生相同的影响？

其次，我收到了许多“浮点数堆栈检查”异常 - 其中一个异常似乎是在调用GDI+ dll时抛出的。在网上搜索时，关于此异常的少数提及似乎表明这是由于编译器错误引起的。一般情况下是这样吗？如果是这样，我该如何解决问题？最好是为问题函数禁用编译器优化，还是仅针对代码中存在的问题区域禁用fp-exceptions（如果没有返回坏的浮点数值的话）？例如，在引发此异常的GDI+调用（GraphicsPath :: GetPointCount）中，实际返回的整数值似乎是正确的。目前，我正在使用_controlfp_s直接在GDI+调用之前禁用fp-exceptions - 然后再次使用_controlfp_s直接在调用之后重新启用异常。

最后，我的应用程序确实进行了很多浮点数计算，并且需要具有鲁棒性和可靠性，但不一定需要非常准确。该应用程序的性质是，浮点值通常表示概率，因此本质上有些不精确。但是，我希望捕获任何纯逻辑错误，例如除以零。对于此情况，哪种浮点模型最好？目前我正在使用以下方法：

使用 _controlfp_s 和 SIGFPE 信号处理程序捕获所有浮点异常（即 EM_OVERFLOW | EM_UNDERFLOW | EM_ZERODIVIDE | EM_DENORMAL | EM_INVALID），
启用 denormals-are-zero (DAZ) 和 flush-to-zero (FTZ) （即 _MM_SET_FLUSH_ZERO_MODE(_MM_DENORMALS_ZERO_ON)），并且
使用默认的VC11编译器设置/fp:precise，未指定/fp:except。

这是最好的模型吗？

谢谢和问候！

- Jools99

“我想控制fp异常抛出和屏蔽的位置。” 异常永远不应该被屏蔽。如果它们应该被屏蔽，那么首先就不应该抛出异常。如果你所说的屏蔽是指处理异常，那么在调试和发布时处理方式应该是相同的。 - Ram

嗨Ram。这主要是为了调试我的应用程序 - 我想在我检测到问题的某些函数中禁用fp-exceptions，以便我可以找到新的问题。我还遇到了GDI +调用引发的fp-exception问题。目前，我使用_controlfp_s在调用之前立即禁用fp-exceptions，然后在直接重新启用异常之后使用它。而且我不确定所有的fp-exceptions都是必要的（例如EM_DENORMAL） - 这就是为什么VC（和其他编译器？）默认禁用它们的原因。我需要关于此的建议 - 因此上面的最后一个问题。 - Jools99

3

@Ram：这些异常不是在软件中引发的，而是由于FPU故障而产生的。掩码确定故障是否变成异常。不要考虑C++异常处理、try/catch或栈展开。这些也是异常，但其行为与C++异常不同。 - Ben Voigt

有很多库期望FPU在关闭异常的情况下进行初始化。它们将期望除以零生成无穷大，使用NaN来跟踪“未初始化”状态等等。除非您在调用之前显式更改FPU控制字，否则您不能使用这些库。这是不切实际的。 - Hans Passant

你可能需要考虑使用一个类，它将有理数存储为 {enumerator,denominator} 并支持 C++ 中提供的所有算术操作。我可以给你发送这样的类，它完全不执行任何 FP 操作。但是，如果你正在运行实时/嵌入式系统，那么它可能无法满足你的要求，无论是时间（速度）还是空间（内存）。当然，如果它适用于你，就可以随时更改内部实现以适合你的系统要求。 - barak manos

FP堆栈检查异常意味着存在错误，不一定在异常附近。如果一个函数返回一个浮点数，并且你通过一个声明返回一个整数的函数指针来调用它，那么它将把结果留在8元素x87 FPU堆栈上，调用者将不知道要弹出它。这样做八次，FPU堆栈就满了，会发生糟糕的事情。调试这些问题很麻烦。注意FPU堆栈指针的变化。或者，切换到64位，其中不使用x87堆栈。 - Bruce Dawson

3个回答

1

我可以帮忙翻译这段有关编程的中文内容。这段内容涉及如何掩盖浮点数异常，但不包括前两个问题。建议使用以下函数。

_statusfp()  (x64 and Win32)
_statusfp2() (Win32 only)
_fpreset()
_controlfp_s()
_clearfp()
_matherr()

在调试FPU异常和交付稳定快速产品时非常有用。

在调试时，我会选择性地取消掩码以帮助隔离代码中生成fpu异常的行，其中我无法避免调用其他不可预测地生成fpu异常的代码（如.NET JIT的除零操作）。

在发布的产品中，我使用它们来提供一个稳定的程序，可以容忍严重的浮点数异常，检测到它们发生时，优雅地恢复。

当我必须调用无法更改、没有可靠异常处理并且偶尔生成FPU异常的代码时，我屏蔽所有FPU异常。

示例：

#define BAD_FPU_EX (_EM_OVERFLOW | _EM_ZERODIVIDE | _EM_INVALID)
#define COMMON_FPU_EX (_EM_INEXACT | _EM_UNDERFLOW | _EM_DENORMAL)
#define ALL_FPU_EX (BAD_FPU_EX | COMMON_FPU_EX)

发布代码：

_fpreset();
Use _controlfp_s() to mask ALL_FPU_EX 
_clearfp();
... calculation
unsigned int bad_fpu_ex = (BAD_FPU_EX  & _statusfp());
_clearfp(); // to prevent reacting to existing status flags again
if ( 0 != bad_fpu_ex )
{
  ... use fallback calculation
  ... discard result and return error code
  ... throw exception with useful information
}

调试代码：

_fpreset();
_clearfp();
Use _controlfp_s() to mask COMMON_FPU_EX and unmask BAD_FPU_EX 
... calculation
  "crash" in debugger on the line of code that is generating the "bad" exception.

根据编译器选项，发布版本可能使用内在调用 FPU 操作，而调试版本可能调用数学库函数。这两种方法对于无效操作（如 sqrt(-1.0)）具有显着不同的错误处理行为。

在 64 位 Windows 7 上使用 VS2010 构建的可执行文件中，在 Win32 和 x64 平台上使用相同的代码时，我生成了略有不同的双精度算术值。即使是使用 /fp::precise 的非优化调试构建，fpu 精度控制明确设置为 _PC_53，fpu 舍入控制明确设置为 _RC_NEAR。我不得不调整一些回归测试来比较双精度值以考虑平台因素。我不知道这是否仍然是 VS2012 的问题，但请注意。

- Dale Lear

0

我一直在努力获取有关在Linux上处理浮点异常的信息，我可以告诉你我学到了什么：有几种启用异常机制的方法：

fesetenv（FE_NOMASK_ENV）; 启用所有异常
feenableexcept（FE_ALL_EXCEPT）;

 fpu_control_t fw;
 _FPU_GETCW(fw);
 fw |=FE_ALL_EXCEPT;
 _FPU_SETCW(fw);

4.

> fenv_t envp; include bits/fenv.h   
> fegetenv(&envp);    
 envp.__control_word |= ~_FPU_MASK_OM;   
> fesetenv(&envp);

5.

> fpu_control_t cw;
> __asm__ ("fnstcw %0" : "=m" (*&cw));get config word
>cw |= ~FE_UNDERFLOW;
> __asm__ ("fldcw %0" : : "m" (*&cw));write config word

6.C++模式：std::feclearexcept(FE_ALL_EXCEPT);

以下是一些有用的链接： http://frs.web.cern.ch/frs/Source/MAC_headers/fpu_control.h http://en.cppreference.com/w/cpp/numeric/fenv/fetestexcept http://technopark02.blogspot.ro/2005/10/handling-sigfpe.html

- Emil Condrea

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- masrtis · Accepted Answer

大部分以下信息来自Bruce Dawson在该主题上的博客文章(link)。

由于您正在使用C ++，因此可以创建一个RAII类，以使浮点异常在作用域范围内启用或禁用。这样，您就可以更好地控制，只将异常状态暴露给您的代码，而不是手动管理调用_controlfp_s()。此外，以这种方式设置的浮点异常状态是系统范围内的，因此建议记住控制字的先前状态，并在需要时恢复它。 RAII可以为您处理此问题，并且是描述您所描述的GDI +问题的良好解决方案。

异常标志_EM_OVERFLOW、_EM_ZERODIVIDE和_EM_INVALID是最重要的需要考虑的。当计算结果为正或负无穷大时，会触发_EM_OVERFLOW；而当结果为信号NaN时，则会触发_EM_INVALID。_EM_UNDERFLOW可以安全地忽略；它在计算结果为非零且介于-FLT_MIN和FLT_MIN之间（换句话说，生成了一个非规格化数）时发出信号。_EM_INEXACT由于浮点运算的性质而被频繁触发，因此在实际应用中没有任何实用价值，尽管在某些情况下，如果试图追踪不精确的结果，它可能会提供信息。

SIMD代码增加了更多的复杂性；由于您没有明确指示使用SIMD，因此我将省略讨论，除了注意，在VS 2012中指定除/fp:fast以外的任何内容都可能禁用代码的自动向量化，请参见this answer获取详细信息。