为什么预处理器区分数字和字符标记？

Question

为什么预处理器区分数字和字符标记？

9

根据语言规范，词法元素的定义如下：

token:
    keyword
    identifier

    constant

    string-literal
    operator
    punctuator

preprocessing-token:
    header-name
    identifier

    pp-number
    character-constant

    string-literal
    operator
    punctuator

    each non-white-space character that cannot be one of the above

为什么在预处理标记级别上数字和字符之间有区分，而在标记级别上只有常量？我看不出这种区分的好处。

- fredoverflow

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- rici · Accepted Answer

C语言文法中非终结符的名称并不是规范的；它们只是为了描述而存在。重要的是行为被正确地描述。文法本身不能充分描述语言；需要与文本一起阅读，这进一步限制了良好形式程序的范围。

预处理器标记与程序标记之间不存在一对一的关系。它们有重叠：预处理器中的identifier可能是关键字，也可能是各种可定义的符号类型（包括一些常量和typedef名称）。pp-number可能是整数或浮点常量，但也可能无效。词法产生式并不是全部互斥的，将词法类别实际应用于程序子字符串需要在标准文本中描述的过程，而不是在正式文法中。

字符常量直接从预处理器传递到程序语法中而没有修改（尽管它们随后被纳入constant类别）。如果有一个关于预处理器数字的单个评论（例如，如果它们幸存下来，则必须转换为真实数字常量文字），那么有该类别的充分理由。

此外，将character-constant包含在pp-number的定义中会增加什么？您仍然需要两个产生式才能描述语言。