149得票5回答
我们可以在变量名中写注释吗?

int main() { i/*nt*/a = 10; return 0; } 如果我有以上代码并想要统计标记,那么它会是14个标记还是13个标记? 在变量名中编写注释是否有效?您可以假设int i,int a,int ia是全局定义的。

37得票2回答
Python正则表达式 - 如何从通配符表达式中捕获多个组?

我有一个Python正则表达式,其中包含一个可以出现零次或多次的组 - 但是当我之后检索组列表时,只有最后一个存在。例如: re.search("(\w)*", "abcdefg").groups() 这会返回列表 ('g',) 我需要它返回('a','b','c','d','e','f...

33得票12回答
有没有一种算法可以帮助检测英语句子的“主题”?

我正在尝试找出是否有一种已知的算法能够检测一个句子的“关键概念”。 使用案例如下: 用户输入一个查询句子(鸡肉的味道像火鸡吗?) 我们的系统识别句子的概念(鸡肉,火鸡) 然后它运行搜索我们语料库内容的过程 我们欠缺的是确定句子真正涉及什么核心“主题”的能力。句子“鸡肉的味道像火鸡吗?...

31得票2回答
ANTLR中解析规则和词法规则的实际区别是什么?

我理解在理论上分离解析器规则和词法规则的理论,但是在ANTLR中这两个语句之间有哪些实际区别:my_rule: ... ; MY_RULE: ... ; 它们会导致不同的 AST 树吗?不同的性能?潜在的歧义?

24得票2回答
yylval和联合体

在yacc文件中,联合体的作用是什么?它是否直接与flex文件中的yylval相关?如果您不使用yylval,则不需要使用union吗?

21得票7回答
文本分析的算法或库,具体包括:文本中的主要单词、短语和文本集合。

我正在开发一个项目,需要分析一篇文本和多个文本集合以确定主要单词。我想知道是否有一个库(最好是c#或java),可以为我处理重活。如果没有,是否有算法或多个算法可以实现我的以下目标。 我想做的与从网址或rss提要构建的单词云类似,但我不需要可视化效果。它们经常用于分析总统候选人的演讲,以查看...

21得票1回答
PEG.js中如何忽略空格

我想在我的语法中忽略空格和换行符,以便它们不会出现在PEG.js输出中。此外,方括号内的文字应该返回一个新数组。 语法 start = 'a'? sep+ ('cat'/'dog') sep* '(' sep* stmt_list sep* ')' stmt_list = exp...

19得票1回答
使用Alex和Happy管理位置信息

我正在学习使用Alex和Happy编写一个小型编译器。我希望为我的AST节点维护行列信息,以便向用户提供有意义的错误消息。为了说明我计划如何做到这一点,我写了一个小例子(请参见下面的代码),我想知道我解决问题的方式(将AlexPosn附加到标记上,将多态属性字段附加到AST节点上,使用tkPo...

18得票2回答
解析器和扫描器有什么区别?

我已经做了一个扫描器,现在应该制作一个解析器。它们有什么区别?

17得票3回答
找出正则表达式失败的位置

我正在尝试使用JavaScript编写一个词法分析器,用于查找简单领域特定语言的标记。我开始采用简单的实现方式,它只是尝试从当前行的位置匹配后续的正则表达式,以查找其是否匹配某些标记格式并接受它。 问题在于,当某些内容不匹配正则表达式时,整个正则表达式都失败了,因此我不知道到底是哪个字符导致...