名词可数性

7
有没有关于确定名词可数性的资源?或者有没有一本字典记录名词是否可能是可数或不可数的? 我不关心名词是否可数,而更关心它是否可能是可数的。例如,米饭可以变成“几碗米饭”,这意味着它是可数的,但在大多数情况下它是不可数的。

如果你详细说明为什么需要知道“名词是否可数”,你会得到更好的答案。 - cyborg
我正在研究文本生成,并试图找到表达语义表示的最自然方式。因此,我正在研究同义词(sysnet)。不幸的是,有些情况下,当我替换一个词时,我需要知道序数是否可数或替换是否可数。例如,如果我有句子"there are plenty of","lot"是"plenty"的同义词,所以新句子应该是"there are lot of",但这是错误的。 - jakefisher
这是一个高度专业化的问题。虽然从技术上讲,它与算法分析相关,但更多地涉及英语语言和现有语料库的问题。您可能会对自然语言处理网站提案感兴趣。 - Gilles 'SO- stop being evil'
4个回答

6
这是一个棘手的问题。许多英语单词根据上下文/含义而定(例如beer,time,glass,language等),无法仅凭单词本身或常规词典确定其可数性。
您可以尝试从大型文本语料库中查看单词的使用情况来确定它的可数性: - 是否有复数形式 - 是否有不定冠词之前或没有 - 与many/few、much/little、a piece of(?)一起使用等
但是,许多单词可以作为名词和形容词,并且这使事情变得复杂。例如,在“an air pump”中,“air”作为形容词,“an”指的是“pump”,而不是“air”。
同样,许多单词可以作为名词和动词,并具有相同的形式。例如,在“she pressures him”中,“pressures”不是“pressure”的复数形式。
此外,一些不可数名词在更具体时可以在它们之前加上不定冠词,例如“knowledge”和“a good practical knowledge”。
您可以从分析过的语料库中收集统计信息,并根据统计信息判断单词是否更可能是可数的还是不可数的。

我正在使用以下限定词列表: 可数名词:'a','an','another','every','both','each','few','many','several','either','neither'不可数名词:'little','much','less' - Nathan B

4

目前有几个包含关于可数/不可数等区分信息的英语词典,但它们并不完全一致,因为它们侧重于略有不同的区分,这是一个复杂的任务。其中两个是ComLex和CUVPlus(目前我找不到下载链接,但你可以在许多地方找到它的提及)。

可以查看Timothy Baldwin和Francis Bond在2003年的研究成果,了解从语料库中学习名词可数性的工作。如果在语料库中出现了许多不熟悉的名词,你可以相当好地完成确定这个名词可能是可数名词、不可数名词等任务,但单个实例仍然很难分类。如果你有句子“wug是白色的”,根据你的词典,“wug”既可以是可数名词也可以是不可数名词,那么在上下文中没有足够的信息帮助你对其进行分类。


谢谢您的建议,但我找不到下载CUVPlus的地方,而且我需要成为LDC的会员才能下载comlex。 - jakefisher

2

我不确定是否有官方的词典能够表明名词是否可以数数,但是我能提出两种方法:

  • 假设一个名词被放在“质量名词列表”或“不可数名词列表”中,那么可以认为这个名词不大可能有复数形式(如果你Google搜索这些短语,比如这个网站,会找到很多相应资源)。

  • 可以通过查询语料库来分析某个词通常是可数还是不可数:在现代美国英语语料库中搜索“rice”可以得到22265个结果,而单词“rices”只有69次出现。


0

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接