65得票11回答
有没有一种算法可以告诉我们两个短语的语义相似度?

输入:短语1,短语2 输出:语义相似度值(在0到1之间),或这两个短语在描述同一个事物的概率。

64得票14回答
SpaCy操作系统错误:找不到模型“en”。

尽管我已下载了模型,但它无法加载。 [jalal@goku entity-sentiment-analysis]$ which python /scratch/sjn/anaconda/bin/python [jalal@goku entity-sentiment-analysis]$ su...

63得票3回答
在神经网络的上下文中,投影层是什么?

我目前正在尝试理解word2vec神经网络学习算法背后的架构,用于基于上下文将单词表示为向量。 阅读过Tomas Mikolov的论文后,我发现他定义了一个投影层。虽然这个术语在涉及word2vec时被广泛使用,但我无法找到在神经网络上下文中它实际是什么的确切定义。 我的问题是,在神经...

61得票33回答
哪种编程语言最像自然语言?

我从许多情况中得到了这个问题的灵感,其中包括我不理解别人在说什么以及别人也不理解我。 所以,一个“聪明”的解决方案是说一种计算机语言。:) 我对编程语言可以达到接近(英语)自然语言的程度很感兴趣。当我说接近时,我的意思不仅是使用单词和句子,而是能够"做"自然语言可以"做"的事情,并且通过"...

61得票8回答
在Python中扩展英语缩写

英语有一些缩略词,例如:you've -> you have he's -> he is 在进行自然语言处理时,这些缩略词有时会导致头痛。是否有一种Python库可以扩展这些缩略词?

59得票8回答
从文本中识别和提取日期的最佳方法Python是什么?

作为我正在进行的一个更大的个人项目的一部分,我试图从各种文本来源中分离出行内日期。 例如,我有一个大的字符串列表(通常采用英语句子或语句的形式),它们采取各种形式: 中央设计委员会会议,星期二10/22 6:30 pm Th 9/19 LAB:串行编码(第2.2节) ...

58得票6回答
BILOU标记在命名实体识别中是什么意思?

标题基本上概括了问题。我注意到在一些论文中,人们提到了BILOU编码方案,用于命名实体识别,而不是常见的BIO标记方案(例如Ratinov和Roth在2009年的这篇论文http://cogcomp.cs.illinois.edu/page/publication_view/199)。 从处...

58得票16回答
如何拆分多个连接的单词?

我有一个包含大约1000个元素的数组,以下是一些示例:wickedweather liquidweather driveourtrucks gocompact slimprojector 我希望能够将它们分割成各自的单词,例如:wicked weather liquid weather dri...

57得票3回答
文本摘要评估 - BLEU vs ROUGE

使用两个不同的摘要系统(sys1和sys2)及相同的参考摘要结果,我用BLEU和ROUGE对它们进行了评估。问题在于:sys1的所有ROUGE分数(ROUGE-1、ROUGE-2、ROUGE-3、ROUGE-4、ROUGE-L、ROUGE-SU4等)都高于sys2,但是sys1的BLEU分数却...

57得票6回答
情感分析的训练数据

我在企业领域中想获取已经分类为正/负情感的文档语料库,需要一份大量提供公司评论的文档集,例如分析师和媒体提供的公司评论。 我发现了一些关于产品和电影评论的语料库,但是否有一个包含公司评论的商业领域语料库,与商业用语相匹配?