26得票3回答
如何使用Spacy找到最常见的单词?

我正在使用Python中的spacy进行词性标注,效果很好,但我想知道是否有可能找出字符串中最常见的单词。另外,是否有可能获取最常见的名词、动词、副词等等? 虽然spacy中包含count_by函数,但我无法以有意义的方式运行它。

26得票12回答
构建spacy的轮子失败。

我试图通过运行 pip install spacy 来安装适用于 Python 版本 3.6.1 的 spacy,但是我不断收到以下错误,请问如何解决这个问题?之前我遇到了 cl.exe 未找到的错误,然后我将 visual studio 路径添加到环境变量中,cl.exe 就在其中。 ...

25得票1回答
使用Spacy获取句子中单词的位置

我知道基本的spacy工作流程,可以从文档中获取各种属性,但是我找不到一个内置函数来返回句子中单词的位置(开始/结束)。 请问有人知道Spacy是否支持这个功能?

25得票12回答
Spacy链接错误

运行时:import spacy nlp = spacy.load('en') 以下内容被打印: 警告:没有找到“en”的模型,仅加载“en”分词器。 /site-packages/spacy/data除初始化文件外为空。 所有文件路径都只指向我的Python单个安装程序。 非常...

23得票5回答
Spacy,两个句子之间奇怪的相似之处

我已经下载了en_core_web_lg模型,并试图找出两个句子之间的相似性:nlp = spacy.load('en_core_web_lg') search_doc = nlp("This was very strange argument between american and br...

23得票7回答
Spacy与Joblib库一起使用生成_pickle.PicklingError:无法将任务腌制以发送给工作人员。

我有一个庞大的句子列表(约700万),想从中提取名词。我使用了joblib库来并行化提取过程,如下所示:import spacy from tqdm import tqdm from joblib import Parallel, delayed nlp = spacy.load('en_co...

23得票4回答
SpaCy:如何加载Google新闻word2vec向量?

我尝试过几种方法来加载Google新闻word2vec向量 (https://code.google.com/archive/p/word2vec/):en_nlp = spacy.load('en',vector=False) en_nlp.vocab.load_vectors_from_b...

22得票3回答
在setup.py中使用spaCy和spaCy模型

在我的项目中,我在setup.py中将spaCy作为依赖项,但我想添加一个默认模型。 到目前为止,我的尝试是: install_requires=['spacy', 'en_core_web_sm'], dependency_links=['https://github.com/explo...

21得票5回答
当我尝试安装spacy时,在anaconda提示符中出现了InvalidArchiveError错误。如何解决?

InvalidArchiveError('存档文件C:\Users\Sahaja Reddy\Anaconda3\pkgs\openssl-1.1.1g-he774522_0.conda出现错误。你可能需要删除并重新下载或重新创建此文件。来自libarchive的消息是:\n\n无法取消链接(...

21得票3回答
在Spacy和训练数据中,Cased和Uncased BERT模型的区别是什么?

我想使用spacy的预训练BERT模型进行文本分类,但我对cased/uncased模型有些困惑。我在某个地方读到,只有当字母大小写对任务有帮助时,才应该使用cased模型。在我的情况下,我正在处理德语文本。在德语中,所有名词都以大写字母开头。因此,我认为(如果我错了,请纠正我),这正是必须使...