我正在使用Python中的spacy进行词性标注,效果很好,但我想知道是否有可能找出字符串中最常见的单词。另外,是否有可能获取最常见的名词、动词、副词等等? 虽然spacy中包含count_by函数,但我无法以有意义的方式运行它。
我试图通过运行 pip install spacy 来安装适用于 Python 版本 3.6.1 的 spacy,但是我不断收到以下错误,请问如何解决这个问题?之前我遇到了 cl.exe 未找到的错误,然后我将 visual studio 路径添加到环境变量中,cl.exe 就在其中。 ...
我知道基本的spacy工作流程,可以从文档中获取各种属性,但是我找不到一个内置函数来返回句子中单词的位置(开始/结束)。 请问有人知道Spacy是否支持这个功能?
我已经下载了en_core_web_lg模型,并试图找出两个句子之间的相似性:nlp = spacy.load('en_core_web_lg') search_doc = nlp("This was very strange argument between american and br...
我有一个庞大的句子列表(约700万),想从中提取名词。我使用了joblib库来并行化提取过程,如下所示:import spacy from tqdm import tqdm from joblib import Parallel, delayed nlp = spacy.load('en_co...
我尝试过几种方法来加载Google新闻word2vec向量 (https://code.google.com/archive/p/word2vec/):en_nlp = spacy.load('en',vector=False) en_nlp.vocab.load_vectors_from_b...
在我的项目中,我在setup.py中将spaCy作为依赖项,但我想添加一个默认模型。 到目前为止,我的尝试是: install_requires=['spacy', 'en_core_web_sm'], dependency_links=['https://github.com/explo...
InvalidArchiveError('存档文件C:\Users\Sahaja Reddy\Anaconda3\pkgs\openssl-1.1.1g-he774522_0.conda出现错误。你可能需要删除并重新下载或重新创建此文件。来自libarchive的消息是:\n\n无法取消链接(...
我想使用spacy的预训练BERT模型进行文本分类,但我对cased/uncased模型有些困惑。我在某个地方读到,只有当字母大小写对任务有帮助时,才应该使用cased模型。在我的情况下,我正在处理德语文本。在德语中,所有名词都以大写字母开头。因此,我认为(如果我错了,请纠正我),这正是必须使...