12得票2回答
期望密集数组的形状为,但得到的数组形状为。

我在使用Keras运行文本分类模型时,调用model.predict函数时遇到以下错误。我已经搜索了所有地方,但对我没有帮助。 当运行一个文本分类模型时,在调用model.predict函数时,我遇到了如下的错误。我已经到处搜索过,但是还是没有解决问题。ValueError: Error wh...

12得票2回答
使用预训练的词向量进行文本分类的FastText

我正在处理一个文本分类问题,也就是给定一些文本,我需要为其分配一些给定的标签。 我尝试使用Facebook的fast-text库,它有两个对我很有用的工具: A) 具有预训练模型的单词向量 B) 文本分类工具 但是,似乎这些是完全独立的工具,因为我找不到任何将这两个实用程序合并的教程。...

12得票1回答
如何在Tensorflow中使用Hugging Face Transformers库对自定义数据进行文本分类?

我想在自定义的csv数据上使用Hugging Face的'Transformers'库提供的不同Transformer架构进行二进制文本分类。我正在使用这篇Tensorflow博客文章作为参考。以下是将自定义数据集加载到'tf.data.Dataset'格式的代码:def get_datase...

11得票4回答
如何使用CNN(Keras)处理文本分类中的长度变化问题

已经证明了卷积神经网络(CNN)在文本/文档分类方面非常有用。我想知道如何处理文章长度差异,因为大多数情况下文章的长度是不同的。Keras 中是否有任何示例? 谢谢!

11得票2回答
SkLearn多项式朴素贝叶斯分类器:最具信息量的特征

由于我的分类器在测试数据上的准确率约为99%,我有些怀疑并希望了解NB分类器最具信息量的特征,以查看它正在学习哪种特征。以下主题非常有用:如何获取scikit-learn分类器的最具信息量的特征? 至于我的特征输入,我仍在尝试中,目前正在使用CountVectorizer测试简单的一元模型:...

11得票2回答
无效参数错误:发现2个根错误。在Tensorflow文本分类模型中存在不兼容的形状。

我正在尝试使来自这个repo的代码运行起来,它基于这篇论文。它有很多错误,但我大部分已经解决了。然而,我一直遇到同样的问题,我真的不明白如何进行故障排除/发生了什么问题。 错误发生在第二次验证if语句条件被满足时。第一次总是能够工作,然后在第二次中断。如果有帮助的话,我将包含它在中断之前打印...

11得票1回答
Python文本处理:AttributeError:'list'对象没有'lower'属性。

我是Python和Stackoverflow的新手(请温柔一点),想学习如何进行情感分析。我正在使用我在教程和这里找到的代码组合:Python - AttributeError: 'list' object has no attribute 然而,我一直遇到以下问题:Trace...

11得票1回答
如何在Keras中显示路透社数据集的主题?

我在Keras中使用路透社数据集。 我想知道46个主题的名称。 我该如何在Keras中显示路透社数据集的主题? https://keras.io/datasets/#reuters-newswire-topics-classification

11得票1回答
如何在scikit-learn中正确地将数值特征和文本(词袋)特征组合起来?

我正在编写一个网页分类器,因此我有一些数字特征的混合,并且我还想对文本进行分类。我使用词袋模型方法将文本转换成(大量的)数值向量。代码最终变成如下:from sklearn.feature_extraction.text import CountVectorizer from sklearn....

10得票2回答
如何使用word2vec进行文本分类

我希望使用word2vec进行文本分类。我已经获得了单词的向量。 我想使用word2vec进行文本分类。我已经得到了单词的向量。ls = [] sentences = lines.split(".") for i in sentences: ls.append(i.split())...