得票数最多 'dataset' 问题

关联标签

575得票5回答

朴素贝叶斯分类的简单解释

我很难理解朴素贝叶斯的过程，想知道是否有人能用简单的英文逐步解释一下。我知道它是通过发生次数进行概率比较，但我不知道训练数据与实际数据集之间的关系。请给我一个关于训练集扮演什么角色的解释。这里给出一个非常简单的水果例子，例如香蕉。training set--- round-red roun...

algorithmmachine-learningdatasetclassificationnaivebayes

216得票12回答

我应该Dispose() DataSet和DataTable吗？

DataSet和DataTable都实现了IDisposable接口，因此按照传统最佳实践，我应该调用它们的Dispose()方法。然而，从我迄今为止所读到的内容来看，DataSet和DataTable实际上没有任何非托管资源，因此Dispose()并没有实际作用。此外，我不能仅仅使用...

datatabledatasetdisposeidisposableusing

170得票28回答

如何将Scikit-learn数据集转换为Pandas数据集

我该如何将Scikit-learn Bunch对象中的数据转换为Pandas DataFrame？from sklearn.datasets import load_iris import pandas as pd data = load_iris() print(type(data)) da...

pythonpandasscikit-learndataset

143得票5回答

Pandas中的样本数据集

使用R语言时，加载“练习”数据集非常方便，可使用：data(iris) 或者data(mtcars) 有没有类似于Pandas的东西？我知道我可以使用其他方法加载，只是好奇是否有内置的东西。

pythonpandasdatasetsample-data

142得票7回答

Datatable与Dataset的区别

我目前使用 DataTable 从数据库获取结果，以在代码中使用。然而，许多网上的示例显示使用 DataSet，通过集合方法来访问表格。使用 DataSets 或 DataTables 作为 SQL 结果的存储方法，在性能或其他方面是否有优势呢？

c#datasetdatatable

118得票11回答

按列名对数据框的列进行排序

这可能是一个简单的问题，但我不知道如何按字母顺序排序列。test = data.frame(C = c(0, 2, 4, 7, 8), A = c(4, 2, 4, 7, 8), B = c(1, 3, 8, 3, 2)) # C A B # 1 0 4 1 # 2 2 2 3 # 3 ...

rsortingdataset

110得票3回答

"LINQ to Entities"、"LINQ to SQL"和"LINQ to Dataset"之间有什么区别？

我已经花了很长时间在LINQ上工作。然而，它们之间的真正区别仍然是个谜。成功的答案将包含它们之间的简要区分。每个类型的主要目标是什么，有什么好处，并且是否会对性能产生影响... P.S. 我知道那里有很多信息来源，但我正在寻找一种“作弊表”，指导新手为实现特定目标去哪里。

c#sqllinqdatasetentities

100得票4回答

TensorFlow数据集中的batch、repeat和shuffle分别是什么意思？

我目前正在学习TensorFlow，但在下面的代码片段中遇到了困惑：dataset = dataset.shuffle(buffer_size = 10 * batch_size) dataset = dataset.repeat(num_epochs).batch(batch_size) ...

tensorflowdataset

99得票6回答

如何在R中删除数据框的第一行？

我有一个数据集，包含11列，每列都有超过1000行数据。这些列的标签是V1、V2、V11等等。我使用“c”命令将这些标签替换为更有用的名称。但我没有意识到第一行也包含了每列的标签，而我的实际数据从第二行开始。有没有办法删除第一行并减少行数？

rdataset

95得票2回答

如何检查两个数据框是否相等？

假设我在R中有大型数据集，我只想知道其中两个是否相同。当我尝试使用不同的算法来达到相同的结果时，我经常使用这种方法。例如，假设我们有以下数据集：df1 <- data.frame(num = 1:5, let = letters[1:5]) df2 <- df1 df3 <-...

databaserdatasetcomparedataframe