36得票12回答
R和SPSS的区别

我将很快分析大量与网络流量相关的数据,并对其进行预处理以便进行分析。我发现R和SPSS是最受欢迎的统计分析工具之一。我还将生成大量图形和图表。因此,我想知道这两个软件之间的基本差异。 我不是在问哪个更好,而只是想知道它们的工作流程方面的差异(除了SPSS有GUI之外)。无论哪种情况下,我都会...

32得票2回答
如何解决Pandas在Excel表格中将大数字转换为指数形式的问题?

在Excel表格中,我有两列包含大量数字。 但是当我用read_excel()读取Excel文件并显示数据框时, 这两列以科学计数法的指数形式打印出来。 我该如何摆脱这种格式? 谢谢 Pandas输出

32得票4回答
包含NaN值的pandas数据框的绘图

我有三个不同GPS接收器的冰速GPS数据。这些数据以朱利安日为索引(从2009年开始递增)存储在一个pandas dataframe中。 以下是数据的子集(主要数据集包含3487235行...): R2 R7 R8 12...

32得票5回答
Python Pandas:如何计算导数/梯度

假设我有以下两个向量:In [99]: time_index Out[99]: [1484942413, 1484942712, 1484943012, 1484943312, 1484943612, 1484943912, 1484944212, 1484944511, 1...

30得票3回答
如何使用word2vec找到最接近向量的单词

我刚开始使用Word2vec,想知道如何找到最接近一个向量的单词。 我有一个向量,它是一组向量的平均向量:array([-0.00449447, -0.00310097, 0.02421786, ...], dtype=float32) 有没有一种简单直接的方法来找到与这个向量在我训练数据中最...

29得票2回答
用于C++的DataFrame(类似于R或Pandas)

是否有提供类似于R或者Pandas中的DataFrame数据结构的C++库?我主要关心以下内容: 表格数据的数据结构,列可以是不同类型(浮点数、整数、字符串等) 操作,如选择、过滤、合并、组合、分组等。

26得票8回答
何时应该使用C++而不是SQL?

我是一名C++程序员,偶尔会使用MySQL处理数据库,但我的SQL知识相对有限。然而,我很愿意改变这种情况。 目前,我正在尝试只使用SQL查询对我在数据库中拥有的数据进行分析。但我即将放弃,并导入数据到C++中,使用C++代码进行分析。 我已经与同事讨论过这个问题,他们也鼓励我使用C++,...

24得票5回答
R:将转换为因子,并按case_when相同的级别顺序排序

在进行数据分析时,有时我需要将值重新编码为因子,以便进行分组分析。我希望保持因子的顺序与 case_when 中指定的转换顺序相同。在这种情况下,顺序应为 "Excellent" "Good" "Fail"。如何在不繁琐地再次提及...

21得票4回答
在Excel数据透视表中使用QUARTILE函数按子群体汇总数据

我在Excel电子表格中有一个大型数据表,这个表可以被视为一组属于不同亚群体身份的个体的值的集合: IndivID SubPopID Value 1 A 33.56 2 E 42.31 3 ...

21得票1回答
Python Pandas基于索引联接数据帧。

我试图在同一列"Date"上将两个数据框连接起来,代码如下:import pandas as pd from datetime import datetime df_train_csv = pd.read_csv('./train.csv',parse_dates=['Date'],index...