17得票1回答
如何创建空的Python数据框,使得df.empty返回True?

如何在Python中创建一个空DataFrame,以便测试df.empty的结果为True? 我尝试了以下代码:df = pd.DataFrame(np.empty((1, 1))) 而且df.empty的结果为False。

7得票2回答
如何在Python中使用模拟数据创建数据框(DataFrame)

我有一个样本架构,包含12列,每列都有特定的类别。现在我需要将这些数据模拟成大约1000行的数据帧。我该怎么做? 我已经使用以下代码为每一列生成数据: Location = ['USA','India','Prague','Berlin','Dubai','Indonesia'...

10得票4回答
Spark列出所有缓存的RDD名称和取消持久化

我刚接触Apache Spark,创建了几个RDD和DataFrame,并将它们缓存起来,现在我想使用下面的命令取消缓存一些数据 rddName.unpersist() 但我记不得它们的名字了。我使用了sc.getPersistentRDDs,但输出中没有包括名称。我还使用浏览器查看缓存...

8得票6回答
在R中,根据一个列中的字符串拆分重塑数据框架

I have the following data structure ID Type Values 1 A 5; 7; 8 2 A 6 3 B 2; 3 我希望使用R重塑它为以下内容: ID Type Values 1 A 5 ...

7得票3回答
使用“car”在多个列间进行重编码

我是一名有用的助手,可以为您翻译文本。 我一直在互联网上探索,但无法弄清如何使用car来重新编码一系列列的值。 要为单个列重新编码值,我会运行类似以下命令的命令: df$dv_r <- recode(df$dv, "2=1;1=0;0=NA") 然后,如果我想要对整个数据框执...

7得票2回答
基于两列的值选择pandas数据框行

我想根据两个列的值选择一些特定的行。例如: d = {'user' : [1., 2., 3., 4] ,'item' : [5., 6., 7., 8.],'f1' : [9., 16., 17., 18.], 'f2':[4,5,6,5], 'f3':[4,5,5,8]} df = pd...

49得票2回答
通过行求和来对pandas DataFrame进行归一化

如何规范化pandas DataFrame的每一行?规范化列很容易,因此一个(非常丑陋的!)选项是: (df.T / df.T.sum()).T Pandas广播规则阻止了df / df.sum(axis=1)的实现。

10得票3回答
R-如何更改数据框中某列的编码?

我正在尝试更改数据框中某一列的编码格式。 stri_enc_mark(data_updated$text) # [1] "UTF-8" "ASCII" "ASCII" "UTF-8" "ASCII" "ASCII" "UTF-8" "UTF-8" "UTF-8" # [10] "ASC...

20得票2回答
数据框转换为字典,其中一列是键,另一列是值。

我有这个数据框 ID A B C 0 p 1 3 2 1 q 4 3 2 2 r 4 0 9 我想创建一个字典,其中ID是键,B是值,因此它将是: d["q"] = 3 , d["r"] = 0 最好的方法是什么?...

13得票3回答
如何将列描述为分类值?

我有一个包含分类和数字列混合的pandas数据框。默认情况下,df.describe()仅返回数值数据的摘要(描述具有count、mean、std、min、quantiles和max的列)。当迭代遍历df中的所有列并将它们描述为[df[c].describe() for c in df.col...