最新 'dataframe' 问题

标签列表

关联标签

17得票1回答

如何创建空的Python数据框，使得df.empty返回True？

如何在Python中创建一个空DataFrame，以便测试df.empty的结果为True？我尝试了以下代码：df = pd.DataFrame(np.empty((1, 1))) 而且df.empty的结果为False。

pythonpandasdataframeis-empty

7得票2回答

如何在Python中使用模拟数据创建数据框(DataFrame)

我有一个样本架构，包含12列，每列都有特定的类别。现在我需要将这些数据模拟成大约1000行的数据帧。我该怎么做？我已经使用以下代码为每一列生成数据： Location = ['USA','India','Prague','Berlin','Dubai','Indonesia'...

pythonpython-3.xpandasdataframerandom

10得票4回答

Spark列出所有缓存的RDD名称和取消持久化

我刚接触Apache Spark，创建了几个RDD和DataFrame，并将它们缓存起来，现在我想使用下面的命令取消缓存一些数据 rddName.unpersist() 但我记不得它们的名字了。我使用了sc.getPersistentRDDs，但输出中没有包括名称。我还使用浏览器查看缓存...

javascaladataframeapache-sparkrdd

8得票6回答

在R中，根据一个列中的字符串拆分重塑数据框架

I have the following data structure ID Type Values 1 A 5; 7; 8 2 A 6 3 B 2; 3 我希望使用R重塑它为以下内容： ID Type Values 1 A 5 ...

rdataframereshape

7得票3回答

使用“car”在多个列间进行重编码

我是一名有用的助手，可以为您翻译文本。我一直在互联网上探索，但无法弄清如何使用car来重新编码一系列列的值。要为单个列重新编码值，我会运行类似以下命令的命令： df$dv_r <- recode(df$dv, "2=1;1=0;0=NA") 然后，如果我想要对整个数据框执...

rdataframedata.table

7得票2回答

基于两列的值选择pandas数据框行

我想根据两个列的值选择一些特定的行。例如： d = {'user' : [1., 2., 3., 4] ,'item' : [5., 6., 7., 8.],'f1' : [9., 16., 17., 18.], 'f2':[4,5,6,5], 'f3':[4,5,5,8]} df = pd...

pythonarraysnumpypandasdataframe

49得票2回答

通过行求和来对pandas DataFrame进行归一化

如何规范化pandas DataFrame的每一行？规范化列很容易，因此一个（非常丑陋的！）选项是： (df.T / df.T.sum()).T Pandas广播规则阻止了df / df.sum(axis=1)的实现。

pythonpandasnormalizationdataframe

10得票3回答

R-如何更改数据框中某列的编码？

我正在尝试更改数据框中某一列的编码格式。 stri_enc_mark(data_updated$text) # [1] "UTF-8" "ASCII" "ASCII" "UTF-8" "ASCII" "ASCII" "UTF-8" "UTF-8" "UTF-8" # [10] "ASC...

rencodingdataframe

20得票2回答

数据框转换为字典，其中一列是键，另一列是值。

我有这个数据框 ID A B C 0 p 1 3 2 1 q 4 3 2 2 r 4 0 9 我想创建一个字典，其中ID是键，B是值，因此它将是： d["q"] = 3 , d["r"] = 0 最好的方法是什么？...

pythonpandasdictionarydataframe

13得票3回答

如何将列描述为分类值？

我有一个包含分类和数字列混合的pandas数据框。默认情况下，df.describe()仅返回数值数据的摘要（描述具有count、mean、std、min、quantiles和max的列）。当迭代遍历df中的所有列并将它们描述为[df[c].describe() for c in df.col...

pythonpandasdataframedescribe