10得票6回答
Python Polars中的Pandas REPLACE等效函数是什么?

请问有一种优雅的方法可以在 polars 数据框中重新编码数值吗? 例如: 1->0, 2->0, 3->1... 在Pandas中,这很简单: df.replace([1,2,3,4,97,98,99],[0,0,1,1,2,2,2])

10得票1回答
提取 Polars 文字量的值

如果我有一个 Polars 文字值,如何提取其值? import polars as pl expr = pl.lit(0.5) val = float(expr) # TypeError: float() argument must be a string or a real numb...

10得票2回答
Python中的Polars DataFrame内存大小

我在思考特定极地数据帧的大小问题。 我尝试使用: from sys import getsizeof getsizeof(df) Out[17]: 48 getsizeof(df.to_pandas()) Out[18]: 1602923950 看起来所有的极地数据框都是48个字节?有...

9得票1回答
将函数应用于Polars-DataFrame的所有列

我知道如何将函数应用于 Pandas-DataFrame 中的所有列。然而,当使用 Polars-DataFrame 时,我还没有想出如何实现这一点。 我查看了 Polars 用户指南中专门介绍此主题的部分,但我没有找到答案。这里附上一段代码片段,其中包含我的失败尝试。 import nu...

9得票1回答
如何在polars-python中删除行

如何添加新功能,例如数据框的长度和使用索引删除行的值。 我想添加一列新的列,其中我可以计算数据框中可用的行数, 并且使用索引删除行的值。 for i in range(len(df)): if (df['col1'][i] == df['col2'][i]) and (df['col...

9得票2回答
我该如何在Python Polars中追加或连接两个数据框?

我发现使用系列命名空间是可以进行追加的 (https://dev59.com/r24NtIcB2Jgan1znVlQK#70599059)。 我想知道是否有类似的方法来追加或连接数据框。 在pandas中,历史上可以使用df1.append(df2),但是该方法已经被弃用 (如果还没有被弃用...

9得票2回答
从polars数据框中每个组中抽取一个样本?

我正在寻找一个类似于以下的函数 df.groupby('column').agg(sample(10)) 所以我可以从每个组中随机选择十个或更多元素。 这是为了我能够读取一个LazyFrame并且只使用每个组的小样本,而不是整个数据框架。 更新: 一个大致的解决方案是: df =...

9得票2回答
Polars:在read_csv中一次性指定所有列的数据类型

在 Polars中,如何在read_csv中为所有列指定单个数据类型? 根据文档,read_csv的dtypes参数可以采用映射(字典)的形式{'column_name': dtype}或者是一个包含每个列的dtype列表。然而,如何指定“我希望所有列都是同一种数据类型”并不清楚。 例如,...

8得票4回答
如何将Spark DataFrame转换为Polars DataFrame?

我想知道如何将Spark DataFrame转换为Polars DataFrame。 假设我有以下PySpark代码: df = spark.sql('''select * from tmp''') 我可以使用 .toPandas 轻松将其转换为 pandas dataframe。在 ...

8得票2回答
Polars 循环遍历数据集中的行

我正在尝试使用以下代码循环遍历 Polars 记录集: import polars as pl mydf = pl.DataFrame( {"start_date": ["2020-01-02", "2020-01-03", "2020-01-04"], "Name":...