18得票2回答
在polars中,与pandas的DataFrame.drop_duplicates()等效的函数是什么?

在 Polars 中,与 pandas 中的 drop_duplicates() 等价的函数是什么? import polars as pl df = pl.DataFrame({"a":[1,1,2], "b":[2,2,3], "c":[1,2,3]}) df 输出: shape:...

16得票1回答
极光:从变量中创建具有固定值的列

我已经仔细查看了 polars 的文档,但没有找到一个用变量创建一个固定值列的示例。以下是在 pandas 中有效的方法: df['VERSION'] = version 谢谢

16得票1回答
如何在 Polars 中使用 groupby 和 apply?

我正在绞尽脑汁尝试在Python的Polars库中使用groupby和apply。从Pandas转移而来时,我曾经使用: def get_score(df): return spearmanr(df["prediction"], df["target"]).correlation c...

15得票1回答
使用Polars轻松将字符串列转换为pl.datetime

考虑一个 Polars 数据框,其中一列是str类型,表示日期格式为'27 July 2020'。我想将这一列转换为polars.datetime类型,该类型与Python标准库中的datetime不同。下面的代码使用标准的datetime格式可以工作,但是Polars不能将该列中的值识别为日...

15得票1回答
Py Polars: 如何使用类似于SQL中的'in'和'not in'来进行筛选

我该如何实现与SQL的IN和NOT IN相当的功能? 我有一个要求值列表。以下是场景: import pandas as pd import polars as pl exclude_fruit = ["apple", "orange"] df = pl.DataFrame( {...

12得票6回答
在 Polars 中,如何打印列表列的所有元素?

我有一个带有列表列的Polars DataFrame。我想控制打印pl.List列的元素数量。 我尝试过使用pl.pl.Config.set_fmt_str_lengths(),但是只有在将其设置为较小的值时才会限制元素数量,而在将其设置为较大的值时不会显示更多的元素。 我正在使用Jupy...

12得票2回答
Polars:Polars 中是否有像 json_normalize 一样的功能?

我翻阅了 Polars 的全部文档,但未找到可将嵌套的 JSON 转换为数据框的任何内容。 test = { "name": "Ravi", "Subjects": { "Maths": 92, "English": 94, "Hindi": 98 } }...

11得票1回答
如何使用.with_columns()向polars DataFrame添加列

我目前正在使用Polars数据框架创建一个新列,使用以下代码: predictions = [10, 20, 30, 40, 50] df['predictions'] = predictions 其中predictions是一个包含我用另一个工具计算出的值的numpy数组或列表。 然...

11得票3回答
在DataFrame中切换数据类型

我试图搜索是否有一种简单地更改带有数字的字符串的数据类型的方法。例如,我面临的问题如下: df = pl.Dataframe({"foo": ["100CT pen", "pencils 250CT", "what 125CT soever", "this is a thing"]...

10得票2回答
如何在不转换为Pandas的情况下使用Polars和Plotly?

我想用 Polars 替换 Pandas,但我找不到如何在不转换为 Pandas 的情况下使用 Polars 与 Plotly。我想知道是否有一种方法完全削减掉 Pandas 的过程。 考虑以下测试数据: import polars as pl import numpy as np imp...