编辑: 这已经在 Polars 存储库中作为错误进行了归档: https://github.com/pola-rs/polars/issues/6152 以及 VSCode Jupyter 存储库: https://github.com/microsoft/vscode-jupyter/iss...
在 polars 中是否有任何内置函数或更好的方法,可以通过定义时间分辨率(例如:天、小时、分钟)将时间持续时间转换为数字? # Create a dataframe df = pl.DataFrame( { "from": ["2023-01-01", "2023-...
我无法使用polars数据框架和scikitlearn进行机器学习训练。 目前,我正在polars中进行所有数据框预处理,在模型训练期间将其转换为pandas数据框,以便使其运作。 是否有一种方法可以直接使用polars数据框架进行机器学习训练,而不需要将其转换为pandas数据框?
我正在将Pandas数据帧转换为Polars数据帧,但是PyArrow会抛出错误。 我的代码: import polars as pl import pandas as pd if __name__ == "__main__": with open(r"test.xlsx", ...
我需要在数据框中创建一个新列来存储处理后的值。因此,我使用了polars的apply函数来对dicoms进行一些处理,然后返回值。但是默认情况下,这个apply函数将整个列作为polars Series处理,并且它不会逐行处理。 df = df.with_columns( [...
我正在使用polars代替pandas。我对其速度和惰性计算/评估感到非常惊讶。目前,有很多关于惰性dataframe的方法,但它们只能带我走这么远。 因此,我想知道将polars与其他工具结合使用以实现更复杂的操作(例如回归/模型拟合)的最佳方法是什么。 更具体地说,我将举一个涉及线性回...
在 Pandas 中,以下代码将把 col1 中的字符串拆分成多个列。在 Polars 中是否有类似的方法? d = {'col1': ["a/b/c/d", "a/b/c/d"]} df= pd.DataFrame(data=d) df[["a","b","c","d"]]=df["col...
在Polars中是否有类似于df.groupby().shift的等效方法?在组内使用pandas.shift()
如何比较两个极性的DataFrames的值相等性?看起来只有当这两个表是同一个对象时,==才为true: import polars as pl pl.DataFrame({"x": [1,2,3]}) == pl.DataFrame({"x": [1,2,3]}) # False