7得票5回答
从大型数据集的一对列中选择最后一个有效的数据日期。

我有一个数据框,其中第一列包含日期,其他列包含这些日期上的数据: date k1-v1 k1-v2 k2-v1 k2-v2 k1k3-v1 k1k3-v2 k4-v1 k4-v2 0 2021-01-05 2.0 7.0 NaN N...

9得票1回答
将数据框中的每一行与所有行进行比较,并将结果保存在列表中,逐行处理。

我会尽力进行翻译,以下是您需要翻译的内容:我尝试使用 fuzzywuzzy.fuzzy.partial_ratio() >= 85 将每一行与 pandas dataframe 中的所有行进行比较,并将结果写入每一行的列表中。 示例: df = pd.DataFrame({'id':...

17得票3回答
加速Matplotlib?

我曾在这里读到,matplotlib擅长处理大型数据集。我正在编写一个数据处理应用程序,并将matplotlib的图表嵌入到wx中。但是,我发现matplotlib在处理大量数据方面非常糟糕,无论是速度还是内存方面都表现不佳。除了对输入进行下采样之外,是否有人知道加速(减少内存占用)matpl...

9得票2回答
在数据框中对一个列的数据进行分类。

我有一个数据框中的一列数字,我想把这些数字分为高、低、排除等类别。我该如何实现这个目标呢?我很困惑,我试过使用cut函数和category数据类型,但不知道怎么操作。

8得票1回答
Python和Pandas - pd.Series中int32和int64的差异

我开始学习Python、NumPy和Pandas,但有一个非常基础的问题是关于大小。 请看下面的代码块: 1. 长度:6,dtype:int64 # create a Series from a dict pd.Series({key: value for key, value in z...

9得票2回答
日志文件转换为 Pandas 数据框架。

我有日志文件,其中有许多形如以下的行: LogLevel [13/10/2015 00:30:00.650] [Message Text] 我的目标是将日志文件中的每一行转换为一个漂亮的数据框。我已经尝试通过在 [ 字符上分割行来做到这一点,但是我仍然没有得到一个整洁的数据框。 ...

10得票1回答
在涉及交互式小部件的Jupyter Notebook中删除相同单元格中的先前Matplotlib图形

这只是一个困扰我一段时间的小问题。 我有一个由所有连续变量组成的Pandas数据帧。我想要用Matplotlib绘制散点图,以任意选择的变量对为横纵坐标,并在Jupyter中使用交互式小部件。 假设数据有3个数字列:'a','b'和'c'。 到目前为止,我有以下几行代码: def g(...

39得票1回答
使用Pandas GroupBy绘制结果

我正开始学习 Pandas,并且正在尝试找到实现某些任务的最 Pythonic(或“Panda-thonic”)方法。 假设我们有一个包含列 A、B 和 C 的 DataFrame。 列 A 包含布尔值:每行的 A 值都是 true 或 false。 列 B 具有一些重要值,我们想要绘制...

14得票1回答
Matplotlib:在3D条形图的x轴上格式化日期

如果有这个3D条形图的示例代码,你该如何将x轴上的数字数据转换为格式化的日期/时间字符串?我尝试使用ax.xaxis_date()函数但没有成功。我还尝试使用plot_date()函数,但它似乎不适用于3D条形图。下面是一个修改过的示例代码,用于说明我的尝试:from mpl_toolkits...

19得票2回答
如何获取等高线图中绘制的线条的(x,y)值?

有没有一种简单的方法可以获取绘制如下轮廓线的(x,y)值:import matplotlib.pyplot as plt x = [1,2,3,4] y = [1,2,3,4] m = [[15,14,13,12],[14,12,10,8],[13,10,7,4],[12,8,4,0]] cs...