最新 'memory-efficient' 问题 - 第2页

关联标签

12得票1回答

我希望以一种“Pythonic”的方式将3D numpy数组拆分为3D块。我正在处理相当大的图像序列数组（1000X1200X1600），因此需要将它们分成几个部分进行处理。我已编写了函数来执行此操作，但我想知道是否有一种本地numpy方法可以实现此操作 - numpy.split似乎不...

11得票4回答

我的一个朋友向我展示了下面的Python代码：a[1:] == a[:-1] 如果 a 中的所有项都相同，则返回 True。我认为从第一眼看起来就很难理解该代码，并且更重要的是，它在内存使用上效率低下，因为将创建两个 a 的副本进行比较。我使用了 Python 的 dis 工具查看了 ...

8得票2回答

我很好奇，无论是解释性如何，将数据存储在长格式还是宽格式中哪种更有效率？我使用 object.size() 来确定内存中的大小，但它们没有显著差异（长格式在大小方面略微更有效），而且该值仅为估计。除了原始大小之外，我还想知道哪种格式在建模时更高效。

7得票4回答

我有一个数据帧 df: df = pd.DataFrame({'id1':[1,1,1,1,1,4,4,4,6,6], 'id2':[45,45,33,33,33,1,1,1,34,34], 'vals':[...

8得票1回答

显然在Python中，整数占用24个字节。我可以理解这是因为表示无限数字需要额外的细节处理。但是布尔数据类型也占用了24个字节，即使它只包含两个值。为什么？编辑：我不是在询问存储布尔型变量的最佳方法。我已经从其他答案中了解到NumPy、BitArray等工具。我的问题是“为什么”，而不是“...

9得票2回答

在常规面向对象编程实践中，对象具有多个不相关的成员属性并不罕见。当处理对象时，很常见会进行不同的操作，以针对其属性的不同部分。在这方面，创建对象集合的典型方法似乎不是非常高效的。考虑到计算机访问内存的方式以及缓存行的平均大小，缓存存储器很可能被填满了不需要的内容，但只是因为那些内容恰好相邻...

7得票1回答

问题：我有一个基于共同基类的对象家族，需要通过整数值来识别特定的具体类型。有两种明显的方法可以做到这一点，但是在内存或CPU时间方面都带来了不可接受的开销。由于项目涉及数十亿个对象，即使是最小的开销也会被严重强调，我已经测试过了，这不是过早优化的情况。处理对象所涉及的操作都是微不足道的...

7得票3回答

假设我有一个N面的骰子，每个面的概率不均匀，并且我投掷它M次。现在，我们不再观察每次投掷的结果，而只观察它们的总和。我需要编写一个似然函数，其中我必须对多项式似然函数的组成部分进行求和，限制为具有观察到的总和。如果N=3，M=2，总和为4，那么很明显，我必须对两种情况进行求和：一次投掷...

23得票4回答

A是一个整数数组。所有的值都在0到A.Length-1之间。这意味着0 <= A[i] <= A.Length-1 我需要找出重复的元素；如果有多个重复的元素，则选择重复项索引较低的元素。例如：a = [3, 4, 2, 5, 2, 3] 然后result = 2 这...

8得票1回答

为了提高内存效率，我一直在将我的代码从列表转换为生成器/迭代器。我发现很多情况下，我只是将自己制作的列表转换为一个np.array，并采用np.array(some_list)的代码模式。值得注意的是，some_list通常是一个正在迭代生成器的列表解析。我正在研究np.fromite...