19得票3回答
在MongoDB中处理超过2GB的数据库

我们有一个基于文件的程序,想要将其转换为使用文档数据库,具体来说是MongoDB。问题在于,MongoDB在32位机器上的容量限制为2GB(根据 http://www.mongodb.org/display/DOCS/FAQ#FAQ-Whatarethe32bitlimitations%3F)...

19得票3回答
使用C++解析非常大的CSV文件

我的目标是在OSX环境中的QT项目中使用C++解析大型csv文件。(当我说csv时,我指的是tsv和其他变体1GB ~ 5GB)。 这似乎是一项简单的任务,但当文件大小变得更大时情况变得复杂。由于与解析csv文件相关的许多边缘情况,我不想编写自己的解析器。 我已经找到了各种csv处理库来处理此...

18得票4回答
在Linux上编辑非常大的SQL转储/文本文件

我需要导入一个大型的mysql dump(高达10G)。但是,SQL dump已经预定义了数据库结构和索引定义。我想通过删除索引和表格定义来加速数据库插入。 这意味着我必须在Linux上删除/编辑一个10G文本文件的前几行。那么,最有效的方法是什么? 需要将整个文件加载到内存中的程序对我来...

18得票4回答
在svn代码库中彻底删除大文件

作为本地的Subversion专家,我向每个人解释仅应将源代码和非巨型文本文件存储在版本库中,而不是巨大的二进制数据文件。也许可以将测试中的较小二进制文件放入版本库中。 不幸的是,我与“人类”一起工作!某个人可能会意外地提交一个800MB的二进制巨兽。这会减慢版本库操作。 据我上次检查,您...

17得票10回答
如何在.NET中处理非常大的XML文件时最好地使用XPath?

我需要在C#中处理相当大的XML文件(这里的大可能会达到1GB),包括执行一些复杂的XPath查询。我的问题是,我通常通过System.XML库进行处理的标准方式喜欢在对其进行任何操作之前将整个文件加载到内存中,这可能会导致这些大小的文件出现内存问题。 我不需要更新这些文件,只需读取它们并查...

17得票2回答
使用ASP.Net Webapi实现大图片的流式传输

我们正在尝试使用ASP.Net WebApi返回大型图像文件,并使用以下代码将字节流传输到客户端。public class RetrieveAssetController : ApiController { // GET api/retrieveasset/5 public H...

17得票4回答
Python中如何在打开文件后释放内存?

我正在使用Python打开一个大小为3GB的文件以读取字符串。然后我将这个数据存储在一个字典中。我的下一个目标是使用这个字典构建一个图形,因此我正在密切监控内存使用情况。 在我看来,Python会把整个3GB文件加载到内存中,而我无法摆脱它。我的代码如下:with open(filename)...

16得票4回答
Java:读取大文件时InputStream太慢

我需要逐个字符读取一个 53 MB 的文件。使用 C++ 中的 ifstream 完成只需毫秒级别,但使用 Java InputStream 则需要数分钟。Java 真的会这么慢吗?或者我漏掉了什么? 此外,我必须在 Java 中完成该程序(它使用 servlet,我必须调用处理这些字符的函...

16得票4回答
大规模数据绘图

我们目前正在使用ZedGraph绘制一些数据的折线图。输入数据来自任意大小的文件,因此我们不知道预先使用多少数据点。但是,通过打开文件并读取头文件,我们可以找出文件中有多少数据点。 文件格式基本上是[时间(双精度)、值(双精度)]。然而,时间轴上的条目不均匀。例如,在t = 0秒和t = 1...

16得票5回答
在 Linux C++ 应用程序中寻找并读取大文件

我在使用标准的ftell和fseek选项时遇到了整数溢出的问题,但我想我错了,因为似乎没有ftell64和fseek64选项。我一直在搜索,许多网站似乎都参考了使用off64_t数据类型的lseek,但我没有找到引用与fseek相等的内容示例。目前我正在读取超过16GB的CSV文件,并期望至少...