45得票3回答
如何在后台线程高效地将大文件写入磁盘(Swift)

更新 我已经解决并移除了令人分心的错误。请阅读整篇文章,如有任何问题,请随意留言。 背景 我正在尝试使用Swift 2.0、GCD和完成处理程序将相对较大的文件(视频)写入iOS磁盘。我想知道是否有更有效的方法来执行此任务。该任务需要在不阻塞主UI的情况下完成,并使用完成逻辑,同时确保操...

33得票8回答
许多文本文件中包含大量数据-如何处理?

我有大量数据(几个TB),并且正在积累中...它们包含在许多制表符分隔的文本文件中(每个约30MB)。大部分任务涉及读取数据并根据一系列谓词语句对观测/行进行聚合(求和/平均值+其他转换),然后将输出保存为文本、HDF5或SQLite文件等。我通常使用R来完成这样的任务,但我担心这可能有点太大...

18得票4回答
在svn代码库中彻底删除大文件

作为本地的Subversion专家,我向每个人解释仅应将源代码和非巨型文本文件存储在版本库中,而不是巨大的二进制数据文件。也许可以将测试中的较小二进制文件放入版本库中。 不幸的是,我与“人类”一起工作!某个人可能会意外地提交一个800MB的二进制巨兽。这会减慢版本库操作。 据我上次检查,您...

10得票3回答
Powershell - 如何从一个目录中提取所有文本文件的第一行到单个输出文件中?

我有一个包含大约10,000个长度不同的文本文件的目录。所有文件大小都超过1GB。 我需要提取每个文件的第一行,并将其插入到同一目录下的新文本文件中。 我尝试了通常的MS-DOS批处理文件方法,但由于文件太大而崩溃。 是否有一种使用Streamreader在Powershell中完成此操...

8得票8回答
Delphi中处理超大XML文档的最快方法

我需要推荐在Delphi(我使用Delphi 2009)中使用什么来尽可能快地处理非常大的XML文件(例如100 MB)。 我需要输入XML,在程序中访问和更新其中的数据,然后再次导出修改后的XML。希望在快速的Windows机器上能够在几秒钟内完成输入和输出。 澄清一下。我预计将需要使用D...

11得票1回答
Ruby的CSV.open是否会缓存到内存并一次性写入全部内容?

CSV.open 在块退出时会将数据存储在内存中并一次性写入文件吗?还是会自动分批写入? require 'csv' CSV.open('result.csv', 'wb') do |csv| while row = next_row csv << row ...

39得票9回答
如何逐行从大文件中读取分行JSON?

我正在尝试加载一个非常大(大小为2GB)的文件,其中包含用换行符分隔的JSON字符串。例如:{ "key11": value11, "key12": value12, } { "key21": value21, "key22": value22, } … 我现在...

9得票3回答
NumPy实时过滤读取文件行

我有一个包含大量数字的CSV文件,需要加载其中的一部分数组。从概念上讲,我想调用np.genfromtxt(),然后对生成的数组进行行切片,但是: 该文件太大,可能无法放入RAM中。 相关行数可能很少,因此没有必要解析每一行。 MATLAB有函数textscan(),可以使用文件描述符...

43得票6回答
使用Python Iterparse处理大型XML文件

我需要在内存只有 2 GB 的计算机上编写一个 Python 解析器,能够处理一些非常大的文件(>2GB)。我想使用 lxml 中的 iterparse 来完成这个任务。 我的文件格式如下:<item> <title>Item 1</title> ...

7得票5回答
在C#中处理大文件

我有一个4GB的文件,想要进行基于字节的查找和替换。我写了一个简单的程序来实现它,但是执行一个查找和替换需要太长时间(超过90分钟),而一些我尝试过的十六进制编辑器可以在不将整个目标文件加载到内存中的情况下在3分钟以内完成任务。是否有人知道我可以实现相同功能的方法?以下是我的当前代码: ...