14得票8回答
如何在磁盘上扫描超大型文件?

考虑到磁盘上可能有一个非常大的文件(可能超过4GB),我想扫描该文件并计算特定二进制模式出现的次数。 我的想法是: 使用内存映射文件(CreateFileMap或boost mapped_file)将文件加载到虚拟内存中。 对于每个100MB映射内存,创建一个线程来扫描和计算结果。 ...

80得票13回答
如何在Windows上读取大型文本文件?

我有一个较大的服务器日志文件(~750 MB),无法使用Notepad或Notepad ++打开(它们都会显示文件太大)。 有人能建议一个程序(适用于Windows),每次仅将文件的一小部分读入内存吗? 还是我需要编写自己的应用程序来解析这个文件?

8得票2回答
使用最小的堆分配读取二进制格式的大型文件,并提取其中的文件。

对于标题感到抱歉,它可能有点令人困惑,但我不知道如何更好地解释它。 有两个扩展名为.cat(目录文件)和.dat的文件。 .cat文件包含.dat文件中二进制文件的信息。 此信息是文件的名称、大小、在.dat文件中的偏移量以及md5哈希。 例如.cat文件; assets/texture...

10得票3回答
Javascript 中的大型 blob 文件

我有一个XHR对象,可以下载1GB的文件。function getFile(callback) { var xhr = new XMLHttpRequest(); xhr.onload = function () { if (xhr.status == 200)...

8得票6回答
在整个文件中进行多行正则表达式搜索

我找到了很多关于如何使用正则表达式替换文件中文本的例子。然而,这可以归结为两个版本: 1. 迭代文件中的所有行,并将正则表达式应用于每一行 2. 加载整个文件。 对于“我的”文件来说,第二种方法不可行——它们大约有2GiB… 至于第一种方法:目前这是我的方法,但我想知道…如果需要应用跨越多行...

24得票6回答
如何在.NET中通过HTTP下载大文件?

我需要在C#控制台应用程序中通过HTTP下载一个大文件(2GB)。问题在于,在下载了约1.2GB后,应用程序会耗尽内存。 这是我正在使用的代码:WebClient request = new WebClient(); request.Credentials = new NetworkCred...

19得票3回答
使用C++解析非常大的CSV文件

我的目标是在OSX环境中的QT项目中使用C++解析大型csv文件。(当我说csv时,我指的是tsv和其他变体1GB ~ 5GB)。 这似乎是一项简单的任务,但当文件大小变得更大时情况变得复杂。由于与解析csv文件相关的许多边缘情况,我不想编写自己的解析器。 我已经找到了各种csv处理库来处理此...

12得票3回答
如何在 PHP 中检测 X-Accel-Redirect(Nginx)/ X-Sendfile(Apache)支持?

关于应用 我正在使用PHP开发一款电子商务应用程序。为了保护URL的安全,在PHP后面保留产品下载链接。有一个名为download.php的文件,它通过GET接受几个参数并根据数据库验证它们。如果一切顺利,它将使用PHP中的readfile()函数提供文件。 问题描述 当要传递给read...

12得票6回答
在处理一个非常大的文件时如何找到其中前k大的元素(当k很大时)

假设我们有一个包含数十亿个整数的非常大的文件,并且我们想要找到其中k个最大的值, 棘手的部分是k本身也非常大,这意味着我们不能在内存中保留k个元素(例如,我们有一个包含1000亿个元素的文件,我们想找到最大的10亿个元素) 怎样才能以O(n)的复杂度完成这个任务? 我认为: 我们开始读...

21得票2回答
致命错误:接近堆限制的无效标记-压缩,分配失败-在处理大文件时出现JavaScript堆内存不足错误。

我有一个Node.js脚本,用于处理一堆大型.csv文件(总共1.3GB)。它运行了一段时间后出现以下错误: FATAL ERROR: Ineffective mark-compacts near heap limit Allocation failed - JavaScript heap ...