得票数最多 'file-processing' 问题

关联标签

53得票11回答

从Unix中随机选择文件中的行而不将其全部读入

我有一个包含1000万行的文件，我想从中随机选择1/100行。这是我编写的AWK代码，但它会先将整个文件内容读入内存中。我的电脑内存无法处理这么大的文件。有其他方法可以实现吗？awk 'BEGIN{srand()} !/^$/{ a[c++]=$0} END { for ( i=1;i...

linuxunixawkrandomfile-processing

49得票4回答

使用GNU parallel拆分命令行参数

使用GNU parallel：http://www.gnu.org/software/parallel/ 我有一个需要两个参数的程序，例如：$ ./prog file1 file2 $ ./prog file2 file3 ... $ ./prog file23456 file23457 我使...

bashfile-processinggnu-parallel

10得票2回答

我能否从运行在服务器上的Web API应用程序将文件写入服务器上的文件夹？

我在我的Web API应用程序中有这段代码，用于将数据写入CSV文件： private void SaveToCSV(InventoryItem invItem, string dbContext) { string csvHeader = "id,pack_size,descrip...

c#asp.net-web-apifile-permissionsstreamwriterfile-processing

10得票2回答

使用延迟文本和字节字符串处理一个非常大的文本文件

我正在尝试处理一个非常大的Unicode文本文件（6GB+）。我想要的是统计每个唯一单词的频率。在遍历文件时，我使用严格的 Data.Map 来跟踪每个单词的计数。这个过程需要太多的时间和内存（20GB+）。我怀疑Map很大，但我不确定它是否应该达到文件大小的5倍！以下是代码。请注意，我尝...

haskelltexthashmapbigdatafile-processing

10得票3回答

遍历文件树的并行版本（Java或Scala）

有没有人知道任何Java Files.walkFileTree的并行等效方法或类似的东西？可以是Java或Scala库。有没有任何Java Files.walkFileTree 的并行等效方法或类似工具呢？可以使用Java或Scala库来实现。

javamultithreadingscalaiofile-processing

8得票1回答

如何以制表符分隔的方式写入文件？

所以我有一个来自bed文件的数据框，叫做input.bed： V1 V2 V3 V4 1 chr1 11323785 11617177 TF1 2 chr1 12645605 13926923 TF2 3 chr1 14750216 15119039...

rfilefile-processing

8得票7回答

如何使用Perl从文件中获取恰好n行随机行？

在这个问题的基础上，我需要从文件（或stdin）中随机获取恰好n行。这类似于head或tail，但我想要一些中间的行。现在，除了使用链接问题中的解决方案循环遍历文件外，有没有更好的方法在一次运行中获得恰好n行呢？作为参考，我尝试了以下方法： #!/usr/bin/perl -w us...

perlrandomfile-processing

8得票6回答

如何在Perl中执行类似于SQL的Join操作？

我需要通过合并两个不同的文件来处理一些数据。它们都有两列，可以形成一个主键，我可以使用该主键将它们一侧相匹配。这些文件非常庞大（大约5GB，包含2000万行），因此我需要高效的代码。我如何在Perl中实现这个功能？以下是示例：如果文件A包含列： id, name, lastname,...

perlfile-processingfilemerge

8得票4回答

C：定位到文件中已知行的最佳方法

我有一个文件，我想遍历它，但不处理当前行。我要找的是在文本文件中定位到特定行的最佳方法。例如，将当前行存储到变量中似乎没有用，直到我到达预定的行。示例： file.txt foo fooo fo here 通常，要达到这个目的，我会执行以下操作： FILE* file = fop...

cfileiofgetsfile-processing

7得票2回答

将文件夹名称附加到所有子文件夹中的文件名中，使用Python实现。

我将尝试在文件夹名称后附加所有文件名。我必须遍历包含子文件夹的父文件夹。我必须使用Python而不是bat文件。例如，将这些文件夹： Parent Folder Sub1 example01.txt example01.jpg example01.tif Sub2 e...

pythonfile-processing