我有数百GB的数据需要使用Cygwin中的unix paste工具进行拼接,但如果文件中存在Windows EOL字符,则该工具无法正常工作。这些数据可能具有或不具有Windows EOL字符,并且如果不需要运行dos2unix,则不想花费时间。
因此,我的问题是,在Cygwin中,如何确定这些文件是否具有Windows EOL CRLF字符?
我尝试创建一些测试数据并运行:
sed -r 's/\r\n//' testdata.txt
但是,无论是否运行了dos2unix,它似乎都匹配。
谢谢。
file
的源代码(src / file.h
)似乎检查256千字节(HOWMANY
),因此听起来您的输入确实缺少非常长的行终止符。) - sarnold