我有一个VB.NET程序,处理文档内容。
该程序处理大量文档作为“批处理”(> 200万个文档;总容量1TB)。
其中一些文档可能包含控制字符或类似f0e8的字符(http://www.fileformat.info/info/unicode/char/f0e8/browsertest.htm)。
是否有一种简单而尤其快速的方法来删除这些字符?(除了空格、换行符、制表符等) 如果答案是正则表达式:有人可以提供一个完整的正则表达式吗?
谢谢!
是否有一种简单而尤其快速的方法来删除这些字符?(除了空格、换行符、制表符等) 如果答案是正则表达式:有人可以提供一个完整的正则表达式吗?
谢谢!