我搜索了很多地方,但没有写明如何从Notepad ++中删除非ASCII字符的方法。
我需要知道在查找和替换中要写什么命令(有图片会很好)。
如果我想要创建白名单并将所有ASCII单词/行标记为书签,使非ASCII行未标记
如果该文件很大,无法选择所有ASCII行,并且只想选择包含非ASCII字符的行...
我搜索了很多地方,但没有写明如何从Notepad ++中删除非ASCII字符的方法。
我需要知道在查找和替换中要写什么命令(有图片会很好)。
如果我想要创建白名单并将所有ASCII单词/行标记为书签,使非ASCII行未标记
如果该文件很大,无法选择所有ASCII行,并且只想选择包含非ASCII字符的行...
除了ProGM的回答外,如果您看到像NUL或ACK这样的方框字符并希望将它们去掉,那么这些是ASCII控制字符(0到31),您可以使用以下表达式找到它们并删除:
[\x00-\x1F]+
为了移除所有的非ASCII和ASCII控制字符,您应该移除与这个正则表达式匹配的所有字符:[^\x1F-\x7F]+
\x00
到 \x1F
的值已经被 ProGM 匹配在答案中。 - Unihedronmgsub("[^\x1F-\x7F]+", "", text_vector, fixed = FALSE)
- Pablo Adames保留换行:
接下来:
现在,选择替换选项扩展并将#替换为\n
:) 现在,您拥有一个干净的ASCII文件 ;)
另一种方法是...
如果你不记得正则表达式或者不想查找,这是一个不错的方法。但其他人提到的正则表达式也是一种好的解决方案。
另一个好的技巧是进入您的编辑器的UTF8模式,这样您就可以实际看到这些有趣的字符并自己删除它们。
[\x00-\x08\x0B-\x0C\x0E-\x1F]+
点击“查看/显示符号/显示所有字符” - 显示文件中的[SOH]字符 在文件中点击[SOH]符号 CTRL=H 弹出替换窗口 将“查找内容:”保持不变 将“替换为:”更改为您选择的字符(逗号、分号、其他...) 点击“全部替换” 完成!
[\x00-\x09\x0B-\x0C\x0E-\x1F]+
- Steffen Winkler