我正在尝试在Java中解决从原始文本中删除符号和特殊字符的问题,但无法找到解决方法。该文本来自网站上的自由文本字段,可能包含任何内容。我从外部来源获取此文本,并且无法控制更改设置。因此,我必须在我的端上解决这个问题。
一些例子:
1)belem 应该是--> belem
2)Ariana 应该是--> Ariana
3)Harlem 应该是--> Harlem
4)Yz ️ 应该是--> Yz
5)ここさけは7回は見に行くぞ 应该是--> ここさけは7回は見に行くぞ
6)دمي ازرق وطني ازرق 应该是--> دمي ازرق وطني ازرق
请问有什么帮助吗?
yourString.replaceAll("\\W", "")
可以删除所有非单词字符。在这里查看正则表达式。 - TuyenNTA