将非ASCII符号降级为最接近的7位ASCII等效符号(最好使用Java)

7
有没有简单/轻量级的解决方案可以将至少一些非ASCII符号更改为相应的ASCII模拟符号?例如,这个字符串。
abc-åäö.txt

应该改为

abc-aao.txt

一些背景:压缩工具不可靠地支持UTF-8,因此需要降级。据我所知,谷歌的“下载附件为单个zip文件”功能将任何非ASCII符号替换为“_”字符。
PS:如果代码更容易理解,它可能也是另一种语言,我会将其移植到Java中。 PPS:这是我迄今为止的第一个问题,请不要把我减分到负数好吗?

那我们该怎么办,将其标记为重复问题吗?这两个问题看起来很相似,但在发布我的问题之前我仍然没有看到那个问题... - Anton Kraievyi
寻找 Unihandecode - n611x007
5个回答

4

1
如果您考虑使用Python,有一个非常好的Python包叫做unidecode,可以获取Unicode文本的ASCII音译。

1

或许this可以做到?


谢谢提供参考,但我没有看到实际的代码。显然这要么已经是JRE的一部分(如java.text.Normalizer或类似的东西),要么不是轻量级解决方案... - Anton Kraievyi

1

0

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接