我有一个波斯文本,如下:"۲۲۸在如果是关于承诺、支付现金等问题的情况下,法官可以根据第221条规定判决债务人以弥补因未能按时偿还债务而造成的损失。" 我的目标是从主要文本中分离出数字"۲۲۸"。如果这是一个普通的英语数字,我可以通过使用
来轻松完成。sscanf(text,"%d %[^\t\n]", &a);
但是C语言不会将波斯数字识别为十进制数。那么我该怎么办呢?
经过一些研究,我知道Objective-C将此文本识别为UTF-8格式,解决这个问题的一种方法是用英文数字替换波斯数字。