我正在实现泰米尔语的词法分析。我需要根据以下条件替换文本元素的值。
如果有任何单词同时包含ugaramStrings和泰米尔元音元素,则需要替换ugaram字符串并返回值。
例如,அமர்ந்*துஇ*னிது被替换为அமர்ந்*இ*னிது。 即 துஇ=>இ
我通过使用TextElementEnumerator类检查下一个字符串元素来完成此操作。 是否有可能使用RegularExpression进行替换?
string[] ugaramStrings = { "கு", "சு", "டு", "து", "பு", "று" };
string[] tamilvowels =
{
"அ",// "\u0b85"
"ஆ",//"\u0b86"
"இ",//"\u0b87"
"ஈ",//"\u0b88"
"உ",//"\u0b89"
"ஊ",//"\u0b8A"
"எ",// "\u0b8E"
"ஏ",//"\u0b8F"
"ஐ",//"\u0b90"
"ஒ",//"\u0b92"
"ஓ",//"\u0b93"
"ஔ"//"\u0b94"
};
如果有任何单词同时包含ugaramStrings和泰米尔元音元素,则需要替换ugaram字符串并返回值。
例如,அமர்ந்*துஇ*னிது被替换为அமர்ந்*இ*னிது。 即 துஇ=>இ
我通过使用TextElementEnumerator类检查下一个字符串元素来完成此操作。 是否有可能使用RegularExpression进行替换?
16位字符
(因此对于非BMP字符,有时只涉及一半的Unicode字符),并且不能直接处理完整的字形,因此很遗憾无法做到这样的事情。 - xanatos