我有一个包含阿拉伯文本的utf-8编码文件,我需要对其进行搜索。
我的问题在于文本上的变音符号,如何跳过它们进行搜索?
比如说,如果你用Internet Explorer加载这个文本(当然是将文本转换成HTML),IE会跳过那些变音符号吗?
有什么帮助吗?
Edit1:搜索只需按照以下代码执行:
var m1 : TMemo; //contains utf-8 data)
m2 : TMemo; // contains results
...
m2.lines.BeginUpdate;
for s in m1.Lines do
begin
if pos(eSearch.Text,s)>0 then
begin
m2.Lines.Add(s);
end;
end;
m2.Lines.EndUpdate;
Edit2: Unicode数据示例:
如果您只搜索没有附加符号的字母,则不会找到带有符号的单词“قُلْ”。而要搜索该单词,需要输入“قل”。