我希望在Linux环境下替换文件中的ASCII/英文字符,并保留Unicode字符。
INSERT INTO text (old_id,old_text,old_flags) VALUES (2815829,'[[चित्र:Youth-soccer-indiana.jpg|thumb|300px|right|बचपन का खेल.एसोसिएशन फुटबॉल, ऊपर दिखाया गया है, एक टीम खेल है जो सामाजिक कार्यों को भी प्रदान करता है।]]\n\n\'\'\'खेल\'\'\', कई [[नियमों]] एवं [[रिवाजों]] द्वारा संचालित होने वाली एक [[प्रतियोगी]] गतिविधि है। \'\'खेल\'\'
我已经尝试过
~$ sed 's/[^\u0900-\u097F]/ /g' hi.text but the range
但是我遇到了以下问题
sed: -e 表达式 #1,字符 23:无效的范围结尾
我也尝试了这个方法,似乎可以工作,但并不完全。
sed 's/[a-zA-Z 0-9`~!@#$%^&*()_+\[\]\\{}|;'\'':",.\/<>?]//g' enwiki-latest-pages-articles-multistream_3.sql >result.txt
有人能告诉我如何在Unicode范围正则表达式中使用sed吗?