我已经搜索了一段时间,但仍然无法弄清楚。
我发现像([一-龯])|([ぁ-んァ-ン])这样的表达式,但不知道如何删除除此之外的所有内容。
我的想法是这样的:
1. おはようございます ohayou gozaimasu - 早上好! 2. こんにちは konnichiwa - 你好/下午好! 3. 久しぶり hisashiburi - 好久不见了。 4. じゃあまた jaa mata - 再见! 5. お元気で o genki de - 注意身体健康。 6. o namae wa nan desu ka - 你叫什么名字? 7. …desu - 我是......です 8. suki desu - 我喜欢它。 9. 如果你不会挥舞手帕告别(“さようなら” [sayounara]或“farewell”可能更合适),那么“じゃあまた”是一个很好的说“再见”的方式! 还可以使用稍微更礼貌的 “ではまた[dewa mata]”。“じゃあね(再见)”和“じゃあまた明日ね (jaa mata ashita ne – 明天见) ”也是快速友好的离别短语。 如果你在大阪,一定要尝试一些大阪方言“ほなね[hona ne]”! 10. 例子。啊,那是什么。 11. 1402 10点 12. 1405 11点 13 1408 12点 14 1411 1分钟 15 1414 2分钟 16. 1450 3小时 17. 1474 30小时
变成:
おはようございます こんにちは 久しぶり じゃあまた お元気で お名前は何ですか です 好きです さようなら じゃあまた ではまた じゃあね じゃあまた明日ね 大坂弁 ほなね ああ、それは、何ですか。 10点 11点 12点 1分钟 2分钟 3小时 30小时
\uXXXX
替换为\x{XXXX}
以在Notepad++中有效。在前面添加\d*
,用一个捕获组包裹,添加|.
备选项(因此,它看起来像(\d*(?:[\x{3000}-\x{303F}]|[\x{3040}-\x{309F}]|[\x{30A0}-\x{30FF}]|[\x{FF00}-\x{FFEF}]|[\x{4E00}-\x{9FAF}]|[\x{2605}-\x{2606}]|[\x{2190}-\x{2195}]|\x{203B})+)|.
),然后使用上述模式/答案中的替换。最好的问候。 - Wiktor Stribiżew