如何使用Unix/Linux命令计算韩文单词块数?

3
韩语由词块组成(例如,가,나,다 라等)。 我需要一种方法来计算这些词块。 例如,单词바다(海)应返回2,但是 wc -w将返回1 wc -c将返回7
因此,这些选项对我无效。 我会感激你的帮助。
1个回答

5

바다以UTF-8编码后长度为6个字节。如果您想计算字符数,请使用wc -m命令:

$ printf "바다" | wc -c
       6
$ printf "바다" | wc -m
       2

好的,所以从wc -m中减去wc -w应该可以计算出块。太棒了。谢谢。 - Eungi Kim
2
@김은기:它们都偏移了1,因为echo会附加一个换行符,如果这不清楚,对不起。请查看我的更新。 - Blender

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接