9得票3回答
有比kakasi库更好的五十音排序库吗?

"Better"在这里主要指准确性,但我也对其他系统在哪些标准上表现出色感兴趣。我对Perl绑定Text::Kakasi进行了有限的测试以检查其正确性,结果符合我们的需求。 use utf8; use Encode; use Text::Kakasi; use Unicode::Collat...

11得票3回答
如何使用Perl或其他编程语言对CJK(亚洲)字符进行排序?

如何在Perl中对中日韩(CJK)字符进行排序? 据我所知,按笔画数排序,然后按偏旁部首排序,似乎是这些语言的排序方式。还有一些按照发音排序的方法,但这种方法较不常见。 我尝试使用:perl -e 'print join(" ", sort qw(工 然 一 人 三 古 二 )), "\n...

56得票6回答
将TTC字体转换或提取为TTF字体 - 如何操作?

我已经花了8个多小时尝试在Windows上使用 STHeiti Medium.ttc.zip 字体。 但是我无法让它正常工作。是否有人能在Windows上成功使用该字体? 如果可以的话,请分享如何操作的步骤。

12得票4回答
Java中无法显示UTF-8 CJK字符

我已经研究了Unicode和UTF-8编码一段时间,我想我理解了它,所以希望这不是一个愚蠢的问题: 我有一个文件,其中包含一些CJK字符,并已保存为UTF-8。我安装了各种亚洲语言包,并且其他应用程序可以正确地呈现这些字符,所以我知道那部分是有效的。 在我的Java应用程序中,我按以下方式...

28得票2回答
使用Python和正则表达式查找字符串中的所有中文文本

今天我需要从一堆字符串中去掉中文,并寻找一个简单的 Python 正则表达式。有什么建议吗?

7得票7回答
使用日语编程语言/字符的编程技巧

我有几个想法,想写一些网络应用程序来帮助我和其他人更好地学习日语,因为我正在学习这门语言。 我的问题是网站大部分内容都是英文,所以需要流畅地混合使用日语字符,通常是平假名和片假名,但后来还会有汉字。我越来越接近实现这一目标:我已经弄清楚页面和源文件需要是unicode和utf-8内容类型。 ...

16得票2回答
中文语言代码

我们正在将一个旧的 .net 1.1 网站升级到 2.0 版本。该网站目前支持中文(繁体)和中文(简体)。 当尝试使用代码 zh-CHS(简体)和 zh-CHT(繁体)检测语言和文化时,我遇到了运行时错误: 请选取一个特定的文化,例如:zh-CN、zh-HK、zh-TW、zh-MO、zh-...

25得票4回答
使用虚拟信用卡凭据测试Android市场应用内购买功能

我已按照文档http://developer.android.com/guide/market/billing/index.html 配置了一个 Android 应用程序来使用应用内购买模块。当使用与真实信用卡关联的英国开发团队账户进行测试时,一切都很正常。然而,我的开发团队中有一部分是在中国...

20得票3回答
在Python中使用非ASCII字符编码电子邮件主题(SMTP)

我正在使用Python模块MimeWriter构造一封邮件,并使用smtplib发送。构造的邮件内容如下:file msg.txt: ----------------------- Content-Type: multipart/mixed; from: me<me@abc.com&gt...

8得票4回答
如何在Ruby正则表达式中匹配韩文字符?

我使用正则表达式进行用户名的基本验证,类似于[\w-_]+,现在我想添加对韩文字母的支持,同时仍保持相同的验证方式。 我不想允许特殊字符,如{}[]!@#$%^&*()等,我只想用某些东西替换\w,以匹配给定字母表中的内容,此外还包括[a-zA-Z0-9]。 这意味着像안녕这样的用...