我有一个以tab文件形式反编译的stardict词典。
但是有没有自动化转换行的方法?我听说过
此外,是否有一种自动将希腊语转写的方式,例如使用 Perseus 的方法?
/edit: 或许我们可以使用 Unicode 代码?我们可以注意到对于
[1] http://en.kioskea.net/faq/1757-how-to-read-a-file-line-by-line
[2] How to remove all of the diacritics from a file?
κακός <tab> bad
其中 <tab>
表示制表符。
不幸的是,这些单词的定义要求查询包括所有变音标记。所以如果我想搜索 ζῷον,我需要正确地输入所有 iota 和 circumflex。
因此,我想将整个文件转换为没有变音符号的关键字。因此该行将变为
κακος <tab> <h3>κακός</h3> <br/> bad
我知道我可以像这里[1]描述的那样,在bash中逐行读取文件。
while read line
do
command
done <file
但是有没有自动化转换行的方法?我听说过
iconv
[2],但是使用它时没有达到预期的转换效果。最好使用一个 bash 脚本。此外,是否有一种自动将希腊语转写的方式,例如使用 Perseus 的方法?
/edit: 或许我们可以使用 Unicode 代码?我们可以注意到对于
x <8
等,U+1F0x
,U+1F8x
都是 α 字母的变体。这将减少手动工作量。我也接受 C++ 解决方案。[1] http://en.kioskea.net/faq/1757-how-to-read-a-file-line-by-line
[2] How to remove all of the diacritics from a file?