将CHM文件转换为CSV或SQL

8
我想创建一个Facebook应用程序,但我需要使用的数据只能以CHM格式获得。
是否有可能将CHM文件转换为CSV或SQL?我们是否有任何现有的工具可以做到这一点?
感谢一如既往的帮助。

6
嘿,关注投票的人们。你们是在寻找借口试试“过于局限”吗? - xyz
你有没有找到类似的东西,适用于库兰a.z.我想将XML库兰翻译成波斯尼亚语。 - adopilot
不,我没有找古兰经。实际上,我正在制作一个Facebook应用程序,在用户的墙上随机发布一条哈迪斯。所以只需要他们填写数据库,我想我需要使用@mjv的方法,然后对文件使用正则表达式来创建自己的数据库。 - Atif
2个回答

3

顺便提一下,您应该指定要构建此数据集的语言(英语,阿拉伯语...),因为这会影响书籍来源的选择和转换工具。

识别数据内容来源
有趣的是,对于所有[交互式]在线哈迪斯搜索工具,例如CRCC的穆斯林文本汇编网站上的一个(原始来源于MSA West,但在 MSA 网站上某种方式不可用/无法正常工作),似乎没有底层数据库的可下载版本!
书籍本身有几个在线版本,特别是您提到的流行版本,但您需要适当解析和索引它们,以保留引用等。此外,返回到书籍,您将不得不自己关联它们。

关于转换 CHM 文件...
我不知道是否有开源或免费软件程序,但售价约为 $25.00 的共享软件ABC Amber CHM 转换器似乎是此目的的黄金标准。
我只是在几年前有过一次短暂的接触,进行了类似于您正在考虑的一次性转换工作。Amber 转换器“做到了这一点”;幸运的是,帮助页面的底层结构暴露出了很多规律性,这使得相对直接地将它们制表为 CSV/数据库字段成为可能。
ABC Amber 转换器支持许多语言,包括阿拉伯语(但我仅用于英语)。


1

有一个著名的开源*nix库叫做libchm,大多数*nix chm查看器都是基于它构建的。它带有一个工具,可以将.chm解压缩为其.html原始文件(从中您需要将html表格转换为.csv)

Lazarus/Free Pascal也有库,甚至可以编写代码,但据我所知没有现成的“chm编译器”工具。


谢谢 +1 .. 但我正在寻找一个Windows解决方案。 - Atif
我认为有Windows版本。Amber可能正在使用它。 - Marco van de Voort

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接