我想创建一个Facebook应用程序,但我需要使用的数据只能以CHM格式获得。
是否有可能将CHM文件转换为CSV或SQL?我们是否有任何现有的工具可以做到这一点?
感谢一如既往的帮助。
是否有可能将CHM文件转换为CSV或SQL?我们是否有任何现有的工具可以做到这一点?
感谢一如既往的帮助。
顺便提一下,您应该指定要构建此数据集的语言(英语,阿拉伯语...),因为这会影响书籍来源的选择和转换工具。
识别数据内容来源:
有趣的是,对于所有[交互式]在线哈迪斯搜索工具,例如CRCC的穆斯林文本汇编网站上的一个(原始来源于MSA West,但在 MSA 网站上某种方式不可用/无法正常工作),似乎没有底层数据库的可下载版本!
书籍本身有几个在线版本,特别是您提到的流行版本,但您需要适当解析和索引它们,以保留引用等。此外,返回到书籍,您将不得不自己关联它们。
关于转换 CHM 文件...
我不知道是否有开源或免费软件程序,但售价约为 $25.00 的共享软件ABC Amber CHM 转换器似乎是此目的的黄金标准。
我只是在几年前有过一次短暂的接触,进行了类似于您正在考虑的一次性转换工作。Amber 转换器“做到了这一点”;幸运的是,帮助页面的底层结构暴露出了很多规律性,这使得相对直接地将它们制表为 CSV/数据库字段成为可能。
ABC Amber 转换器支持许多语言,包括阿拉伯语(但我仅用于英语)。
有一个著名的开源*nix库叫做libchm,大多数*nix chm查看器都是基于它构建的。它带有一个工具,可以将.chm解压缩为其.html原始文件(从中您需要将html表格转换为.csv)
Lazarus/Free Pascal也有库,甚至可以编写代码,但据我所知没有现成的“chm编译器”工具。