我试图使用 Rails 根据搜索词从 Wikipedia 提取数据。例如,如果我有字符串“美国偶像”,我想将其传递给 Wikipedia 并获取与之相关的文章列表。我的目标是获取前三个超链接并在网站上显示它们。更进一步地,我想从维基百科中提取小段数据,比如信息框或前几个单词。有什么建议吗?谢谢!
你可以使用另一个宝石:https://github.com/kenpratt/wikipedia-client
这个宝石似乎只获取你搜索的第一个结果,但你可以查阅文档以确保。
关于内容,一旦你获取了页面,这个宝石允许你访问文章的不同内容、链接、图片等等。
http://www.e-tobi.net/blog/files/ruby-mechanize-cheat-sheet.pdf
Mechanize是一个模拟网站请求的工具箱,而nokogiri是一个HTML/XML解析器。应该很容易理解。