18得票5回答
如何在未注册Bot帐户的情况下,通过编程从Wikimedia Commons下载图像?

似乎唯一能够获得机器人账户批准的方式是如果它添加或编辑了维基媒体上已有信息。如果您尝试使用某些 API 库下载任何图像,而没有机器人帐户,则会收到错误消息而不是图像。似乎他们阻止不通过浏览器进入的任何人?还有其他人有这方面的经验吗?我错过了什么吗?

11得票2回答
合并MediaWiki内容

我目前有两个MediaWiki,其中一个版本比另一个略旧。我想将它们的内容合并在一起,而不会删除重复的页面。目前我能想到的最好的选择是使用类似pywikipedia的机器人遍历其中一个维基百科的所有页面,并尝试将其插入到另一个维基百科中,并重命名重复的页面。 然而,这种方法似乎需要相当长的时...

9得票6回答
如何加速Pywikibot?

我使用Pywikibot构建了一些报告工具。随着事物的增长,现在需要花费长达2个小时才能完成报告,因此我正在寻求加快速度的方法。主要思路: 禁用节流,脚本是只读的,因此page.get(throttle=False)可以处理此问题 缓存 直接数据库访问 不幸的是,我找不到有关缓存和数据...

8得票6回答
如何使用Pywikibot获取维基页面的HTML?

我正在使用pywikibot-core,并且之前使用过另一个Python Mediawiki API包装器Wikipedia.py(它有一个.HTML方法)。我转换到pywikibot-core,因为我认为它具有更多功能,但我找不到类似的方法。(请注意:我不是很熟练。)