我有一组完整的URL,例如
http://en.wikipedia.org/wiki/Episkopi_Bay
http://en.wikipedia.org/wiki/Monte_Lauro
http://en.wikipedia.org/wiki/Lampedusa
http://en.wikipedia.org/wiki/Himera
http://en.wikipedia.org/wiki/Lago_Cecita
http://en.wikipedia.org/wiki/Aspromonte
我想找到这些URL的维基百科页面ID,我之前使用过Mediawiki API,但我不知道如何实现。
我尝试从URL中提取页面标题,通过获取最后一个斜杠("/")和最后一个字符的子字符串,然后查询API以获取页面ID。
http://en.wikipedia.org/wiki/Episkopi_Bay --> Episkopi_Bay
http://en.wikipedia.org/wiki/Monte_Lauro --> Monte_Lauro
http://en.wikipedia.org/wiki/Lampedusa -- > Lampedusa
http://en.wikipedia.org/wiki/Himera --> Himera
http://en.wikipedia.org/wiki/Lago_Cecita --> Lago_Cecita
http://en.wikipedia.org/wiki/Aspromonte --> Aspromonte
但问题在于,我有些链接可能是重定向的,因此子字符串不一定总是页面的标题。
TL;DR:如何从URL找到维基百科页面的页面ID?