XPath用于import.io的URL

Question

XPath用于import.io的URL

3

我正在获取这个网站上提供的工作列表：http://telekom.jobs/global-careers

我试图获取链接的XPath以获得有关工作的更多信息。

这是第一个链接的完整XPath：

/html/body/div[3]/div/div[2]/div[3]/table/tbody/tr[2]/td/div/a/@href

这是我应该复制到import.io的内容：

tr[2]/td/div/a/@href

但是它不起作用，我不知道为什么。

关于职位页面的更多信息链接具有XPath：

tr[2]/td/div/a/@href
tr[4]/td/div/a/@href
tr[6]/td/div/a/@href
tr[8]/td/div/a/@href

等等。也许这就是为什么它不起作用的原因？因为数字不是 1、2、3 等，而是 2、4、6？还是我做错了什么？

- Marcin

1

你知道链接是由Javascript生成的吗？ - Gilles Quénot

@sputnick 是的，这会有什么影响吗？如果我粘贴到import.io中'//tr[2]/td/div/a/@href'，这将显示每一行中第一个工作的链接。 - Marcin

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- raza · Accepted Answer

如果你从URL 2.0创建API并在JS开启但CSS关闭的情况下重新加载网站，你应该能够看到可折叠菜单：

该网站的DOM构建方式使得所有奇数行都有职位标题，而有关职位的更多信息则隐藏在偶数行中。为此，我们可以使用XPath的position()属性，在手动行训练中可以使用以下XPath：

/html/body/div[3]/div/div[2]/div[3]/table/tbody/tr[position() mod 2 = 0]

这段内容涉及IT技术，介绍了如何获取一个数据框中的信息。您可以使用xpath定位到具有标题和链接属性的元素，并从中选择特定的属性。以下是该数据框的Link xpath：.//a[@class=’forward jobadview’]/@href，Title xpath则为：.//div[@class=’info’]//h3。

但是，由于网站大量使用JS，因此可能无法发布信息。我们已经为您创建了API以查询数据，您可以通过链接https://import.io/data/mine/?id=0626d49d-5233-469d-9429-707f73f1757a检索相同的数据。