使用ImportXML提取包含特定字符串的链接的URL和锚文本

3

我正在尝试在Google Sheets中使用ImportXML来提取包含字符串的链接的URL和锚点。问题是我想避免将字符串硬编码,而希望它从另一个单元格中提取。

硬编码的例子:

=IMPORTXML("http://www.debian.org/mirror/list", "//a/@href[contains(., 'about')]")

期望的结果(使用 A2 代替 about):

=IMPORTXML("http://www.debian.org/mirror/list", "//a/@href[contains(., A2)]")

我尝试将A2放在引号中,但没有起作用。

1个回答

3
请尝试:
=IMPORTXML("http://www.debian.org/mirror/list", "//a/@href[contains(.,'"&A2&"' )]")  

在双引号外面加单引号(与以前一样),并且在双引号内部的 & 两侧也加上单引号。

太棒了!它奏效了。&的用法是什么?我什么时候需要使用它们?它们是某种转义字符吗? - dzhi
另外,我如何限制通过此调用获取的内容量?因为偶尔会出现错误“由于内容会跨越多个单元格,数组结果未扩展到C3”,这意味着内容将超过一个单元格,例如有超过2个包含所提供字符串的链接。我该如何限制它或使底部行自动向下移动? - dzhi
1
好的,我会研究一下。非常感谢! - dzhi
1
是的,通过ARRAY_CONSTRAIN限制为1个单元格/行就解决了问题。 - dzhi

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接