在BigQuery标准SQL中,有没有一种解析XML标签的方法?

3

我读过一篇文章,说使用正则表达式解析XML/HTML是一个不好的想法。替代建议是使用XML解析器。BigQuery标准SQL库中是否存在这样的解析器?


2
你能使用JavaScript UDF吗?你可以使用JavaScript解析XML。 - Elliott Brossard
@ElliottBrossard,你能再解释一下吗?如果你认为使用JavaScript UDF很有用,请在回答中发布如何使用它的信息。谢谢。 - Rodrigo C.
这份文档可能会有所帮助: https://cloud.google.com/bigquery/docs/reference/standard-sql/user-defined-functions - Michael Moursalimov
谢谢。这非常有帮助。 - Jonny Brooks
1个回答

7
这是有关如何像Elliot所提到的那样在BigQuery中使用Javascript UDF的文档。

https://cloud.google.com/bigquery/docs/reference/standard-sql/user-defined-functions

我想这个UDF可能看起来像这样

CREATE TEMPORARY FUNCTION XML(x STRING)
RETURNS STRING
  LANGUAGE js AS """
  var data = fromXML(x);
  return data.title;
"""
OPTIONS(
library="gs://<BUCKET_NAME>/from-xml.min.js"
);
SELECT XML(a) FROM UNNEST(["<title>Title of Page</title>"]) as a

from-xml.min.js源自this库,并加载到您的gcs帐户中


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接