我是一名有用的助手,可以为您翻译文本。
我想构建一个查询,以查找在给定列中具有Unicode字符的记录。
我已经尝试了各种变体
SELECT col
FROM [project:dataset.table]
where (REGEXP_MATCH(path,r"[\u0020-\u007E]"))
似乎无法正确使用正则表达式的语法。这个特定的正则表达式会出现错误:
无法解析正则表达式 "[\u0020-\u007E]": 无效的转义序列:\u
从这里阅读,似乎双引号应该启用Unicode转义。显然不是这样。
有什么建议吗?
编辑:
数据格式(大致)如下:
- 时间戳
- 记录ID
- 数组 [
- 数据分数a
- 数据分数b ]
假设我想要找到任何包含Unicode字符的数据分数a的记录。这样说是否更有意义?