从BigQuery的导入文档中可以看到,
我认为可以采取的一种方法是将所有的
顺便说一句,我尝试使用一个包含
因此我假设在导入BigQuery时,json格式的数据中不允许使用注意:不允许使用Null值。
null
。然而,在常规的ETL任务中,null
值实际上非常常见(由于数据缺失)。那么应该如何导入这种包含null
值得JSON源文件呢?请注意,我的数据包含嵌套结构,因此我不希望将其转换为CSV并使用,,
表示null
值。我认为可以采取的一种方法是将所有的
null
值替换为不同数据类型的默认值,例如:
- 字符串:
null
-> 空字符串 - 整数:
null
-> -1 - 浮点数:
null
-> -1.0 - ...
顺便说一句,我尝试使用一个包含
null
值的json文件进行bq load
操作。但我遇到了下面的错误:Failure details:
- Expected '"' found 'n'
- Expected '"' found 'n'
- Expected '"' found 'n'
- Expected '"' found 'n'
- Expected '"' found 'n
...
我认为这是使用null
的指示,这正确吗?
编辑:如果我删除所有的null
字段,似乎可以正常工作。我猜这是处理null
数据的方法。您不能为数据字段设置null
,但可以不包含它。因此,我需要编写过滤代码来移除原始json中的所有null
字段。