假设有以下分区文件系统结构:
logs
└── log_type
└── 2013
├── 07
│ ├── 28
│ │ ├── host1
│ │ │ └── log_file_1.csv
│ │ └── host2
│ │ ├── log_file_1.csv
│ │ └── log_file_2.csv
│ └── 29
│ ├── host1
│ │ └── log_file_1.csv
│ └── host2
│ └── log_file_1.csv
└── 08
我一直在尝试在Impala中创建外部表:
create external table log_type (
field1 string,
field2 string,
...
)
row format delimited fields terminated by '|' location '/logs/log_type/2013/08';
我希望Impala能递归进入子目录并加载所有csv文件,但却无功而返。没有任何错误被抛出,但是表中也没有加载任何数据。
不同的通配符,例如
/logs/log_type/2013/08/*/*
或/logs/log_type/2013/08/*/*/*
也没有起作用。有什么方法可以做到这一点吗?还是我应该重新构建fs - 对此有什么建议吗?