我有几个这样的非结构化数据
test1 21;
test2 22;
test3 [ 23 ];
我想去掉不必要的空格,并将其转换为每行两项的列表,预期输出应如下所示。
['test1', '21']
['test2', '22']
['test3', ['23']]
现在,我正在使用这个正则表达式sub
方法来删除不必要的空格
re.sub(r"\s+", " ", z.rstrip('\n').lstrip(' ').rstrip(';')).split(' ')
现在的问题是它能够将不必要的空格替换为单个空格,这很好。但我在第三个例子中遇到了问题,在开放和关闭括号之后和之前有空格,我想要移除它们。但是使用上面的正则表达式我无法做到。
这是我目前得到的输出。
['test1', '21']
['test2', '22']
['test3', '[', '23', ']']
您可以在pythontutor中查看示例。
(本文为技术文献翻译,涉及Python代码)
['23']
是由数组生成的结果。正则表达式并不是其强项。 - sln