我从GAWK的GNU页面了解到它可以使用FPAT
变量处理数据中的定界符,但是我不知道这是如何工作的。对于CSV文件,FPAT的值为:
FPAT = "([^,]+)|(\"[^\"]+\")"
使用数据:
abc,"pqr,mno"
第一个分组表达式评估所有内容,即不是逗号,这应该将"abc"
作为数据,然后在第一个逗号出现时失败。现在我的问题是接下来会发生什么?由于第一个分组表达式失败了,正则表达式会继续使用或条件从逗号后面的字符继续吗?但是第一个分组表达式在逗号后面的所有数据中仍然有效,因此它可能会将"pqr
作为下一个数据?