在LUA中去除字符串中的特殊字符

3
我正在清理包含邮政编码的数据列,以便在处理这些值之前对其进行处理。数据包含各种疯狂的格式或输入,如以下内容,并且是CHAR数据类型:
12345 12.345 1234-5678 12345 6789 123456789 12345-6789 . [空白]
我想删除所有特殊字符,并尝试了以下代码,但我的脚本在逻辑的多次迭代后失败了。当我说它失败时,让我们说sOriginalZip = '.',但即使在我替换了所有特殊字符、控制字符和空格字符之后,它仍然超过了我的空字符串检查和nil检查,就好像它不是空的一样。所以我的输出看起来像这样:" 2 sZip5 = "
代码:
nNull = nil
sZip5 = string.gsub(sOriginalZip,"%p","")
sZip5 = string.gsub(sZip5,"%c","")
sZip5 = string.gsub(sZip5,"%s","")
print("sZip5 = " .. sZip5)
if sZip5 ~= sBlank or tonumber(sZip5) ~= nNull then
    print(" 2 sZip5 = " .. sZip5)

else
    print("3 sZip5 = " .. sZip5)

end

尝试使用 string.gsub(sZip5,"%D","") 去除非数字字符。 - Egor Skriptunoff
谢谢回复!我在这里遇到的问题是,该列中还有有效的字母数字邮政编码,例如加拿大的“A1A 1A1”。这个参数不会从邮政编码中删除字母字符吗? - Specterman
邮政编码符号的完整集合是什么? - Egor Skriptunoff
尝试使用%W而不是%D来删除非数字或字母字符。 - Egor Skriptunoff
2个回答

0

我认为有不同的方法可以选择,以下应该可以工作:

sZip5 = string.gsub(sOriginalZip, '.', function(d) return tonumber(d) and d or '' end)

它返回一个数字字符串、空值或nil


谢谢!最终我采用了你和Egor的建议组合来实现这个:sZip5 = string.gsub(sOriginalZip,"%W",function(d)return tonumber(d) and d or "" end) - Specterman

0

谢谢!最终我采用了csarr和Egor的建议结合起来得到了这个结果:

sZip5 = string.gsub(sOriginalZip,"%W",function(d)return tonumber(d) and d or "" end) 

看起来它正在正确地评估。再次感谢!


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接