我有一个数据框,其中包含一列文本。我需要捕获跟在特定短语后面的数字(可能是长度为1到4位数的任意数字),即'Floor Area'或'floor area'。我的数据将类似于以下内容:
如果我只尝试提取数字,或者从sqm往回看,有时会错误地得到地块面积。如果有人能帮我使用stringr中的前瞻正则表达式或类似方法,我将不胜感激。对我来说,正则表达式是一个薄弱环节。提前致谢。
"A beautiful flat on the 3rd floor with floor area: 50 sqm and a lift"
"Newbuild flat. Floor Area: 30 sq.m"
"6 bed house with floor area 50 sqm, lot area 25 sqm"
如果我只尝试提取数字,或者从sqm往回看,有时会错误地得到地块面积。如果有人能帮我使用stringr中的前瞻正则表达式或类似方法,我将不胜感激。对我来说,正则表达式是一个薄弱环节。提前致谢。
(\\d+)
替换为(\\d+(?:.\\d+))
,只需记得同时将as.integer
更改为as.numeric
。 - JWilliman