dataframe中有一列batch,其中包含'9%','$5'等值。 我需要使用regex_replace的方式,从上述示例中删除特殊字符并仅保留数字部分。 例如,将同一列中的9%和$5替换为9和5。
val cols = df.columns.map(x=>regexp_replace(col(x), "/[^0-9]+/", ""))
... df.select(cols:_*)val cols = df.columns.map(x=>regexp_replace(col(x), "/[^0-9]+/", ""))
... df.select(cols:_*) - undefined_variable