我对Spark还比较陌生,想要在一个数据框的列上执行一个操作,以便将该列中的所有,
替换为.
假设有一个名为x的数据框和一个名为x4的列
x4
1,3435
1,6566
-0,34435
我希望输出结果是:
x4
1.3435
1.6566
-0.34435
我使用的代码是
import org.apache.spark.sql.Column
def replace = regexp_replace((x.x4,1,6566:String,1.6566:String)x.x4)
但我得到了以下错误
import org.apache.spark.sql.Column
<console>:1: error: ')' expected but '.' found.
def replace = regexp_replace((train_df.x37,0,160430299:String,0.160430299:String)train_df.x37)
任何关于语法、逻辑或其他合适方法的帮助将不胜感激。
regexp_replace(df.col, "[\\?,\\.,\\$]", ".")
- mtoto