如何使用Pyspark从字符串中提取数字的格式

3

我有一个表格列,它的值是:

  |col_A|
  -------
  |00140|
  -------
  |00120|
  -------
  |00058|
  -------
  |00009|
  -------
  |00052|

我希望删除所有左侧的 0。 我使用 PySpark 构建数据框。 您可以在下面找到一个示例:

while tab.col_A.like('0%'):
        tab = tab.withColumn('tab_B', tab['col_A'][2:5])

当我尝试执行这段代码时,出现以下错误:

无法将列转换为布尔值。

请帮忙解决。
1个回答

3
我尝试了这段代码:
tab = tab.withColumn("col_B", F.regexp_extract(tab['col_A'], '[1-9][0-9]*',0))

问题已经解决。
谢谢。

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接