我有一个PySpark Dataframe
,其中包含一列字符串
。如何检查其中的哪些行是数字。 我在PySpark的官方文档中找不到任何函数。
values = [('25q36',),('75647',),('13864',),('8758K',),('07645',)]
df = sqlContext.createDataFrame(values,['ID',])
df.show()
+-----+
| ID|
+-----+
|25q36|
|75647|
|13864|
|8758K|
|07645|
+-----+
在Python中,有一个函数.isDigit()
用于判断string
是否只包含数字,返回True
或False
。期望的数据框如下:
+-----+-------+
| ID| Value |
+-----+-------+
|25q36| False |
|75647| True |
|13864| True |
|8758K| False |
|07645| True |
+-----+-------+
我希望避免创建一个UDF
。