如何将数据框转换为包含每个列的数据类型的元组?
我有很多大小和类型不同的数据框。我需要能够确定给定数据框的每个列和行的类型和值,以便我可以执行一些类型相关的操作。
例如,假设我有一个如下所示的数据框:
+-------+-------+
| foo | bar |
+-------+-------+
| 12345 | fnord |
| 42 | baz |
+-------+-------+
我需要获取
Seq(
(("12345", "Integer"), ("fnord", "String")),
(("42", "Integer"), ("baz", "String"))
)
或者类似的简单迭代和编程处理方式。感谢您的提前帮助,对于这个很新手的问题,我很抱歉。
schema
方法吗?另外,你可能不想或不需要为每行的每列构建一个新元组。 - Joe Pallas