我有一些扁平化的输入数据,想要将其规范化,将其拆分成表格。我能否使用
示例:
数据以CSV文件的形式存储在磁盘上,如下所示:
pandas
来完成 - 即通过将扁平化的数据读入DataFrame
实例,然后应用一些函数来获得所需的DataFrame
实例?示例:
数据以CSV文件的形式存储在磁盘上,如下所示:
ItemId ClientId PriceQuoted ItemDescription
1 1 10 scroll of Sneak
1 2 12 scroll of Sneak
1 3 13 scroll of Sneak
2 2 2500 scroll of Invisible
2 4 2200 scroll of Invisible
我想创建两个数据框:
ItemId ItemDescription
1 scroll of Sneak
2 scroll of Invisibile
并且
ItemId ClientId PriceQuoted
1 1 10
1 2 12
1 3 13
2 2 2500
2 4 2200
如果 pandas
只有对于最简单情况(规范化结果为两个具有一对多关系的表——就像上面的示例一样)有一个好的解决方案,那么它可能已经足够满足我当前的需求。然而,将来我可能需要更通用的解决方案。