我是pandas的新手,这是我在stackoverflow上的第一个问题,我试图使用pandas进行一些分析。
我有一些文本文件,其中包含我想要处理的数据记录。每个文本文件的每一行对应一个记录,该记录的字段位于固定位置且具有固定数量的字符长度。同一文件中有不同类型的记录,所有记录都共享第一个字段,该字段为两个字符,具体取决于记录类型。例如:
Some file:
01Jhon Smith 555-1234
03Cow Bos primigenius taurus 00401
01Jannette Jhonson 00100000000
...
field start length
type 1 2 *common to all records, example: 01 = person, 03 = animal
name 3 10
surname 13 10
phone 23 8
credit 31 11
fill of spaces
我正在编写一些代码,将一个记录转换为字典:
person1 = {'type': 01, 'name': = 'Jhon', 'surname': = 'Smith', 'phone': '555-1234'}
person2 = {'type': 01, 'name': 'Jannette', 'surname': 'Jhonson', 'credit': 1000000.00}
animal1 = {'type': 03, 'cname': 'cow', 'sciname': 'Bos....', 'legs': 4, 'tails': 1 }
如果一个字段为空(填充了空格),它将不会出现在字典中。我想使用同一类别的所有记录创建一个pandas DataFrame,其中字典密钥作为列名,我尝试使用pandas.DataFrame.from_dict()但没有成功。
我的问题是:是否有任何方法可以使用pandas来使字典键成为列名?还有其他处理此类文件的标准方法吗?