如何将CSV文件的行转换为对象列表?

3

我正在处理患者数据,将其存储在CSV文件中。每一行都代表一个新的患者,而且有数百个患者。我想要将每个患者作为列表中的一个元素进行访问。例如,我的患者列表的索引0将输出具有以下属性的患者对象:

{ first: 'Zakariah', last: 'Siyaji', age: 21 }

以下是我编写的代码,虽然我无法想象如何在没有手动初始化每个对象的情况下生成多个对象。考虑到有数百名患者,这将是极其不切实际的。

import ASD as asd

class Patient:
    mrn = 0
    first = '' 
    last = '' 
    gender = 0
    smoker = 0
    bmi = 0
    asa = 0 
    cci = 0
    dob = '' 
    dos = '' 
    age = 0

    def setData(self, mrn, first, last, gender, smoker, bmi, asa, cci, dob, dos, age):
        self.mrn = mrn
        self.first = first
        self.last = last
        self.gender = gender
        self.smoker = smoker
        self.bmi = bmi
        self.asa = asa
        self.cci = cci
        self.dob = dob
        self.dos = dos
        self.age = age

    def showData(self):
        print("MRN\t:",self.mrn)
        print("First\t:", self.first)
        print("Last\t:", self.last)
        print("Gender\t:", self.gender)
        print("Smoker\t:", self.smoker)
        print("BMI\t:",self.bmi)
        print("ASA\t:", self.asa)
        print("CCI\t:", self.cci)
        print("DOB\t:", self.dob)
        print("DOS\t:", self.dos)
        print("Age\t:", self.age)

def main():

    p1 = Patient()
    p1.setData(asd.file1['MRN'][0],
               asd.file1['First'][0],
               asd.file1['Last'][0],
               asd.file1['Female'][0],
               asd.file1['Smoker'][0],
               asd.file1['BMI'][0],
               asd.file1['ASA'][0],
               asd.file1['CCI'][0],
               asd.file1['DOB'][0],
               asd.file1['DOS'][0],
               asd.file1['Age'][0])
    p1.showData()

if __name__ == '__main__':
    main()

1
你能在你的问题中包含“ASD”的定义吗? - Devesh Kumar Singh
2个回答

1
你可以简单地导入pandas,读取CSV文件并访问患者信息。
import pandas as pd
patients = pd.read_csv("patients.csv")

# To access information
patients.loc[0] #or patients.iloc[0]

我没有访问数据的问题,我的问题在于将这些行转换为对象。 - Zakariah Siyaji

1

csv 模块支持从 csv 文件中读取数据。如果您想进行复杂的数据插值操作,则可以使用 pandas。假设这是一个简单的操作,应该像这样:

import csv

with open(filename, 'r') as stream:
  reader = csv.DictReader(stream)
  count == 0
  for row in reader:
    if count != 0 # skip the header, or do something here
    p = Patient(row["mrn"], row["first"], row["last"], row["gender"], row["smoker"], row["bmi"], row["asa"], row["cci"], row["dob"], row["dos"], row["age"])
    print(p)
    count += 1

此外,我发现您的患者定义类不符合惯用的Python语法。可以按以下方式重写,使其更符合Pythonic风格。
class Patient:
   def __init___(self, mrn=None, first=None, last=None, gender=None, smoker=None, bmi=None, asa=None, cci=None, dob=None, dos=None, age=None)
     self.mrn = mrn
     self.first = first
     self.last = last
     self.gender = gender
     self.smoker = smoker
     self.bmi = bmi
     self.asa = asa
     self.cci = cci
     self.dob = dob
     self.dos = dos
     self.age = age
def __repr__(self):
    return '''MRN: {}
            First: {}
            ...
            ASA: {}'''.format(self.mrn, self.first,....,self.asa)

由于您的构造函数有很多字段,其中最大的优点之一是您可以使用关键字参数来实例化您的类,并降低将某个字段与其他值混淆的风险。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接