我正在尝试将邮政编码缩短到各个文件中,但是我一直收到以下错误:
ValueError: 无法从重复的轴重新索引
我已经阅读了Stackoverflow上的其他文档,但我还没有找出为什么会出现重复的轴。
import csv
import pandas as pd
from pandas import DataFrame as df
fp = '/Users/User/Development/zipcodes/file.csv'
file1 = open(fp, 'rb').read()
df = pd.read_csv(fp, sep=',')
df = df[['VIN', 'Reg Name', 'Reg Address', 'Reg City', 'Reg ST', 'ZIP',
'ZIP', 'Catagory', 'Phone', 'First Name', 'Last Name', 'Reg NFS',
'MGVW', 'Make', 'Veh Model','E Mfr', 'Engine Model', 'CY2010',
'CY2011', 'CY2012', 'CY2013', 'CY2014', 'CY2015', 'Std Cnt',
]]
#reader.head(1)
df.head(1)
zipBlue = [65355, 65350, 65345, 65326, 65335, 64788, 64780, 64777, 64743,
64742, 64739, 64735, 64723, 64722, 64720]
还包含zipGreen,zipRed,zipYellow,ipLightBlue
但没有在示例中提供。
def IsInSort():
blue = df[df.ZIP.isin(zipBlue)]
green = df[df.ZIP.isin(zipGreen)]
red = df[df.ZIP.isin(zipRed)]
yellow = df[df.ZIP.isin(zipYellow)]
LightBlue = df[df.ZIP.isin(zipLightBlue)]
def SaveSortedZips():
blue.to_csv('sortedBlue.csv')
green.to_csv('sortedGreen.csv')
red.to_csv('sortedRed.csv')
yellow.to_csv('sortedYellow.csv')
LightBlue.to_csv('SortedLightBlue.csv')
IsInSort()
SaveSortedZips()
1864 # 尝试在一个有重复值的轴上重新索引 1865
if not self.is_unique and len(indexer): -> 1866 raise ValueError("无法从重复的轴重新索引") 1867 1868 def reindex(self, target, method=None, level=None, limit=None):ValueError: 无法从重复的轴重新索引
from pandas import DataFrame as df
,但是这不是一个好的做法。按照惯例,df 是pandas.DataFrame
的一个实例。你应该删除那行代码。如果你想将 DataFrame 带入命名空间而不必在前面添加pd
,你可以这样做,但不要包括as df
。 - JohnE