我是一名数据科学和分析的新手。在浏览了Kaggle上很多内核之后,我建立了一个可以预测房产价格的模型。我已经使用我的训练数据对这个模型进行了测试,但现在我想在我的测试数据上运行它。我有一个test.csv文件,我想使用它。我该怎么做? 我之前如何处理我的训练数据集:
#loading my train dataset into python
train = pd.read_csv('/Users/sohaib/Downloads/test.csv')
#factors that will predict the price
train_pr = ['OverallQual','GrLivArea','GarageCars','TotalBsmtSF','FullBath','YearBuilt']
#set my model to DecisionTree
model = DecisionTreeRegressor()
#set prediction data to factors that will predict, and set target to SalePrice
prdata = train[train_pr]
target = train.SalePrice
#fitting model with prediction data and telling it my target
model.fit(prdata, target)
model.predict(prdata.head())
现在我尝试的是,复制整个代码,并将"train"改为"test","predate"改为"testprdata",我以为这样就可以了,但很遗憾没有成功。我知道我做错了什么,但不知道具体是哪里出了问题。