我不确定在哪里可以得到帮助,因为这篇文章在StackExchange上被认为是离题的。
我想基于巴西选举数据运行一些回归分析,重点关注两个时间段内的数据。我想要了解的是,在一项禁止公司向候选人捐赠的立法变革后,那些最依赖这些资源的个人是否有更低的当选概率。
我已经在R上运行了这样一个回归模型:
model_continuous <- plm(percentage_of_votes ~ time +
treatment + time*treatment, data = dataset, model = 'fd')
在这个模型中,我使用了一个连续变量(投票的百分比)作为我的因变量。我的“处理”单位是在时间=0时没有来自公司的竞选捐款的单位。
现在我想改变我的因变量,使其成为表示该年当选候选人的二元变量。所有的“单位”都是在时间=0时当选的。如何使用固定效应来估计logit或probit模型?我尝试使用R中的“pglm”包。
model_binary <- pglm(dummy_elected ~ time + treatment + time*treatment,
data = dataset,
effects = 'twoways',
model = 'within',
family = 'binomial',
start = NULL)
然而,我遇到了这个错误:
Error in maxRoutine(fn = logLik, grad = grad, hess = hess, start = start, :
argument "start" is missing, with no default
为什么会发生这种情况?我的模型出了什么问题吗?概念上是否正确? 我希望第二个回归与第一个尽可能相似。
我读过来自survival
包的clogit
函数可以完成此任务,但我不知道如何操作。
编辑:
以下是样本数据集的示例:
dataset <- data.frame(individual = c(1,1,2,2,3,3,4,4,5,5),
time = c(0,1,0,1,0,1,0,1,0,1),
treatment = c(0,0,1,1,0,0,1,1,0,0),
corporate = c(0,0,0.1,0,0,0,0.5,0,0,0))