我有一个数据集,其中包含参与者对某些问题的二进制答案。这些问题可以有3种不同的基本条件和一种0/1变化;也就是说,问题可以被指定为1.0、1.1、2.0等和3.1。我的数据集在不同的行中保存每个答案,包括一个用于基本条件和一个用于修饰符的列(还有一个交互列确定组合;请参见下面的示例)。
我想绘制的是每个问题答案比例的图表,最好按基本水平分组:即三个2条形图组,显示特定结果的频率。
以下是可重现的示例数据集,其中Base_con、Var和Dec分别表示基本条件、变化和决策(答案):
我想绘制的是每个问题答案比例的图表,最好按基本水平分组:即三个2条形图组,显示特定结果的频率。
以下是可重现的示例数据集,其中Base_con、Var和Dec分别表示基本条件、变化和决策(答案):
# load example dataset with relevant columns
require(RCurl)
my_csv = getURL(
"https://docs.google.com/spreadsheets/d/1x9PUZwPGmye6QDk7_4M_HslrmbgEC3DZ-v-VMvFkE6U/pub?output=csv")
df1 = read.csv(textConnection(my_csv))
# set columns as factors because they are numerically coded
df1$Base_con = as.factor(df1$Base_con)
df1$Var = as.factor(df1$Var)
df1$Dec = as.factor(df1$Dec)
df1$Int = interaction(df1$Base_con, df1$Var)
我发现cdplot
函数非常接近我正在寻找的内容,但只接受一个连续自变量。希望有人能帮忙解决这个问题,它看起来并不难做到,但我在这里或其他地方都没有找到答案。我知道我可以在其他软件中构建图形,但我更愿意学习如何在R中完成它,而且这将帮助我检查数据以及统计分析。
Var
是变量的代码,而Dec
则是决策或答案。 - Lea_CasiraghiBase_con
的水平(或者,如您所建议的,三个图表,每个图表一个),并将Var
的值放在并排的列中。 - Lea_Casiraghi