也许此问题已经有人回答过,但我没有看到答案。
我有一个数据集,其中包含数字和缺失值。其中一行是一个百分比。下面是一个小的虚假数据集,其中AA、BB和CC是列名。这个数据集的第三行是百分比。
AA BB CC
234 432 78
1980 3452 2323
91.1 90 93.3
34 123 45
在这种情况下,当我读取数据集时,AA和CC是数字,BB是整数。我猜90.0在某个地方被四舍五入为90。如果我没有指定BB是数字,这会对基本算术产生影响吗?
我认为,如果dd = 1且ee = 2且两者都是整数,则C语言表示dd / ee = 0,而R表示dd / ee = 0.5。
以下是一系列简单的数学运算,所有这些运算似乎表明无论数据是数字还是整数,答案在R中都不会改变。尽管如此,我仍然认为,在读取数据时指定所有变量都是数字是明智的。使用Google,我找到了一个或两个示例,其中数据类型似乎确实有所不同,但下面没有。
aa <- c(1,2,3,4,5,6,7)
bb <- 2
str(aa)
str(bb)
cc <- as.integer(aa)
dd <- as.integer(bb)
str(cc)
str(dd)
aa/bb
cc/dd
aa/dd
cc/bb
ee <- aa * aa
str(ee)
sum(ee/2)
ff <- cc * cc
str(ff)
sum(ff/2)
gg <- 4.14
hh <- ((aa * aa) * gg) / 2
hh
ii <- ((cc * cc) * gg) / 2
ii
jj <- (aa * aa) / gg
jj
kk <- (cc * cc) / gg
kk
jj == kk
mm <- as.integer(1)
nn <- as.integer(2)
mm/nn
我想我希望获得一些确定,这可能不是简单数学问题,但我怀疑它确实是。我一直在思考编程的基本规则,但我不确定那是什么。(我知道双精度的概念。)
非常感谢任何关于这个基础问题的建议。