这是一个很反直觉的例子:
想象一个装有球的罐子,其中三分之二的球是一种颜色,另外三分之一是另一种颜色。一个人从罐子里抽出了5个球,并发现有4个是红色的,1个是白色的。另一个人从罐子里抽出了20个球,并发现有12个是红色的,8个是白色的。哪个人应该更有信心认为罐子里有三分之二的红色球和三分之一的白色球,而不是相反的?每个人应该给出什么样的赔率?
我知道正确答案,但可能不太明白赔率计算。有人能解释一下吗?
这是一个很反直觉的例子:
想象一个装有球的罐子,其中三分之二的球是一种颜色,另外三分之一是另一种颜色。一个人从罐子里抽出了5个球,并发现有4个是红色的,1个是白色的。另一个人从罐子里抽出了20个球,并发现有12个是红色的,8个是白色的。哪个人应该更有信心认为罐子里有三分之二的红色球和三分之一的白色球,而不是相反的?每个人应该给出什么样的赔率?
我知道正确答案,但可能不太明白赔率计算。有人能解释一下吗?
P(A|B) : P(¬A|B) = (P(B|A)* P(A) / P(B)) : (P(B|¬A)* P(¬A) / P(B))。
P(B)是一个标准化因子,使概率总和为1;但我们正在使用赔率,在这里,2:1 和 4:2 的比例是相同的,所以P(B)可以消除。我们得到了一个容易分解的表达式:
在贝叶斯定理中,对于事件B已经发生,事件A发生的概率为P(A|B),A不发生的概率为P(¬A|B)。根据贝叶斯公式,可以得到后验比率等于似然比乘以先验比率,即P(A|B) : P(¬A|B) = (P(B|A) * P(A)) : (P(B|¬A) * P(¬A)) = (P(B|A) : P(B|¬A)) * (P(A) : P(¬A))。当进行一系列相互独立的实验时,先验比率每次都会被似然比所修正。如果一个事件有x : y的先验比率,随着r个红球和w个白球的抽取,最终的后验比率将为(x : y) * (2^(r-w) : 1)。因此,重要的是红球和白球的数量差异。重点在于,如果你理解上述加粗的方程式,那么这个问题就非常简单。同样重要的是,你可以确信自己没有搞错任何算术,因为你只需要做很少的计算。
所以这是个糟糕的编程问题,但它确实是一个好的测试加粗的方程式。仅供练习,让我们将其应用于另外两个问题:
我随机选择两个硬币之一,一个是公平的硬币,另一个是双面都是正面的假硬币,每个硬币被选中的概率均为50%。我把它抛了三次,结果都是正面。它是真硬币的概率是多少?
先前的比例是真:假=1:1,如问题所述。实际硬币出现三次正面的概率是1/8,而假硬币则是1,因此似然比值为1:8。因此后验比值=先验比值*似然比值=1:8。因此,它是真硬币的概率是1/9。
此问题还提出了一个重要的警告:每个可能的观测结果有可能具有不同的似然比值。这是因为B的似然比值是P(B|A):P(B|¬A),它与¬B的似然比值不一定相关,后者是P(¬B|A):P(¬B|¬A)。不幸的是,在所有上述示例中,它们都是相互倒置的,但在这里,它们不是。
实际上,假设我将硬币抛一次,结果是反面。那么它是真硬币的概率是多少?显然是1。贝叶斯定理如何体现?对于这个观测结果,似然比值是用真硬币和假硬币得到该结果的概率之比,即1/2:0=1:0。也就是说,看到单个反面会降低硬币是假的可能性,这符合我们的直觉。
以下是来自Eliezer页面的问题:在你面前有一个书包,里面装着1000个扑克筹码。我一开始就拥有两个这样的书包,一个包含700个红色和300个蓝色的筹码,另一个包含300个红色和700个蓝色的筹码。我抛了一个公平的硬币来确定使用哪个书包,因此你在你面前的书包是红书包的先验概率为50%。现在,你随机取样,在每个筹码后进行替换。在12次采样中,你得到了8个红色和4个蓝色的筹码。这是主要由红色筹码组成的书包的概率是多少?(你不需要精确计算 - 粗略估计就足够了。)先验概率为红:蓝=1:1。似然比为7:3和3:7,因此后验概率为(7:3)^8 * (3:7)^4 = 7^4 : 3^4。在这一点上,我们只需估计7:3为2:1,得到2^4 : 1 = 16 : 1。最终答案更大,所以它肯定大于95%左右;正确答案约为96.7%。与大多数人的答案相比,他们的答案在70-80%范围内。
我希望您同意,在这种情况下,当以这种方式查看时,问题变得非常简单且具有直观性。
假设事件A是3个球中有2个是红色的概率为2/3,那么¬A就是3个球中有2个是白色。假设事件B是第一个观察者看到5个球中有4个是红色的概率,假设事件C是第二个观察者看到20个球中有12个是红色。
应用简单的组合学原理,我们可以得到:
因此,根据贝叶斯定理,第一位观察者对A的真实性有8/9的置信度。
对于第二位观察者:
因此,再次根据贝叶斯定理,第二位观察者对A的真实性有16/17的置信度。
因此,观察者二更有把握认为三分之二的球是红色的。关键在于理解贝叶斯定理的工作原理。事实上,唯一重要的是观察到的红球和白球数量的差异。其他所有因素(尤其是所抽取的总球数)都会在方程式中相互抵消。对于 P[2/3R 1/3W | 12R,8W] 的相同计算(即使用(2/3)12(1/3)8 而不是(2/3)4(1/3)1),现在得到的结果为16/17,因此第二个观察者的置信度高于第一个观察者。
= ⅔^4*⅓ / (⅔^4*⅓ + ⅓^4*⅔)
= 16/243 / (16/243 + 2/243)
= 16/18
在编程方面,P(⅔R⅓W | 12R8W)确实等于16/17,因此12R8W可以更加自信。
呵呵。也许我完全错了,但是答案不应该是第二个人吗?
一个人看到的比例是:4:1 4/5 : 1/5
另一个人看到的比例是3:1 3/4 : 1/4
所以简单的问题是谁更接近2/3 : 1/3?因此答案是观察者二。
也许我犯了两个错误,并且对于我认为实际上很直观的事情进行了漫长的解释,但请原谅我的耐心。