希望这个问题不难。
如果我有这样一组数据:
Classification attribute-1 attribute-2
Correct dog dog
Correct dog dog
Wrong dog cat
Correct cat cat
Wrong cat dog
Wrong cat dog
那么相对于属性1,属性2的信息增益是多少呢?
我已经计算了整个数据集的熵:-(3/6)log2(3/6)-(3/6)log2(3/6)=1
然后我卡住了!我认为您需要计算属性1和属性2的熵。然后将这三个计算结果用于信息增益计算?
任何帮助都将不胜感激,
谢谢 :)。