我将使用Python进行一些机器学习。我有一个2000个条目的Python nd数组。每个条目包含有关某些主题的信息,并在末尾附有一个布尔值,以告诉我它们是否是吸血鬼。数组中的每个条目都如下所示:
[height(cm), weight(kg), stake aversion, garlic aversion, reflectance, shiny, IS_VAMPIRE?]
我的目标是在给定上述主题的数据的情况下,能够给出新主题是吸血鬼的概率。
我使用sklearn来进行一些机器学习:
clf = tree.DecisionTreeRegressor()
clf=clf.fit(X,Y)
print clf.predict(W)
其中W是新主题的数据数组。我编写的脚本返回布尔值,但我希望它返回概率。我该如何修改呢?