我正在尝试使用Weka中的NaiveBayesUpdateable分类器。我的数据包含名义和数值属性:
@relation cars
@attribute country {FR, UK, ...}
@attribute city {London, Paris, ...}
@attribute car_make {Toyota, BMW, ...}
@attribute price numeric %% car price
@attribute sales numeric %% number of cars sold
我需要根据其他属性预测销售量(数字!)。
我知道在Weka中无法使用数值属性进行贝叶斯分类。一种技术是将数值属性的值分割成长度为k的N个间隔,并使用名义属性代替,其中n是类名,如:@attribute class {1,2,3,...N}。
然而,我需要预测的数值属性范围从0到1000000。创建1000000个类毫无意义。如何在Weka中预测数值属性或者在Weka没有此任务的工具的情况下寻找哪些算法?