Python中SelectKBest函数的特征名称获取

8
我使用了sklearn中的SelectKBest方法,我想要获取K个最佳列的名称,而不仅仅是每一列的值。
我需要做什么?
我的代码如下:
X_new = SelectKBest(chi2, k=2).fit_transform(X, y)

X_new.shape

X_new是一个numpy.ndarray,它有k列,但没有列名。

3个回答

18
你可以获取所选特征的索引

示例1

from sklearn.datasets import load_iris
from sklearn.feature_selection import SelectKBest
from sklearn.feature_selection import chi2

iris = load_iris()
X, y = iris.data, iris.target

selector = SelectKBest(chi2, k=2)
selector.fit(X, y)

X_new = selector.transform(X)
X_new.shape
print(selector.get_support(indices=True))

现在,如果您真的想获取列的实际名称,我们需要使用pandas。

示例2:

from sklearn.datasets import load_iris
from sklearn.feature_selection import SelectKBest
from sklearn.feature_selection import chi2
import pandas as pd

iris = load_iris()
X = pd.DataFrame(iris.data, columns=iris.feature_names)
y = pd.DataFrame(iris.target)

selector = SelectKBest(chi2, k=2)
selector.fit(X, y)

X_new = selector.transform(X)
print(X_new.shape)

X.columns[selector.get_support(indices=True)]

# 1st way to get the list
vector_names = list(X.columns[selector.get_support(indices=True)])
print(vector_names)

#2nd way
X.columns[selector.get_support(indices=True)].tolist()

结果:

Index([u'petal length (cm)', u'petal width (cm)'], dtype='object')

['petal length (cm)', 'petal width (cm)']

['petal length (cm)', 'petal width (cm)']

3

模型 = SelectKBest(f_classif, k=8).fit(X,Y)

选中的特征名称 = X.columns[model.get_support()]


1

model=SelectKBest(k=5) model.fit(X,y)

print(model.get_params)


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接