数值错误：特征不在特征字典中。

Question

数值错误：特征不在特征字典中。

13

我试图使用TensorFlow编写一个简单的深度机器学习模型。我使用了一个在Excel中制作的玩具数据集，只是为了让模型工作并接受数据。我的代码如下：

import pandas as pd
import numpy as np
import tensorflow as tf

raw_data = np.genfromtxt('ai/mock-data.csv', delimiter=',', dtype=str)
my_data = np.delete(raw_data, (0), axis=0) #deletes the first row, axis=0 indicates row, axis=1 indicates column
my_data = np.delete(my_data, (0), axis=1) #deletes the first column

policy_state = tf.feature_column.categorical_column_with_vocabulary_list('policy_state', [
    'AL', 'CA', 'MI'
])

modern_classic_ind = tf.feature_column.categorical_column_with_vocabulary_list('modern_classic_ind', [
    '0', '1'
])

h_plus_ind = tf.feature_column.categorical_column_with_vocabulary_list('h_plus_ind', [
    '0', '1'
])

retention_ind = tf.feature_column.categorical_column_with_vocabulary_list('retention_ind', [
    '0', '1'
])

feature_columns = [
    tf.feature_column.indicator_column(policy_state),
    tf.feature_column.indicator_column(modern_classic_ind),
    tf.feature_column.indicator_column(h_plus_ind)
]
classifier = tf.estimator.DNNClassifier(feature_columns=feature_columns,
                                      hidden_units=[10, 20, 10],
                                      n_classes=3,
                                      model_dir="/tmp/ret_model")

train_input_fn = tf.estimator.inputs.numpy_input_fn(
x={"x": np.array(my_data[:, 0:3], dtype=str)},
y=np.array(np.array(my_data[:, 3], dtype=str)),
num_epochs=None,
shuffle=True)

classifier.train(input_fn=train_input_fn, steps=2000)

不幸的是，我遇到了以下错误。我已经尝试过将csv文件中的标签裁剪掉或保留它们，将特征列命名为不同的名称以及更改numpy数组的类型，但错误仍然存在。

ValueError: 特征h_plus_ind不在特征字典中。

如果我删除h_plus_ind，它会简单地在另一列上抛出错误。

- Abigail Fox

5个回答

1

我有同样的问题，但当我检查了数据库列名时，发现列名有一个小错误。请检查您的列名。

- zark masood

1

如果您使用已经存在的数据集，建议重命名列。

- Ruwindhu Chandraratne

这并没有回答问题。一旦您拥有足够的声望，您将能够评论任何帖子；相反，提供不需要询问者澄清的答案。- 来自审核 - taylor.2317

1

我遇到了同样的问题。在我的情况下，目标变量也被提供给了特征字典。我将其从特征字典中删除后，问题得以解决。

- Arwen

0

如果您因为TF serving而到达此页面，另一个可能性是传递给`serving_input_fn`的字典中的键与您的模型中的键不对应，请仔细检查字典。

- Daniyal Shahrokhian

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Lescurel · Accepted Answer

使用tf.feature_columns时，您在input_fn中提供的数据应该与之前创建的特征列具有相同的键。因此，您的train_input_fn中的x应该是一个字典，其中的键名与feature_columns相同。

一个模拟示例：

x = {"policy_state": np.array(['AL','AL','AL','AL','AL']),
     "modern_classic_ind": np.array(['0','0','0','0','0']),
     "h_plus_ind": np.array(['0','0','0','0','0']),}