我正在尝试使用加载的分词器对文本进行编码,但是遇到以下错误:
AttributeError: 'Tokenizer'对象没有'oov_token'属性
以下是我的代码:
from keras.preprocessing.text import Tokenizer
from keras.preprocessing import sequence
from keras.models import Model, Input, Sequential, load_model
import pickle
import h5py
maxlen = 100
tok = open('tokenizer.pickle', 'rb')
tokenizer = pickle.load(tok)
tok.close()
model = load_model('weights.h5')
def predict():
new_text = sequence.pad_sequences((tokenizer.texts_to_sequences(['heyyyy'])), maxlen=maxlen)
prediction = model.predict(new_text,batch_size=1,verbose=2)
问题出现在
tokenizer.texts_to_sequences(['heyyyy'])
这一行,我不确定问题出在哪里。是pickle的问题吗?tokenizer.texts_to_sequences
可以处理'hey'
、'heyy'
和'heyyy'
。欢迎提供任何指导!