如何在预训练的ELMO嵌入中获取与给定单词相似的单词?例如:在Glove中,我们有glove_model.most_similar()来查找任何给定单词的最相似单词及其嵌入。那么在ELMO中是否有类似的功能呢?
与GloVe不同,ELMo使用字符级CNN动态计算单词嵌入,因此理论上ELMo应该能够处理无限的词汇量。实际上,它只能很好地处理在训练中遇到过的单词及其相似的单词,但仍能获得任意字符串的向量。因此,像GloVe一样拥有一个方法并没有太多意义。但是,您可以为您感兴趣的词汇表预先计算向量,并自己实现最近邻搜索,例如使用scipy.spatial.cKDTree。