你好,我有自己的语料库,并在其中训练了几个Word2Vec模型。那么,如何评估它们并选择最佳模型呢?(显然不是手动评估——我正在寻找各种措施)。
值得注意的是,嵌入是针对项目而不是单词的,因此我无法使用任何现有的基准。
谢谢!
你好,我有自己的语料库,并在其中训练了几个Word2Vec模型。那么,如何评估它们并选择最佳模型呢?(显然不是手动评估——我正在寻找各种措施)。
值得注意的是,嵌入是针对项目而不是单词的,因此我无法使用任何现有的基准。
谢谢!
如果你甚至没有使用真实单词进行比较(例如广为人知的类比问题),那么评估令牌向量质量就没有通用的方法。
如果你有自定义的最终任务,你必须设计自己的可重复评分方法。这很可能是你实际最终任务的某个子集,或者与该最终任务密切相关。基本上,无论你使用什么特定的方法来“眼测”结果的合理性,都应该被系统化,保存每次评估的判断,以便可以反复运行对迭代模型改进的评估。
(我需要更多关于你的数据/项目和最终目标的信息才能提出进一步的建议。)