beta
用于第一个因素,alpha
用于第二个因素。alpha
参数视为添加的每个主题中“虚构”单词的数量。在第一种情况下,主题0在每个文档中都有2.5个虚构单词的权重。该参数的默认值最初为50 / numTopics
。较大的值鼓励模型在文档中具有更均匀的主题分布,较小的值则鼓励更稀疏。一般经验是50太大了,而5是更好的默认值。这在2.0.8中进行了更改。alpha
权重相等。启用超参数优化后,这些值可能会有所不同。通常您会发现,具有大值的主题包含“接近停用词”的单词,这些单词在大多数文档中都很频繁,没有太多内容。具有非常小值的主题通常是不同寻常和独特的文档。中间的主题通常是最有趣的。--optimize-interval INTEGER
每 整数
次迭代重新评估超参数。