共计 1 篇文章

LDA 的实现

参考LDA数学八卦和GibbsLDA++实现的LDA模型,以及自己对这个模型的理解 LDA的Gibbs抽样 在上一篇文章中提到了Gibbs抽样的推导最终结果,根据这个推导公式可以在计算机上模拟文档集的生成过程。Gibbs抽样的推导结果如下: 实现思路: 1:先随机为每个单词赋予一个主题 2:根据抽样公式计算当前单词生成每个主题的概率 3:利用掷骰子算法生成下一个主题 4:一直迭代下去,最后计算文档——主题、主题——单词的概率分布 代码放在了Github - LDA上了 数据结构的设计 根据抽样公式公式可知,需要保存的东西有 ...