它们,但因为这些与技术的关联而否定 LDA 是不对的。主题金字塔相当于亚里士多德或牛顿——一个合理的起点——而 LDA 是扭曲的时空——一个非常好的想法,但我们对此持怀疑态度,因为它尚未得到证实。我们甚至可以绘制出内容相关性模型多年来的发展历程: 主题金字塔 信息频率与逆文档频率(IF vs IDF) 潜在语义索引 (LSI) 概率 LSI (pLSI) 潜在 Direchlet 分配 (LDA) 每个模型都比上一个模型有所改进,但并不完美。
甚至兰德在回复丹尼在原始 LDA 帖子上引发争论的评论时也表示:“我们认为这很有趣,因为相关性相对较高(与链接指标相比),值得一试,但我们还没有得出确凿的结果。”兰德在他的最新帖子中表示,“更 fusion 电话号码资源 完善的结果可能还需要几个月的时间”,而本在他的更新中对自己的工作进行了严厉批评,他说:“我认为 0.17 可能真的不是定论……在我们了解更多信息之前,请将所有这些都视为可疑的。” 亚里士多德的元素周期表——错误,但并非完全错误 亚里士多德的元素周期表。它错了并不意味着所有元素周期表都是错的。
作为起点,它对我们很有用。图片来源:弗吉尼亚大学 结论——或许 这里的重点是,在他们最近的辩论中,兰德和丹尼都有对,也有错。至少在我看来,SEOmoz 团队似乎为 LDA 提出了一个相当令人信服的案例。最初的 SEOmoz 研究中使用的方法与Bing 与 Google 的研究相同,作为一个起点似乎很合理,但是: 仅限 1 至 10 级的情况 只有当维基百科被视为所有英文单词及其正确的语境用法的事实上的语料库时 只有当我们查看关键字而不是关键短语时 只有当所有短语都具有同等竞争力时。