Python全系列 教程
3567个小节阅读:5931.3k
目录
鸿蒙应用开发
C语言快速入门
JAVA全系列 教程
面向对象的程序设计语言
Python全系列 教程
Python3.x版本,未来主流的版本
人工智能 教程
顺势而为,AI创新未来
大厂算法 教程
算法,程序员自我提升必经之路
C++ 教程
一门通用计算机编程语言
微服务 教程
目前业界流行的框架组合
web前端全系列 教程
通向WEB技术世界的钥匙
大数据全系列 教程
站在云端操控万千数据
AIGC全能工具班
A A
White Night
lda.py
xxxxxxxxxx
from mydict import *
from gensim import corpora,models
# 生成LDA模型
def gensim_Corpus(corpus=None):
# 文本向量化
dictionary = corpora.Dictionary(corpus)
doc_bow_corpus = [dictionary.doc2bow(doc_cut) for doc_cut in corpus]
print("doc_bow_corpus的长度:",len(doc_bow_corpus),"doc_bow_corpus=",doc_bow_corpus)
# 创建LDA模型
lda = models.LdaModel(corpus=doc_bow_corpus, id2word=dictionary, num_topics=10)
# 获取主题词分布
'''
打印主题
实际使用LDA时,我们必须看到各个主题词的分布才能大致了解某个主题到底是什么。
'''
topic_list = lda.print_topics()
print(topic_list)
# 获取某一篇文档的主题分布
print(corpus[0])
test_doc = corpus[0]
doc_bow = dictionary.doc2bow(test_doc)
doc_lda = lda[doc_bow]
print("doc_lda=",doc_lda)
if __name__ == "__main__":
corpus, classVec = loadDataSet()
gensim_Corpus(corpus)
1. Gensim中生成LDA模型的是______
A models.LdaModel()
B models.Word2Vec()
C models.TfidfModel()
D models.LsiModel()
2. LDA模型对象打印主题的方法是______
A doc2bow()
B print_topics()
C print_doc()
D print_word()
1=>A 2=>B