目录
百战程序员,全站22050+开发课程+文档 ,学习精选优质好课快人一步!观看视频 快捷键ALT+N

Python全系列 教程

3567个小节阅读:5931.7k

收藏
全部开发者教程

鸿蒙应用开发

C语言快速入门

JAVA全系列 教程

面向对象的程序设计语言

Python全系列 教程

Python3.x版本,未来主流的版本

人工智能 教程

顺势而为,AI创新未来

大厂算法 教程

算法,程序员自我提升必经之路

C++ 教程

一门通用计算机编程语言

微服务 教程

目前业界流行的框架组合

web前端全系列 教程

通向WEB技术世界的钥匙

大数据全系列 教程

站在云端操控万千数据

AIGC全能工具班

A

A A

White Night

阅读(662)
赞(0)

Gensim基本使用

image-20230113105928220

Gensim介绍

Gensim(generate similarity)是一个开源的第三方Python工具包,用于从原始的非

结构化文本抽取文档的语义主题。Gensim内置的算法包括Word2Vec,FastText,潜在语

义分析(Latent Semantic Analysis,LSA),潜在狄利克雷分布(Latent Dirichlet

Allocation,LDA)等,通过计算训练语料中的统计共现模式自动发现文档的语义结构。这

些算法都是非监督的,这意味着不需要人工输入——仅仅需要一组纯文本语料。一旦发现这

些统计模式后,任何纯文本(句子、短语、单词)就能采用语义表示进行简洁地表达。

Gensim的安装

命令行安装:

Jupyter notebook安装:

Gensim基本使用

实时效果反馈

1. 关于Gensim,下列说法正确的是:

A Gensim是Python内置的库

B Gensim是用来做爬虫的一种框架

C Gensim没有内置任何算法

D Gensim用于从原始的非结构化文本抽取文档的语义主题

2. _______类为每个出现在语料库中的词语分配了一个独一无二的id

A doc2bow

B token2id

C Dictionary

D corpora

答案

1=>D 2=>C

 

北京市昌平区回龙观镇南店村综合商业楼2楼226室

©2014-2023 百战卓越(北京)科技有限公司 All Rights Reserved.

京ICP备14032124号-2