目录
百战程序员,全站22050+开发课程+文档 ,学习精选优质好课快人一步!观看视频 快捷键ALT+N

Python全系列 教程

3567个小节阅读:5930k

收藏
全部开发者教程

鸿蒙应用开发

C语言快速入门

JAVA全系列 教程

面向对象的程序设计语言

Python全系列 教程

Python3.x版本,未来主流的版本

人工智能 教程

顺势而为,AI创新未来

大厂算法 教程

算法,程序员自我提升必经之路

C++ 教程

一门通用计算机编程语言

微服务 教程

目前业界流行的框架组合

web前端全系列 教程

通向WEB技术世界的钥匙

大数据全系列 教程

站在云端操控万千数据

AIGC全能工具班

A

A A

White Night

阅读(592)
赞(0)

词汇表征

image-20220708140655372

什么是词汇表征

在NLP中,最细粒度的表示就是词语,但是计算机并不能直接识别词语,需要将词语转

化为计算机可识别的数值形式,这种对词语的转化和表征就是“词汇表征”。

词汇表征的种类

  • one-hot编码

缺点:维数灾难、不能很好地获取词汇间的相似性

  • 词嵌入(Word Embedding)

将词汇表中的每个单词表示为一个合理的普通向量,word2vec是典型的词嵌入技术

实时效果反馈

1. 关于词汇表征,下列说法正确的是:

A 对词语的转化和表征就是“词汇表征”

B 计算机可以直接处理词语,无需进行词汇表征

C 词汇表征只有one-hot一种方法

D 以上说法均不正确

2. 关于词汇表征的种类,下列说法正确的是:

A 如果词汇表的单词很多,one-hot编码会产生维数灾难的问题

B one-hot编码可以很好地获取词汇间的相似性

C 词嵌入用来将每个单词表示为由0、1组成的向量

D 以上说法均不正确

答案

1=>A 2=>A

 

北京市昌平区回龙观镇南店村综合商业楼2楼226室

©2014-2023 百战卓越(北京)科技有限公司 All Rights Reserved.

京ICP备14032124号-2