Python全系列 教程
3567个小节阅读:5930k
目录
鸿蒙应用开发
C语言快速入门
JAVA全系列 教程
面向对象的程序设计语言
Python全系列 教程
Python3.x版本,未来主流的版本
人工智能 教程
顺势而为,AI创新未来
大厂算法 教程
算法,程序员自我提升必经之路
C++ 教程
一门通用计算机编程语言
微服务 教程
目前业界流行的框架组合
web前端全系列 教程
通向WEB技术世界的钥匙
大数据全系列 教程
站在云端操控万千数据
AIGC全能工具班
A A
White Night
在NLP中,最细粒度的表示就是词语,但是计算机并不能直接识别词语,需要将词语转
化为计算机可识别的数值形式,这种对词语的转化和表征就是“词汇表征”。
缺点:维数灾难、不能很好地获取词汇间的相似性
将词汇表中的每个单词表示为一个合理的普通向量,word2vec是典型的词嵌入技术
1. 关于词汇表征,下列说法正确的是:
A 对词语的转化和表征就是“词汇表征”
B 计算机可以直接处理词语,无需进行词汇表征
C 词汇表征只有one-hot一种方法
D 以上说法均不正确
2. 关于词汇表征的种类,下列说法正确的是:
A 如果词汇表的单词很多,one-hot编码会产生维数灾难的问题
B one-hot编码可以很好地获取词汇间的相似性
C 词嵌入用来将每个单词表示为由0、1组成的向量
D 以上说法均不正确
1=>A 2=>A