Python全系列 教程
3567个小节阅读:5930.5k
目录
鸿蒙应用开发
C语言快速入门
JAVA全系列 教程
面向对象的程序设计语言
Python全系列 教程
Python3.x版本,未来主流的版本
人工智能 教程
顺势而为,AI创新未来
大厂算法 教程
算法,程序员自我提升必经之路
C++ 教程
一门通用计算机编程语言
微服务 教程
目前业界流行的框架组合
web前端全系列 教程
通向WEB技术世界的钥匙
大数据全系列 教程
站在云端操控万千数据
AIGC全能工具班
A A
White Night
朴素贝叶斯(Naive Bayes)是一种用于分类和概率估计的统计算法,它基于贝叶斯定理,并做出了“朴素”假设,即特征之间相互独立。这个假设使得计算变得简单,并且在实践中通常表现得非常出色,特别是在文本分类、垃圾邮件检测、情感分析等任务中非常有用。
对于待分类样本,计算待分类样本出各个类别出现的概率,哪个最大,就认为此样本属于哪个类别
CountVectorizer 作用:用来统计样本中特征词出现的个数,将单词作为特征(特征词)
举个例子:
xxxxxxxxxx
91data = ["i like python,and python like me",
2 "python is a good good good language"]
3from sklearn.feature_extraction.text import CountVectorizer
4
5cv = CountVectorizer()
6transform_data = cv.fit_transform(data) # 拟合+转换文本
7print(transform_data.toarray())
8
9print(cv.get_feature_names()) # 提取的特征词
xxxxxxxxxx
51from sklearn.naive_bayes import MultinomialNB
2classifier = MultinomialNB()
3classifier.fit(训练样本集特征,训练样本集标签) # 拟合训练
4# 在测试集上测试准确率
5classifier.score(测试样本集特征,测试样本集标签)