课程十六大阶段概述
阶段 阶段名称 实战项目 收益
第一阶段 python基础与科学计算模块
√ 泰坦尼克号数据分析案例
√ 可视化剖析逻辑回归损失函数案例
算法先行,技术随后。学习人工智能领域基础知识熟练掌握,打好坚实的内功基础。
第二阶段 AI数学知识
√ 梯度下降和牛顿法推导
√ SVD奇异值分解应用
第三阶段 线性回归算法
√ 代码实现梯度下降求解多元线性回归
√ 保险花销预测案例
第四阶段 线性分类算法
√ 分类鸢尾花数据集
√ 音乐曲风分类
√ SVM人脸识别案例
√ SVM算法代码实现
第五阶段 无监督学习算法
√ 微博用户聚类分析
√ PCA提取人脸图片特征脸
√ 图片前景背景分离
√ 根据声音判别性别
√ 根据声音判别用户
悟其精髓,实践真理。大量机器学习实战,实践完成可胜任机器学习工程师岗位。
第六阶段 决策树系列算法
√ 通过graphvis绘制决策树模型
√ 用户画像集成学习方法案例
√ Adaboost算法做人脸识别
√ GBDT+LR架构实现
第七阶段 Kaggle实战
√ CTR广告预估项目
√ 网页分类案例
√ 药店销量预测案例
√ 活动推荐预测案例
√ 银行贷款风控案例
悟其精髓,实践真理。大量机器学习实战,实践完成可胜任机器学习工程师岗位。
第八阶段 海量数据挖掘工具
√ 代码实战WordCount计算和排序
√ 代码实战蒙特卡洛计算圆周率Pi
第九阶段 概率图模型算法
√ 代码实战垃圾邮件分类
第十阶段 深度学习原理到进阶实战
√ 水泥强度预测案例及绘制神经网络拓扑
√ Python实现神经网络实战案例
√ MNIST手写数字识别项目案例
√ California房价预测案例
进军深度,提高内功。通过之前铺垫,进入深度学习,体悟深度黑盒子。
第十一阶段 图像识别原理到进阶实战
√ Cifar10图像识别案例
√ 皮肤癌医疗图像项目
√ 图像风格迁移项目
√ 车牌识别案例
√ 通用物体检测项目
图像识别,妙趣横生。图像识别项目,让您体会智能的的人脑工作流程。助您登上图像算法工程师岗位。
第十二阶段 图像识别项目
√ 电缆缺陷检测
√ 电子元件缺陷检测
√ 安全帽检测
√ 人脸识别
第十三阶段 自然语言处理原理到进阶实战
√ TF代码实现Word2Vec算法项目
√ 深度学习用户画像项目
√ 电影评论情感分析案例
√ 机器写唐诗案例
√ 产生式自动聊天机器人
√ POS词性标注案例
√ NER命名实体识别案例
√ 语义相似度分析案例
√ Bert as service开源项目
奥秘语言,智能客服。自然语言处理,企业数据集核心痛点,实体识别、语言识别、相似度计算完成企业90%的文本需求。助力您荣登NLP工程师宝座。
第十四阶段 自然语言处理项目
√ OCR识别
√ 实体关系抽取
√ 自动聊天机器人
√ 知识图谱
第十五阶段 数据挖掘项目
√ 推荐系统
√ 智能商业分析
出师在即,豪礼相送。双热门项目祝您开启精彩人生道路,制定适合你的职业道路。
第十六阶段 面试和成功求职的秘籍
预科阶段:快速实战入门
章节名称 主要学习方向

◆ 阶段概述:

本阶段讲解,人工智能的应用,人工智能的工作流程、基本概念,人工智能的任务和本质,KNN最近邻算法。

◆ 达成目标:

通过本阶段学习,快速理解人工智能能做什么,要做什么,并掌握KNN算法以及算法的代码实现。

人工智能概念与本质
1) 人工智能应用
2) 人工智能流程与本质
3) 人工智能流程对比人类思考过程
4) 机器学习与深度学习本质区别
5) 回归与分类任务本质
6) 聚类与降维任务本质
KNN算法
1) KNN原理
2) Anaconda运行环境安装
3) Pycharm开发环境配置安装
4) KNN的python代码实现
5) Scikit-learn模块讲解
6) KNN的sklearn代码实战
第一阶段:python基础与科学计算模块
章节名称 主要学习方向

◆ 阶段概述:

本阶段讲解,python基础语法,Numpy科学计算模块,Pandas数据分析模块,Matplotlib和Seaborn数据可视化模块。

◆ 达成目标:

通过本阶段学习,让学生快速掌握python语言的特性和语法,并着重对算法这块所涉及的Numpy科学计算模块和Pandas数据分析模块进行讲解。

◆ 实战教学项目:

√ 泰坦尼克号数据分析案例
√ 可视化剖析逻辑回归损失函数案例

Python基础语法
1) 循环控制
2) 切片操作
3) 数据类型
4) 集合操作
5) 常用内建函数
6) 函数式编程
7) 类与对象
8) 继承
9) 装饰器
10) 生成器
科学计算模块Numpy
1) Numpy ndarray对象
2) Numpy 数据类型
3) Numpy 数组属性
4) Numpy 创建数组
5) Numpy 切片和索引
6) Numpy 高级索引
7) Numpy 广播
8) Numpy 数组操作
9) Numpy 数学和统计函数
10) Numpy 排序、条件过滤函数
11) Numpy 线性代数
数据处理分析模块Pandas
1) Pandas IO文件操作
2) Pandas 索引和数据选择器
3) Pandas 合并、连接
4) Pandas 缺失值数据处理
5) Pandas 数据离散化
6) Pandas 统计计算
数据可视化模块
1) Matplotlib 散点图、线图、核密度图
2) Matplotlib 饼图、直方图、盒图
3) Matplotlib 等高线图
4) Matplotlib 可视化剖析逻辑回归损失函数
5) Seaborn 单变量、多变量的图形绘制
6) Seaborn Style和Color
7) Seaborn facetgrid
第二阶段:AI数学知识
章节名称 主要学习方向

◆ 阶段概述:

本阶段讲解,微积分基础,线性代数基础,多元函数微分学,线性代数高级,概率论,最优化。

◆ 达成目标:

通过本阶段学习,掌握后面机器学习算法、深度学习算法涉及的数学知识,使得后面在理解算法推导的过程中游刃有余。如果学员大学数学知识还未忘记或者研究生毕业,这一部分可以先跳过学习后面的知识。

微积分基础
1) 导数的定义
2) 左导数、右导数、可导函数
3) 导数几何意义、物理意义
4) 基本函数求导公式
5) 四则运算法则
6) 复合函数求导法则
7) 神经网络激活函数的导函数求解
8) 高阶导数
9) 导数与函数单调性
10) 极值定理
11) 导数与函数凹凸性
12) 一元函数泰勒展开
线性代数基础
1) 向量与其运算
2) 行向量和列向量
3) 向量加减、数乘、内积、转置
4) 向量范数
5) 特殊向量
6) 矩阵与其运算
7) 方阵、对称阵、单位阵、对角阵
8) 矩阵加减、数乘、矩阵乘法、转置
9) 逆矩阵
10) 行列式
多元函数微分学
1) 偏导数
2) 高阶偏导数
3) 梯度
4) 雅可比矩阵
5) Hessian矩阵
6) 极值判别法则
线性代数高级
1) 二次型
2) 特征值和特征向量
3) 特征值分解
4) 多元函数的泰勒展开
5) 矩阵和向量的求导公式
6) 奇异值分解
7) 奇异值分解计算方式
8) 奇异值分解性质
9) SVD用于数据压缩
10) SVD用于PCA降维
11) SVD用于协同过滤
12) SVD用于矩阵求逆
概率论
1) 随机事件和随机事件概率
2) 条件概率和贝叶斯公式
3) 随机事件的独立性
4) 随机变量
5) 数学期望和方差
6) 常用随机变量服从的分布
7) 随机向量
8) 随机变量独立性
9) 协方差与协方差矩阵
10) 随机向量的常见分布
11) 最大似然估计
最优化
1) 局部最小和全局最小
2) 迭代法求解
3) 梯度下降法推导
4) 牛顿法推导
5) 坐标下降法
6) 数值优化算法的问题
7) 凸集
8) 凸函数
9) 凸优化问题
10) 拉格朗日乘数法
11) 拉格朗日对偶
12) KKT条件
第三阶段:线性回归算法
章节名称 主要学习方向

◆ 阶段概述:

本阶段讲解,多元线性回归,梯度下降法,归一化,正则化,Lasso回归,Ridge回归,多项式回归。

◆ 达成目标:

通过本阶段学习,从推导出多元线性回归算法的损失函数,到实现开发和应用算法,再到对算法从数据预处理上,以及损失函数上的优化都将整体彻底掌握。对后面学习更多算法,甚至深度学习都将起到举一反三的效果。

◆ 实战教学项目:

√ 代码实现梯度下降求解多元线性回归
√ 保险花销预测案例

多元线性回归
1) 简单线性回归
2) 最优解与最小二乘法
3) 多元线性回归判别式
4) 多元线性回归的数学假设
5) 利用MLE推导出目标函数
6) 对数似然推导出MSE损失函数
7) MSE求偏导得到参数解析解
8) 多元线性回归的python代码实现
9) 多元线性回归的sklearn代码实战
梯度下降法
1) 梯度下降法原理与公式
2) 学习率设置的学问
3) GD应用于多元线性回归的流程
4) 全量梯度下降的原理与代码实现
5) 随机梯度下降的原理与代码实现
6) Mini-Batch梯度下降的原理与代码实现
7) 代码实现增加MBGD数据的随机性
8) 代码实现动态调整学习率
归一化
1) 归一化目的与量纲
2) 归一化提高模型精度
3) 最大值最小值归一化与缺点
4) 方差归一化与好处
5) 均值归一化与好处
6) 标准归一化的代码实战与技巧
正则化
1) 提高泛化能力与防止过拟合
2) 正则化用于损失函数
3) L1与L2正则项与范数的关系
4) 结合GD讲解L1L2的几何意义
5) 透过导函数讲解L1的稀疏性
6) 透过导函数讲解L2的平滑性
Lasso回归、Ridge回归、多项式回归
1) Lasso回归原理与代码实战
2) Ridge回归原理与代码实战
3) ElasticNet回归原理与代码实战
4) 升维的意义
5) 多项式回归进行升维原理
6) 多项式升维代码实战
第四阶段:线性分类算法
章节名称 主要学习方向

◆ 阶段概述:

本阶段讲解,逻辑回归算法,Softmax回归算法,SVM支持向量机算法,SMO优化算法。

◆ 达成目标:

通过本阶段学习,推导逻辑回归算法、SVM算法的判别式和损失函数,算法的优化、实现算法和应用开发实战。将会对分类算法有深入认知,对于理解后续神经网络算法和深度学习学习至关重要。

◆ 实战教学项目:

√ 分类鸢尾花数据集
√ 音乐曲风分类
√ SVM人脸识别案例
√ SVM算法代码实现

逻辑回归
1) Sigmoid函数特点
2) 广义线性回归与逻辑回归的数学假设
3) 证明伯努利二项分布属于指数族分布
4) 推导出逻辑回归判别式
5) 推导出逻辑回归损失函数log loss
6) 推导出损失函数导函数用于最优化
7) 逻辑回归解决多分类问题OVR
8) 逻辑回归代码实战--鸢尾花数据集分类
Softmax回归
1) Softmax函数特点
2) 广义线性回归与Softmax回归的数学假设
3) 证明多项式分布属于指数族分布
4) 推导出Softmax回归判别式
5) 推导出Softmax回归损失函数cross-entropy
6) 证明逻辑回归是Softmax的特例
7) 剖析逻辑回归多分类和Softmax多分类的本质区别
8) Softmax回归代码实战--音乐曲风分类
SVM支持向量机
1) SVM与感知机关系
2) 几何距离和函数距离
3) SVM支持向量机算法原理
4) SVM的损失函数
5) 硬间隔SVM的优化步骤
6) 软间隔SVM
7) 非线性SVM与核函数
8) SVM在sklearn模块中参数详解
9) SVM人脸识别案例
10) SVM的概率化输出
11) SVM的OVO多分类
12) SVM的hinge loss
SMO优化算法
1) SMO优化算法的子二次规划问题思路
2) SMO把目标函数从二元函数变一元函数
3) SMO推导出新的α和旧的α关系
4) SMO对α进行剪裁
5) SMO优化SVM算法代码实现
第五阶段:无监督学习算法
章节名称 主要学习方向

◆ 阶段概述:

本阶段讲解,K-means聚类算法,K-means聚类算法的变形,密度聚类,层次聚类、谱聚类、PCA降维算法、EM期望最大化、GMM高斯混合模型。

◆ 达成目标:

通过本阶段学习,掌握无监督机器学习算法的作用和原理,透彻理解聚类和降维的本质区别,今后可以正确选择无监督学习算法,并实战开发。

◆ 实战教学项目:

√ 微博用户聚类分析
√ PCA提取人脸图片特征脸
√ 图片前景背景分离
√ 根据声音判别性别
√ 根据声音判别用户
聚类系列算法
1) 相似度测量方法
2) K-means算法原理
3) K-means图像应用案例
4) K-medoids算法
5) K-means++算法
6) Mini-batch K-means算法
7) Canopy聚类算法
8) Agnes层次聚类算法
9) Diana层次聚类算法
10) DBSCAN密度聚类算法
11) Spectral谱聚类
12) 微博用户聚类分析案例
PCA降维算法
1) 特征选择与特征映射
2) 最大投影方差原理与推导
3) 最小投影距离原理与推导
4) PCA过程的中心化
5) Kernelized PCA
6) SVD奇异值分解用于PCA
EM算法
1) Jensen不等式
2) EM算法的E-step
3) EM算法的M-step
4) EM在GMM公式推导中应用
GMM算法
1) 单一高斯分布的参数估计
2) 混合高斯分布的似然函数
3) GMM的计算流程
4) GMM之图片前景背景分离代码实战
5) GMM之根据声音判别性别代码实战
6) GMM之根据声音判别用户代码实战
第六阶段:决策树系列算法
章节名称 主要学习方向

◆ 阶段概述:

本阶段讲解,决策树算法、随机森林算法、Adaboost算法、GBDT算法、XGBoost算法。

◆ 达成目标:

通过本阶段学习,掌握非线性决策树系列算法,重点掌握Kaggle神奇XGBoost算法,理解GBDT和XGBoost涉及的公式推导,本阶段的掌握将大大提升学员数据挖掘的能力,对于后续理解Kaggle实战阶段内容会起到很大的帮助。

◆ 实战教学项目:

√ 通过graphvis绘制决策树模型
√ 用户画像集成学习方法案例
√ Adaboost算法做人脸识别
√ GBDT+LR架构代码实现

决策树算法
1) 决策树的算法原理与数学表达
2) 分裂指标Gini系数、信息增益、信息增益率
3) 前剪枝与后剪枝
4) 决策树ID3、C4.5和CART
5) 决策树算法优略比较
6) 决策树之鸢尾花数据集分类案例
7) 通过graphvis绘制决策树模型
随机森林算法
1) 集成学习算法思想Bagging、Boosting、Stacking
2) 用户画像集成学习方法案例
3) OOB数据集验证随机森林算法
4) 随机森林副产品之特征选择
Adaboost算法
1) Adaboost算法原理
2) 数据的权重与权重错误率
3) 权重错误率调整到0.5训练下一个弱分类器
4) 计算每个样本的权重Un
5) 应用Adaboost算法做人脸识别
GBDT算法
1) 函数空间的梯度下降与负梯度
2) 推导GBDT回归是拟合残差
3) Shrinkage衰减系数的作用
4) 推导GBDT分类亦是拟合残差
5) GBDT二分类模型训练和使用
6) GBDT多分类模型训练和使用
7) GBDT副产品之特征组合用于降维
8) 实现GBDT+LR架构代码实战
XGBoost算法
1) XGBoost算法与决策树集成学习关系
2) XGBoost目标函数与正则项
3) XGBoost目标函数用二阶泰勒展开
4) 推导简化XGBoost目标函数引入g h
5) XGBoost目标函数加入树的复杂度
6) 推导出XGBoost目标函数最终形式和叶子节点表达式
7) 详解XGBoost算法参数与交叉验证
8) XGBoost算法调用GPU显卡资源加速
第七阶段:Kaggle实战
项目名称 项目介绍

◆ 阶段概述:

本阶段讲解,CTR广告预估项目、网页分类案例、药店销量预测案例、活动推荐预测案例、银行贷款风控案例。

◆ 达成目标:

通过本阶段学习,实战代码深刻理解前面学过的算法和工具,Kaggle竞赛数据集全部来自于公司,并且需求直接是企业里面的需求,并且此阶段讲解的代码均是大牛级开源的代码。要知道Kaggle上的大牛会一般企业的算法工程师水平高,所有同学学习Kaggle实战将会受益匪浅。

◆ 实战教学项目:

√ CTR广告预估项目
√ 网页分类案例
√ 药店销量预测案例
√ 活动推荐预测案例
√ 银行贷款风控案例

CTR广告预估项目
网页分类案例
药店销量预测案例
活动推荐预测案例
银行贷款风控案例
第八阶段:海量数据挖掘工具
章节名称 主要学习方向

◆ 阶段概述:

本阶段讲解,分布式概念,Spark分布式计算框架,SparkMLlib模块,SparkML模块。

◆ 达成目标:

通过本阶段学习,掌握一个海量数据挖掘工具Spark,这对于在企业中面对海量数据,进行机器学习数据挖掘时多个选择,并且在Kaggle实战和推荐系统项目中也会用到此阶段知识。

Spark计算框架基础
1) 分布式存储和计算概念
2) Spark计算框架特点
3) 分布式计算Shuffle流程
4) Spark RDD五大特性
5) PySpark模块安装与配置
6) 代码实战WordCount计算和排序
7) 代码实战蒙特卡洛计算圆周率Pi
Spark计算框架深入
1) 算子操作Transformation和Action
2) RDD持久化
3) 宽窄依赖
4) Spark DAG优化
5) Spark架构运行剖析
6) 读取分布式HDFS数据与并行度设置
Spark机器学习MLlib和ML模块
1) MLlib的LocalVector之稠密向量和稀疏向量
2) MLlib的有监督学习数据类型LabeledPoint
3) ML中用到的DataFrame数据框操作
4) ML中用到的UDF函数
5) ML的pipeline流程思路
第九阶段:概率图模型算法
章节名称 主要学习方向

◆ 阶段概述:

本阶段讲解,贝叶斯分类算法、隐含马尔可夫模型、最大熵模型、条件随机场。

◆ 达成目标:

通过本阶段学习,掌握NLP自然语言处理的一些基本算法,本阶段的理解对于后续完成NLP大项目很重要。

◆ 实战教学项目:

√ 代码实战垃圾邮件分类

贝叶斯分类
1) 朴素贝叶斯分类器
2) 拉普拉斯估计
3) 代码实战垃圾邮件分类
HMM算法
1) 马尔可夫过程
2) 初始概率、转移概率、发射概率
3) 隐含马尔可夫模型原理
4) 维特比算法
最大熵模型
1) 熵、条件熵、相对熵、互信息
2) 最大熵模型算法原理
3) 有约束条件的函数最优化问题
4) 最大熵和最大似然估计关系
5) IIS算法
CRF算法
1) 条件随机场的性质
2) 条件随机场的判别函数
3) 条件随机场的学习
4) 条件随机场的推断
5) CRF与HMM关系
第十阶段:深度学习原理到进阶实战
章节名称 主要学习方向

◆ 阶段概述:

本阶段讲解,神经网络算法、Back Propagation反向传播推导、TensorFlow框架、TensorBoard模块。

◆ 达成目标:

通过本阶段学习,开启深度学习之旅,深入理解神经网络算法及其优化算法,掌握TensorFlow开发流程,通过实现神经网络完成回归和分类任务。TensorFlow框架学好了,其它深度学习框架比如Keras、PyTorch掌握起来易如反掌。

◆ 实战教学项目:

√ 水泥强度预测案例及绘制神经网络拓扑
√ Python实现神经网络实战案例
√ MNIST手写数字识别项目案例
√ California房价预测案例

神经网络
1) 从生物神经元到人工神经元
2) 激活函数Relu、Tanh、Sigmoid
3) 透过神经网络拓扑理解逻辑回归分类
4) 透过神经网络拓扑理解Softmax回归分类
5) 透过神经网络隐藏层理解升维降维
6) 剖析隐藏层激活函数必须是非线性的原因
7) 神经网络在sklearn模块中的使用
8) 水泥强度预测案例及绘制神经网络拓扑
BP反向传播算法
1) BP反向传播目的
2) 链式求导法则
3) BP反向传播推导
4) 不同激活函数在反向传播应用
5) 不同损失函数在反向传播应用
6) Python实现神经网络实战案例
TensorFlow深度学习工具
1) TF安装(包含CUDA和cudnn安装)
2) TF实现多元线性回归之解析解求解
3) TF实现多元线性回归之梯度下降求解
4) TF预测california房价案例
5) TF实现Softmax回归
6) Softmax分类MNIST手写数字识别项目案例
7) TF框架模型的保存和加载
8) TF实现DNN多层神经网络
9) DNN分类MNIST手写数字识别项目案例
10) Tensorboard模块可视化
第十一阶段:图像识别原理到进阶实战
章节名称 主要学习方向

◆ 阶段概述:

本阶段讲解,卷积神经网络、深度神经网络的问题和优化手段、经典卷积神经网络模型、OpenCV模块、目标检测算法原理与实战。

◆ 达成目标:

通过本阶段学习,深入透彻的掌握图像识别领域深度学习的原理和应用。通过知识点的讲解,辅助论文讲解和源码的剖析,让同学可以了解网络的底层架构原理和代码,可以说此阶段虽然内容多,但对面试图像识别领域岗位来说很重要,值得多花心思反复研究。

◆ 实战教学项目:

√ Cifar10图像识别案例
√ 皮肤癌医疗图像检测项目
√ 图像风格迁移项目
√ 车牌识别案例
√ 通用物体检测项目

卷积神经网络原理
1) 感受野与卷积
2) 卷积的计算
3) 权值共享
4) Stride步长
5) Padding模式
6) Pooling池化
7) TF实现CNN卷积神经网络
8) CNN分类MNIST手写数字识别项目案例
卷积神经网络优化
1) 梯度消失与梯度爆炸
2) Dropout防止过拟合
3) Relu激活函数变形
4) Xavier Glorot初始化
5) Optimizer优化器
6) Data Augmentation数据增强
7) Batch Normalization归一化
8) Cifar10图像识别案例
经典卷积网络算法
1) LeNet
2) AlexNet
3) VGG16
4) InceptionV3
5) ResNet
6) DenseNet
7) MobileNet
8) 皮肤癌医疗图像检测项目
9) GAN生成对抗网络
10) 图像风格迁移项目
OpenCV模块
1) 读取IP摄像头
2) RGB与HSV空间变换
3) 直方图均值化
4) 边缘检测
5) 人脸检测
6) 物体追踪
7) 车道线检测
8) 车牌识别案例
古典目标检测算法
1) 图像金字塔
2) 古典目标检测架构
3) ROI、IOU、FPS、NMS、mAP
4) IOU代码实现
5) NMS代码实现
6) 特征金字塔
7) SPP net
8) ROI池化
现代目标检测算法
1) Fast R CNN
2) Faster R CNN
3) RPN网络、Anchor boxes
4) Mask R CNN
5) SSD
6) Yolo V1 V2 V3
7) Cascade R CNN
8) 模型压缩
第十二阶段:自然语言处理原理到进阶实战
章节名称 主要学习方向

◆ 阶段概述:

本阶段讲解,词向量、词嵌入、RNN、LSTM、孪生网络、CNN在NLP中的应用、Attention注意力机制、Transformer、BERT。

◆ 达成目标:

通过本阶段学习,掌握NLP中词的各种向量表达,从古典的Word2Vec方式到现代的BERT方式,学好这些NLP提特征的主干网络,才能在NLP各项任务中产生好的效果。这阶段也将掌握大量NLP任务的实战开发。

◆ 实战教学项目:

√ TF代码实现Word2Vec算法项目
√ 深度学习用户画像项目
√ 电影评论情感分析案例
√ 机器写唐诗案例
√ 产生式自动聊天机器人
√ POS词性标注案例
√ NER命名实体识别案例
√ 语义相似度分析案例
√ Bert as service开源项目

词向量与词嵌入
1) TFIDF
2) Word2Vec算法
3) Gensim模块
4) Skip-gram
5) TF代码实现Word2Vec算法项目
6) FastText
7) Word Embedding
8) 深度学习用户画像项目
循环神经网络原理与优化
1) Vanilla RNN
2) Basic RNN实现MNIST手写数字图片识别
3) LSTM长短时记忆
4) GRU与双向LSTM
5) 电影评论情感分析案例
6) Seq2Seq
7) 机器写唐诗案例
8) CNN+LSTM+CRF
9) POS tagging词性标注案例
10) NER命名实体识别案例
11) 孪生网络
12) 语义相似度分析案例
Transformer和Bert
1) Attention注意力机制
2) Attention算法流程
3) Transformer
4) Self-Attention机制
5) Multi-Head Attention
6) Bert
7) Bert as service开源项目
第十三阶段:图像识别项目
项目名称 项目介绍 目标与收益
电缆缺陷检测
各省市电网,需要建立一套完善的电缆线部件缺陷检测的平台,为各省市的电缆线部件缺陷提供智能化的解决方案,进一步确保电网系统的安全运行。现在有些省市的电网缺陷部件的检测仍采用人工查缺的方式,智能化的缺陷检测平台可以提高电缆线部件缺陷检测的准确率,节省成本。

◆ 课程目标:

重点依托cascade R-CNN算法,以及mmdetection工具,完成整套从数据标注到模型训练、优化。

◆ 课程收益:

√ 对目标检测算法有一个很好的了解,重点掌握cascade R-CNN算法
√ 能够对mmdetection工具有一个很好的了解
√ 对数据打标签、数据集制作、算法模型训练有一个很好的掌握
√ 对mmdetection代码有一定了解,学会如何改进和优化算法

电子元件缺陷检测
在机器视觉应用中,外观检测一直是行业痛点。外观缺陷中的划痕、脏污、形态不一、大小不同、深浅和各种姿态都不同,很难用传统的视觉检测算法稳定检测。但是随着深度学习技术的发展,采用深度学习模式的外观检测程式,成为了外观检测的新方法。

◆ 课程目标:

重点依托Faster R-CNN算法,以及TensorFlow工具,完成整套从数据标注到模型训练、优化。

◆ 课程收益:

√ 对目标检测算法有一个很好的了解,重点掌握Faster R-CNN算法
√ 对数据打标签、数据集制作、算法模型训练有一个很好的掌握
√ 对Faster R CNN代码有深刻认知,学会如何改进和优化算法

安全帽检测
施工工地对安全帽佩戴的检测和监管力度越来越大了,从智能安全帽的应用到安全帽检测系统的智能管理,现在的安全帽检测升级版对于安全帽佩戴标准也有了新的分析算法,对未正确佩戴、悬挂等都能准确检测识别。对工作服颜色接近安全帽颜色的检测能力有了更高的提升,比传统的安全帽识别系统精度更高。

◆ 课程目标:

重点依托Yolo one stage算法,以及Darknet工具,完成整套从数据标注到模型训练、优化。

◆ 课程收益:

√ 对目标检测算法有一个很好的了解,重点掌握Yolo V3算法
√ 对数据打标签、数据集制作、算法模型训练有一个很好的掌握
√ 对Yolo V3代码有深刻认知,学会如何改进和优化算法

人脸识别
人脸识别,是基于人的脸部特征信息进行身份识别的一种生物识别技术。用摄像机或摄像头采集含有人脸的图像或视频流,并自动在图像中检测和跟踪人脸,进而对检测到的人脸进行脸部识别的一系列相关技术,通常也叫做人像识别、面部识别。

◆ 课程目标:

通过一个完整的人脸识别项目,掌握人脸识别系统的开发流程和关键技术。

◆ 课程收益:

√ 从0到1,全面剖析完整项目整个建设生命周期:需求分析、架构设计、环境部署、程序设计、模型训练。
√ 掌握人脸识别一般过程,人脸检测、人脸对齐、人脸识别
√ 掌握人脸检测的集成学习方法
√ 掌握人脸检测的CNN方法
√ 掌握人脸检测+关键点定位的多任务网络MTCNN

第十四阶段:自然语言处理项目
项目名称 项目介绍 目标与收益
OCR识别
OCR文字识别软件,指利用OCR (Optical Character Recognition,光学字符识别)技术,将图片、照片上的文字内容,直接转换为可编辑文本的软件。软件可以把图片转换成可以编辑的文字。从验证码、身份证识别、驾驶证识别、票据识别,到如今更多的识别自然场景下的整句话,甚至理解PDF里面带错别字的整段文字,应用场景可谓非常之广。

◆ 课程目标:

掌握目标检测+RNN+CTC loss完成通用的深度学习OCR架构。

◆ 课程收益:

√ 了解OCR应用场景和概念
√ 掌握目标检测+RNN+CTC loss架构
√ 掌握CTC loss中的原理
√ 掌握深度学习训练OCR模型的整体流程和代码

实体关系抽取
实体关系抽取解决了原始文本中目标实体之间的关系分类问题,它也被广泛应用于文本摘要、自动问答系统、知识图谱、搜索引擎和机器翻译中。中文实体关系抽取由于中文句式和语法结构复杂,汉语有更多歧义,会影响关系分类的效果。

◆ 课程目标:

对实体关系抽取技术、在行业应用有很清晰的认识。学会如果从语料库中通过机器学习和深度学习算法建立关系,服务于自动聊天机器人和知识图谱。

◆ 课程收益:

√ 了解任务是从无结构的文本中抽取实体以及实体之间的关系(实体1-关系-实体2,三元组),这里的关系是我们预定义好的关系类型。
√ 可以学到综合运用词嵌入、BiLSTM、CRF等NLP相关知识

自动聊天机器人
聊天机器人(Chatbot),又被称为对话代理(Conversational Agents)或对话系统(Dialog Systems),是当前的一个研究热点。Microsoft在聊天机器人领域下了巨大赌注,其他的公司,例如Facebook(M)、Apple(Siri)、Google、WeChat和Slack也不甘落后,推出了相关的产品。这股聊天机器人的新浪潮,也在一些创业公司兴起了:试图改变用户和服务之间的交互模式的产品。

◆ 课程目标:

我们将会介绍用于搭建聊天机器人模型的深度学习技术,让同学对于“这个领域中,什么是能做到的,什么是现阶段几乎不可能实现的”有一个清晰的认知。并且学习搭建检索式聊天机器人和产生式聊天机器人。

◆ 课程收益:

√ 对智能问答技术会有很清晰的认识
√ 理解意图识别、实体关系抽取对Chatbot的作用
√ 可以学到一个聊天机器人项目实现
√ 了解聊天机器人现阶段面临的挑战

知识图谱
知识图谱的应用从最初的Google搜索,已经蔓延到了聊天机器人,大数据风控、投资、智能医疗、自适应教育、推荐系统、物联网等多个重要领域,并逐步成为不可缺少的一门人工智能技术。

◆ 课程目标:

对知识图谱技术、行业应用有很清晰的认识。学到完整知识图谱项目全生命周期所涉关键问题的解决思路。

◆ 课程收益:

√ 对知识图谱技术、行业应用全貌会有很清晰的认识
√ 可以学到一个完整知识图谱项目全生命周期所涉及到的步骤
√ 对每个关键问题的解决思路

第十五阶段:数据挖掘项目
项目名称 项目介绍 目标与收益
推荐系统
推荐系统在各种系统中广泛使用,推荐算法则是其中最核心的技术点, 为推荐系统选择正确的推荐算法是非常重要的决定。每一种推荐算法都有其优点和缺点,当然也有其限制条件,在作出决定之前,必须要一一考量。在实践中,你可能会测试几种算法,以发现哪一种最适合你的用户,学习中你也会直观地发现它们是什么以及它们的工作原理。

◆ 课程目标:

掌握推荐系统原理与工作方式,使用SparkMLlib库进行建模。并且掌握更多推荐系统相关算法的运用。

◆ 课程收益:

√ 对推荐系统技术架构、行业应用全貌会有很透彻的理解
√ 掌握SparkMLlib、Hive数仓、python脚本的综合使用
√ 掌握GBDT+LR架构在推荐系统的运用
√ 掌握FM和FFM算法在推荐系统中的运用
√ 掌握深度学习推荐算法wide and deep learning

智能商业分析
智能商业分析项目对于企业的盈利会起到非常直接的影响,会深入影响企业制定战略策略,也是很多企业非常看重的硬需求。成功案例比如,微博粉丝推广,宠物类目如何圈定投放人群,如何保持有效客户池,店铺营销,如何招揽客圈人,挖掘潜在人群,DMP帮我找到买面膜,ROI(投资回报率)翻倍,企业成本控制。

◆ 课程目标:

全面了解智能商业的价值,了解运营的价值,挖掘深层次用户行为、消费能力、行业所需,结合机器学习算法和NLP知识进行数据挖掘

◆ 课程收益:

√ 掌握智能商业分析和运营的关系
√ 通过机器学习算法、分类、预测、深层次学习特征发现
√ 深入理解企业级用户画像系统
√ 基于画像系统提高公司的收益
√ 学会销售分析、投入分析、商品分析、促销分析、行为分析、CAC模型精准分析用户、ROI精准实现变现能力

十个企业级项目
  • 电缆缺陷检测
  • 电子元件缺陷检测
  • 安全帽检测
  • 人脸识别
  • OCR识别
  • 实体关系抽取
  • 自动聊天机器人
  • 知识图谱
  • 推荐系统
  • 智能商业分析
  • 电缆缺陷检测

    项目简介

    各省市电网,需要建立一套完善的电缆线部件缺陷检测的平台,为各省市的电缆线部件缺陷提供智能化的解决方案,进一步确保电网系统的安全运行。现在有些省市的电网缺陷部件的检测仍采用人工查缺的方式,智能化的缺陷检测平台可以提高电缆线部件缺陷检测的准确率,节省成本。

    课程目标

    重点依托cascade R-CNN算法,以及mmdetection工具,完成整套从数据标注到模型训练、优化。

    课程收益

    √ 对目标检测算法有一个很好的了解,重点掌握cascade R-CNN算法
    √ 能够对mmdetection工具有一个很好的了解
    √ 对数据打标签、数据集制作、算法模型训练有一个很好的掌握
    √ 对mmdetection代码有一定了解,学会如何改进和优化算法
  • 电子元件缺陷检测

    项目简介

    在机器视觉应用中,外观检测一直是行业痛点。外观缺陷中的划痕、脏污、形态不一、大小不同、深浅和各种姿态都不同,很难用传统的视觉检测算法稳定检测。但是随着深度学习技术的发展,采用深度学习模式的外观检测程式,成为了外观检测的新方法。

    课程目标

    重点依托Faster R-CNN算法,以及TensorFlow工具,完成整套从数据标注到模型训练、优化。

    课程收益

    √ 对目标检测算法有一个很好的了解,重点掌握Faster R-CNN算法
    √ 对数据打标签、数据集制作、算法模型训练有一个很好的掌握
    √ 对Faster R CNN代码有深刻认知,学会如何改进和优化算法
  • 安全帽检测

    项目简介

    施工工地对安全帽佩戴的检测和监管力度越来越大了,从智能安全帽的应用到安全帽检测系统的智能管理,现在的安全帽检测升级版对于安全帽佩戴标准也有了新的分析算法,对未正确佩戴、悬挂等都能准确检测识别。对工作服颜色接近安全帽颜色的检测能力有了更高的提升,比传统的安全帽识别系统精度更高。

    课程目标

    重点依托Yolo one stage算法,以及Darknet工具,完成整套从数据标注到模型训练、优化。

    课程收益

    √ 对目标检测算法有一个很好的了解,重点掌握Yolo V3算法
    √ 对数据打标签、数据集制作、算法模型训练有一个很好的掌握
    √ 对Yolo V3代码有深刻认知,学会如何改进和优化算法
  • 人脸识别

    项目简介

    人脸识别,是基于人的脸部特征信息进行身份识别的一种生物识别技术。用摄像机或摄像头采集含有人脸的图像或视频流,并自动在图像中检测和跟踪人脸,进而对检测到的人脸进行脸部识别的一系列相关技术,通常也叫做人像识别、面部识别。

    课程目标

    通过一个完整的人脸识别项目,掌握人脸识别系统的开发流程和关键技术。

    课程收益

    √ 从0到1,全面剖析完整项目整个建设生命周期:需求分析、架构设计、环境部署、程序设计、模型训练。
    √ 掌握人脸识别一般过程,人脸检测、人脸对齐、人脸识别
    √ 掌握人脸检测的集成学习方法
    √ 掌握人脸检测的CNN方法
    √ 掌握人脸检测+关键点定位的多任务网络MTCNN
  • OCR识别

    项目简介

    OCR文字识别软件,指利用OCR (Optical Character Recognition,光学字符识别)技术,将图片、照片上的文字内容,直接转换为可编辑文本的软件。软件可以把图片转换成可以编辑的文字。从验证码、身份证识别、驾驶证识别、票据识别,到如今更多的识别自然场景下的整句话,甚至理解PDF里面带错别字的整段文字,应用场景可谓非常之广。

    课程目标

    掌握目标检测+RNN+CTC loss完成通用的深度学习OCR架构。

    课程收益

    √ 了解OCR应用场景和概念
    √ 掌握目标检测+RNN+CTC loss架构
    √ 掌握CTC loss中的原理
    √ 掌握深度学习训练OCR模型的整体流程和代码
  • 实体关系抽取

    项目简介

    实体关系抽取解决了原始文本中目标实体之间的关系分类问题,它也被广泛应用于文本摘要、自动问答系统、知识图谱、搜索引擎和机器翻译中。中文实体关系抽取由于中文句式和语法结构复杂,汉语有更多歧义,会影响关系分类的效果。

    课程目标

    对实体关系抽取技术、在行业应用有很清晰的认识。学会如果从语料库中通过机器学习和深度学习算法建立关系,服务于自动聊天机器人和知识图谱。

    课程收益

    √ 了解任务是从无结构的文本中抽取实体以及实体之间的关系(实体1-关系-实体2,三元组),这里的关系是我们预定义好的关系类型。
    √ 可以学到综合运用词嵌入、BiLSTM、CRF等NLP相关知识
  • 自动聊天机器人

    项目简介

    聊天机器人(Chatbot),又被称为对话代理(Conversational Agents)或对话系统(Dialog Systems),是当前的一个研究热点。Microsoft在聊天机器人领域下了巨大赌注,其他的公司,例如Facebook(M)、Apple(Siri)、Google、WeChat和Slack也不甘落后,推出了相关的产品。这股聊天机器人的新浪潮,也在一些创业公司兴起了:试图改变用户和服务之间的交互模式的产品。

    课程目标

    我们将会介绍用于搭建聊天机器人模型的深度学习技术,让同学对于“这个领域中,什么是能做到的,什么是现阶段几乎不可能实现的”有一个清晰的认知。并且学习搭建检索式聊天机器人和产生式聊天机器人。

    课程收益

    √ 对智能问答技术会有很清晰的认识
    √ 理解意图识别、实体关系抽取对Chatbot的作用
    √ 可以学到一个聊天机器人项目实现
    √ 了解聊天机器人现阶段面临的挑战
  • 知识图谱

    项目简介

    知识图谱的应用从最初的Google搜索,已经蔓延到了聊天机器人,大数据风控、投资、智能医疗、自适应教育、推荐系统、物联网等多个重要领域,并逐步成为不可缺少的一门人工智能技术。

    课程目标

    对知识图谱技术、行业应用有很清晰的认识。学到完整知识图谱项目全生命周期所涉关键问题的解决思路。

    课程收益

    √ 对知识图谱技术、行业应用全貌会有很清晰的认识
    √ 可以学到一个完整知识图谱项目全生命周期所涉及到的步骤
    √ 对每个关键问题的解决思路
  • 推荐系统

    项目简介

    推荐系统在各种系统中广泛使用,推荐算法则是其中最核心的技术点, 为推荐系统选择正确的推荐算法是非常重要的决定。每一种推荐算法都有其优点和缺点,当然也有其限制条件,在作出决定之前,必须要一一考量。在实践中,你可能会测试几种算法,以发现哪一种最适合你的用户,学习中你也会直观地发现它们是什么以及它们的工作原理。

    课程目标

    掌握推荐系统原理与工作方式,使用SparkMLlib库进行建模。并且掌握更多推荐系统相关算法的运用。

    课程收益

    √ 对推荐系统技术架构、行业应用全貌会有很透彻的理解
    √ 掌握SparkMLlib、Hive数仓、python脚本的综合使用
    √ 掌握GBDT+LR架构在推荐系统的运用
    √ 掌握FM和FFM算法在推荐系统中的运用
    √ 掌握深度学习推荐算法wide and deep learning
  • 智能商业分析

    项目简介

    智能商业分析项目对于企业的盈利会起到非常直接的影响,会深入影响企业制定战略策略,也是很多企业非常看重的硬需求。成功案例比如,微博粉丝推广,宠物类目如何圈定投放人群,如何保持有效客户池,店铺营销,如何招揽客圈人,挖掘潜在人群,DMP帮我找到买面膜,ROI(投资回报率)翻倍,企业成本控制。

    课程目标

    全面了解智能商业的价值,了解运营的价值,挖掘深层次用户行为、消费能力、行业所需,结合机器学习算法和NLP知识进行数据挖掘

    课程收益

    √ 掌握智能商业分析和运营的关系
    √ 通过机器学习算法、分类、预测、深层次学习特征发现
    √ 深入理解企业级用户画像系统
    √ 基于画像系统提高公司的收益
    √ 学会销售分析、投入分析、商品分析、促销分析、行为分析、CAC模型精准分析用户、ROI精准实现变现能力

百战程序员微信公众号

百战程序员微信小程序

©2014-2024 百战汇智(北京)科技有限公司 All Rights Reserved 北京亦庄经济开发区科创十四街 赛蒂国际工业园
网站维护:百战汇智(北京)科技有限公司
京公网安备 11011402011233号    京ICP备18060230号-3    营业执照    经营许可证:京B2-20212637