机器学习零基础实战训练营

第一章
机器学习概述
机器学习的一般过程
机器学习工作流
机器学习算法分类
机器学习应用场景
机器学习常用名词
第二章
机器学习基础数学、统计学
机器学习常见数学符号
中学数学
  • 指数和对数的定义及其性质
  • 方程、直线方程、抛物线方程
高等数学
  • 微积分、微分学、偏导数
  • 导数定义和性质
  • 初等函数求导、导数的四则运算
  • 复合函数导数求解和链式法则
线性代数
  • 线性代数、行列式及性质、行列式运算
  • 矩阵定义、常见的矩阵、单位矩阵
  • 矩阵运算、矩阵积、矩阵转置、逆矩阵、矩阵相关性质
  • 标量、向量、矩阵、张量
概率论
  • 概率论、事件、随机试验、样本空间
  • 条件概率、联合概率、先验概率、后验概率、事件独立性
  • 全概率公式、贝叶斯定理
  • 似然函数、最大似然估计MLE
第三章
机器学习算法、算法原理、数学推导
Anaconda教程
  • Anaconda安装和启动
  • IPython教程
  • JupyterNotebook使用、快捷键
最近邻算法
  • KNN算法原理
  • 距离算法、欧氏距离、曼哈顿距离
  • KNN算法应用、KNN分类与回归
  • KNN算法案例
线性回归
  • 线性回归原理
  • 线性回归数学推导过程
  • 线性回归方程、预测函数、损失函数、最小二乘、高斯分布、矩阵、偏导数、矩阵求逆、矩阵转置、矩阵积等
逻辑回归
  • 逻辑回归原理
  • 逻辑回归数学推导过程
  • sigmoid函数、概率、二分类、最大似然估计
  • 梯度下降算法、学习率、参数更新、指数对数求偏导
  • 逻辑回归应用
  • 逻辑回归案例
决策树算法
  • 决策树算法原理
  • 树、根节点、叶子节点、属性分裂
  • 决策树ID3算法、信息熵、CART算法、gini系数求解
  • 决策树算法应用
  • 决策树算法案例
随机森林算法
  • 随机森林算法原理
  • 集成算法、决策树、分类投票和回归平均
  • 随机森林算法应用
  • 随机森林算法案例
朴素贝叶斯算法
  • 朴素贝叶斯算法原理
  • 朴素、独立性假设
  • 贝叶斯定理、全概率公式
  • 文本分类、文档分词、特征词向量、稀疏矩阵
  • 朴素贝叶斯算法应用
  • 高斯朴素贝叶斯、多项式朴素贝叶斯、伯努利朴素贝叶斯
  • 朴素贝叶斯算法案例
支持向量机SVM
  • 支持向量机原理
  • 支持向量、点到线距离、核函数、对偶性质、拉格朗日乘数法
  • SVC分类算法、SVR回归算法
  • SVM算法应用
  • SVM算法案例
聚类算法
  • 无监督学习
  • KMeans聚类算法原理
  • KMeans使用场景、可视化
  • DBSCAN聚类算法原理
  • DBSCAN使用场景、可视化
  • 聚类算法评估、轮廓系数
集成算法
  • 无监督学习
  • 并行集成算法Bagging、Random Forest、ExtraTrees
  • 序列集成算法
数据降维和自动调参
  • PCA降维
  • 交叉验证KFold、StratifiedKFold
  • 自动调参、网格搜索交叉验证GridSearchCV
特征工程
  • 数据预处理、数据清洗、数据类型处理
  • 异常值、重复值、缺失值处理
  • 特征工程、特征编码、标签编码、独热编码
  • 特征选择、特征重要性
  • 特征衍生、特征缩放、归一化
  • 数据不平衡、SMOTE过采样、欠采样
机器学习评估指标
  • 准确率Accuracy
  • 召回率Recall
  • 精确率Precision
  • F1 Score值
  • AUC值和ROC曲线
  • 误差、MSE、MAE、R^2
  • 轮廓系数
第四章
机器学习应用、实战项目
用户流失预测模型
银行反欺诈模型
  • 项目背景、业务分析
  • 数据采集和加载
  • EDA探索性数据分析
  • 数据预处理、特征工程、SMOTE过采样
  • 算法选择、调参、建模
  • 模型评估