Skip to content

机器学习 · 课程规划

🍁 2025版 🍁

📌 课程定位

🔎 前置要求

  • 了解基本的 Python 语法
  • 可以回想起基本的数学概念

🔎 课程收益

  • 顺应时代,入行人工智能这个崭新的领域,能够独立开发机器学习项目
  • 夯实人工智能基础,为将来深入其它领域(深度学习、大模型、强化学习等)做好算法准备

📌 课程大纲

🔎 模块1:机器学习概论

  • 机器:计算机软硬件系统
  • 学习:性能提升
  • 任务:从老数据中挖掘规律,作用于新数据中
  • 算法:偏抽象,计算机解决某个问题的流程
  • 模型:偏具体,实现了某个算法的具体代码
  • 训练:学习过程,挖掘老数据中的规律
  • 推理:泛化过程,把规律作用于新数据
  • 有监督学习:有输入特征,也有输出标签
  • 无监督学习:有输入特征,没有输出标签
  • 分类问题:预测(输出)一个离散量的问题
  • 回归问题:预测(输出)一个连续量的问题

🔎 模块2:开发环境搭建

  • 通过 Python 解释器安装环境
    1. https://www.python.org/
    2. pip install jupyterlab -U
    3. pip install numpy pandas matplotlib scikit-learn -U
    
  • 通过 Anaconda 安装环境
    1. https://www.anaconda.com/
    2. pip install jupyterlab -U
    3. pip install numpy pandas matplotlib scikit-learn -U
    
  • 安装 VS Code 编辑器
    1. https://code.visualstudio.com/
    2. Python 扩展
    3. Markdown 扩展
    4. 通义灵码 扩展
    

🔎 模块3:特征工程

  • 特征构建:业务知识,业务专家
  • 离散特征:有多少个离散值
  • 连续特征:有多少个连续值
  • 特征编码:0,1, ... N-1, One - Hot

🔎 模块4:特征筛选和降维

  • 特征选择:线性相关性,皮尔逊相关系数
  • 特征降维:主成分分析 PCA

🔎 模块5:线性回归算法

  • 线性关系的定义及特点
  • 线性回归的假设函数
  • 基于梯度下降法求解参数
  • 线性回归的必备 API
  • 线性回归的经典案例

🔎 模块6:逻辑回归算法

  • 逻辑回归中的逻辑是什么意思?
  • 逻辑回归的假设函数
  • Sigmoid 函数详解
  • 梯度下降法求解参数
  • 逻辑回归的必备 API
  • 逻辑回归的经典案例

🔎 模块7:KNN算法

  • KNN: K-Nearest Neighbors 算法
  • KNN的算法思想:近朱者赤近墨者黑
  • KNN中距离的度量:欧氏距离和余弦相似度
  • KNN分类算法的流程
  • KNN回归算法的流程
  • KNN算法的必备 API
  • KNN的经典案例
  • KNN算法中的 K 该如何确定

🔎 模块8:决策树算法

  • 信息的度量
  • 系统混乱度的度量:熵,基尼系数,方差
  • 熵的计算公式
  • 基尼系数的计算公式
  • 分类树的构建思路和推理流程
  • 回归树的构建思路和推理流程
  • 决策树的必备 API
  • 决策树的经典案例
  • 决策树算法中的剪枝

🔎 模块9:朴素贝叶斯算法

  • 概率和条件概率
  • 贝叶斯公式
  • 朴素高斯贝叶斯的假设
  • 朴素高斯贝叶斯算法的推理流程
  • 贝叶斯算法的必备 API
  • 贝叶斯算法的经典案例

🔎 模块10:支持向量机算法

  • 支持向量机的核心算法思想
  • 支持向量机的核心应用场景
  • 支持向量机的核心API
  • 支持向量机分类案例
  • 支持向量机回归案例

🔎 模块11:聚类算法

  • KMeans 算法的核心思想
  • KMeans 算法的核心 API
  • KMeans 算法的经典案例
  • KMeans 算法中 K 的确定

🔎 模块12:集成学习

  • Voting 集成思想
  • Bagging 集成思想
  • Stacking 集成思想
  • Boosting 集成思想
  • 随机森林算法核心思想
  • AdaBoost 算法核心思想
  • GBDT 算法核心思想
  • XGBoost 算法核心思想
  • LightGBM 算法核心思想
  • CatBoost 算法核心思想
  • 集成学习的核心 API
  • 集成学习的经典案例