机器学习 · 课程规划
🍁 2025版 🍁
📌 课程定位
🔎 前置要求
- 了解基本的 Python 语法
- 可以回想起基本的数学概念
🔎 课程收益
- 顺应时代,入行人工智能这个崭新的领域,能够独立开发机器学习项目
- 夯实人工智能基础,为将来深入其它领域(深度学习、大模型、强化学习等)做好算法准备
📌 课程大纲
🔎 模块1:机器学习概论
- 机器:计算机软硬件系统
- 学习:性能提升
- 任务:从老数据中挖掘规律,作用于新数据中
- 算法:偏抽象,计算机解决某个问题的流程
- 模型:偏具体,实现了某个算法的具体代码
- 训练:学习过程,挖掘老数据中的规律
- 推理:泛化过程,把规律作用于新数据
- 有监督学习:有输入特征,也有输出标签
- 无监督学习:有输入特征,没有输出标签
- 分类问题:预测(输出)一个离散量的问题
- 回归问题:预测(输出)一个连续量的问题
🔎 模块2:开发环境搭建
- 通过
Python
解释器安装环境1. https://www.python.org/ 2. pip install jupyterlab -U 3. pip install numpy pandas matplotlib scikit-learn -U
- 通过
Anaconda
安装环境1. https://www.anaconda.com/ 2. pip install jupyterlab -U 3. pip install numpy pandas matplotlib scikit-learn -U
- 安装
VS Code
编辑器1. https://code.visualstudio.com/ 2. Python 扩展 3. Markdown 扩展 4. 通义灵码 扩展
🔎 模块3:特征工程
- 特征构建:业务知识,业务专家
- 离散特征:有多少个离散值
- 连续特征:有多少个连续值
- 特征编码:0,1, ... N-1, One - Hot
🔎 模块4:特征筛选和降维
- 特征选择:线性相关性,皮尔逊相关系数
- 特征降维:主成分分析 PCA
🔎 模块5:线性回归算法
- 线性关系的定义及特点
- 线性回归的假设函数
- 基于梯度下降法求解参数
- 线性回归的必备 API
- 线性回归的经典案例
🔎 模块6:逻辑回归算法
- 逻辑回归中的逻辑是什么意思?
- 逻辑回归的假设函数
- Sigmoid 函数详解
- 梯度下降法求解参数
- 逻辑回归的必备 API
- 逻辑回归的经典案例
🔎 模块7:KNN算法
- KNN: K-Nearest Neighbors 算法
- KNN的算法思想:近朱者赤近墨者黑
- KNN中距离的度量:欧氏距离和余弦相似度
- KNN分类算法的流程
- KNN回归算法的流程
- KNN算法的必备 API
- KNN的经典案例
- KNN算法中的 K 该如何确定
🔎 模块8:决策树算法
- 信息的度量
- 系统混乱度的度量:熵,基尼系数,方差
- 熵的计算公式
- 基尼系数的计算公式
- 分类树的构建思路和推理流程
- 回归树的构建思路和推理流程
- 决策树的必备 API
- 决策树的经典案例
- 决策树算法中的剪枝
🔎 模块9:朴素贝叶斯算法
- 概率和条件概率
- 贝叶斯公式
- 朴素高斯贝叶斯的假设
- 朴素高斯贝叶斯算法的推理流程
- 贝叶斯算法的必备 API
- 贝叶斯算法的经典案例
🔎 模块10:支持向量机算法
- 支持向量机的核心算法思想
- 支持向量机的核心应用场景
- 支持向量机的核心API
- 支持向量机分类案例
- 支持向量机回归案例
🔎 模块11:聚类算法
- KMeans 算法的核心思想
- KMeans 算法的核心 API
- KMeans 算法的经典案例
- KMeans 算法中 K 的确定
🔎 模块12:集成学习
- Voting 集成思想
- Bagging 集成思想
- Stacking 集成思想
- Boosting 集成思想
- 随机森林算法核心思想
- AdaBoost 算法核心思想
- GBDT 算法核心思想
- XGBoost 算法核心思想
- LightGBM 算法核心思想
- CatBoost 算法核心思想
- 集成学习的核心 API
- 集成学习的经典案例