计算机视觉 · 课程规划
🍁 2025版 🍁
📌 课程定位
🔎 前置要求
- 了解基本的 Python 语法
- 可以回想起基本的数学概念
- 了解一些基本的深度学习概念
🔎 课程收益
- 掌握计算机视觉领域各分支的算法
- 可以独立开发计算机视觉相关项目
📌 课程大纲
🔎 模块1:开发环境搭建
- 通过
Python
解释器安装环境1. https://www.python.org/ 2. pip install jupyterlab -U 3. pip install numpy pandas matplotlib scikit-learn -U 4. pip install torch -U 5. pip install opencv-python -U 6. pip install torchvision -U
- 通过
Anaconda
安装环境1. https://www.anaconda.com/ 2. pip install jupyterlab -U 3. pip install numpy pandas matplotlib scikit-learn -U 4. pip install torch -U 5. pip install opencv-python -U 6. pip install torchvision -U
- 安装
VS Code
编辑器1. https://code.visualstudio.com/ 2. Python 扩展 3. Markdown 扩展 4. 通义灵码 扩展
🔎 模块2:基本图像处理
- 基于 Matplotlib 实现图像读取和显示
- 基于 PIL 实现图像读取和显示
- 基于 PIL 实现图像的旋转、缩放、裁剪、平移等操作
- 基于 OpenCV 实现图像读取和显示
- 基于 OpenCV 实现视频的读取、显示和保存
- 基于 OpenCV 实现点、线、矩形、椭圆、文字等绘制
🔎 模块3:图像卷积操作
- 卷积操作:滑窗操作,相乘再相加
- 卷积的意义: 抽取特征
- 基于 OpenCV 实现卷积操作 cv2.filter2D
- PyTorch 卷积组件: nn.Conv2d, nn.MaxPool2d, nn.AvgPool2d, nn.ReLU, nn.Linear, nn.Softmax
🔎 模块4:图像分类算法
- 图像分类算法搭建理念:卷积层--> 规范化层 --> 激活层 --> 池化层 --> 展平 --> 全连接层
- LeNet 网络搭建及实战: 开山之作
- AlexNet 网络搭建及实战:层数更多
- VGG 网络搭建及实战:层数继续变多
- ResNet 网络搭建及实战:短接层
- YOLO11 图像分类实战
🔎 模块5:目标检测算法
- 目标检测算法概述
- 目标检测数据格式
- 目标检测数据标注
- 目标检测网络架构
- 目标检测模型训练
- 目标检测项目实战
🔎 模块6:实例分割算法
- 实例分割算法概述
- 实例分割数据格式
- 实例分割数据标注
- 实例分割网络架构
- 实例分割模型训练
- 实例分割项目实战
🔎 模块7:姿势识别算法
- 姿势识别算法概述
- 姿势识别数据格式
- 姿势识别数据标注
- 姿势识别网络架构
- 姿势识别模型训练
- 姿势识别项目实战
🔎 模块8:目标追踪算法
- 目标追踪算法概述
- 基于 BoT-SORT 的目标追踪
- 基于 ByteTrack 的目标追踪
- 目标追踪算法实战