Skip to content

李晓华 @ 2025

🍁计算机视觉

计算机视觉 · 课程规划

🍁 2025版 🍁

📌 课程定位

🔎 前置要求

了解基本的 Python 语法
可以回想起基本的数学概念
了解一些基本的深度学习概念

🔎 课程收益

掌握计算机视觉领域各分支的算法
可以独立开发计算机视觉相关项目

📌 课程大纲

🔎 模块1：开发环境搭建

通过 Python 解释器安装环境

1. https://www.python.org/
2. pip install jupyterlab -U
3. pip install numpy pandas matplotlib scikit-learn -U
4. pip install torch -U
5. pip install opencv-python -U
6. pip install torchvision -U

通过 Anaconda 安装环境

1. https://www.anaconda.com/
2. pip install jupyterlab -U
3. pip install numpy pandas matplotlib scikit-learn -U
4. pip install torch -U
5. pip install opencv-python -U
6. pip install torchvision -U

安装 VS Code 编辑器

1. https://code.visualstudio.com/
2. Python 扩展
3. Markdown 扩展
4. 通义灵码 扩展

🔎 模块2：基本图像处理

基于 Matplotlib 实现图像读取和显示
基于 PIL 实现图像读取和显示
基于 PIL 实现图像的旋转、缩放、裁剪、平移等操作
基于 OpenCV 实现图像读取和显示
基于 OpenCV 实现视频的读取、显示和保存
基于 OpenCV 实现点、线、矩形、椭圆、文字等绘制

🔎 模块3：图像卷积操作

卷积操作：滑窗操作，相乘再相加
卷积的意义: 抽取特征
基于 OpenCV 实现卷积操作 cv2.filter2D
PyTorch 卷积组件: nn.Conv2d, nn.MaxPool2d, nn.AvgPool2d, nn.ReLU, nn.Linear, nn.Softmax

🔎 模块4：图像分类算法

图像分类算法搭建理念：卷积层--> 规范化层 --> 激活层 --> 池化层 --> 展平 --> 全连接层
LeNet 网络搭建及实战: 开山之作
AlexNet 网络搭建及实战：层数更多
VGG 网络搭建及实战：层数继续变多
ResNet 网络搭建及实战：短接层
YOLO11 图像分类实战

🔎 模块5：目标检测算法

目标检测算法概述
目标检测数据格式
目标检测数据标注
目标检测网络架构
目标检测模型训练
目标检测项目实战

🔎 模块6：实例分割算法

实例分割算法概述
实例分割数据格式
实例分割数据标注
实例分割网络架构
实例分割模型训练
实例分割项目实战

🔎 模块7：姿势识别算法

姿势识别算法概述
姿势识别数据格式
姿势识别数据标注
姿势识别网络架构
姿势识别模型训练
姿势识别项目实战

🔎 模块8：目标追踪算法

目标追踪算法概述
基于 BoT-SORT 的目标追踪
基于 ByteTrack 的目标追踪
目标追踪算法实战