Skip to content

计算机视觉 · 课程规划

🍁 2025版 🍁

📌 课程定位

🔎 前置要求

  • 了解基本的 Python 语法
  • 可以回想起基本的数学概念
  • 了解一些基本的深度学习概念

🔎 课程收益

  • 掌握计算机视觉领域各分支的算法
  • 可以独立开发计算机视觉相关项目

📌 课程大纲

🔎 模块1:开发环境搭建

  • 通过 Python 解释器安装环境
    1. https://www.python.org/
    2. pip install jupyterlab -U
    3. pip install numpy pandas matplotlib scikit-learn -U
    4. pip install torch -U
    5. pip install opencv-python -U
    6. pip install torchvision -U
    
  • 通过 Anaconda 安装环境
    1. https://www.anaconda.com/
    2. pip install jupyterlab -U
    3. pip install numpy pandas matplotlib scikit-learn -U
    4. pip install torch -U
    5. pip install opencv-python -U
    6. pip install torchvision -U
    
  • 安装 VS Code 编辑器
    1. https://code.visualstudio.com/
    2. Python 扩展
    3. Markdown 扩展
    4. 通义灵码 扩展
    

🔎 模块2:基本图像处理

  • 基于 Matplotlib 实现图像读取和显示
  • 基于 PIL 实现图像读取和显示
  • 基于 PIL 实现图像的旋转、缩放、裁剪、平移等操作
  • 基于 OpenCV 实现图像读取和显示
  • 基于 OpenCV 实现视频的读取、显示和保存
  • 基于 OpenCV 实现点、线、矩形、椭圆、文字等绘制

🔎 模块3:图像卷积操作

  • 卷积操作:滑窗操作,相乘再相加
  • 卷积的意义: 抽取特征
  • 基于 OpenCV 实现卷积操作 cv2.filter2D
  • PyTorch 卷积组件: nn.Conv2d, nn.MaxPool2d, nn.AvgPool2d, nn.ReLU, nn.Linear, nn.Softmax

🔎 模块4:图像分类算法

  • 图像分类算法搭建理念:卷积层--> 规范化层 --> 激活层 --> 池化层 --> 展平 --> 全连接层
  • LeNet 网络搭建及实战: 开山之作
  • AlexNet 网络搭建及实战:层数更多
  • VGG 网络搭建及实战:层数继续变多
  • ResNet 网络搭建及实战:短接层
  • YOLO11 图像分类实战

🔎 模块5:目标检测算法

  • 目标检测算法概述
  • 目标检测数据格式
  • 目标检测数据标注
  • 目标检测网络架构
  • 目标检测模型训练
  • 目标检测项目实战

🔎 模块6:实例分割算法

  • 实例分割算法概述
  • 实例分割数据格式
  • 实例分割数据标注
  • 实例分割网络架构
  • 实例分割模型训练
  • 实例分割项目实战

🔎 模块7:姿势识别算法

  • 姿势识别算法概述
  • 姿势识别数据格式
  • 姿势识别数据标注
  • 姿势识别网络架构
  • 姿势识别模型训练
  • 姿势识别项目实战

🔎 模块8:目标追踪算法

  • 目标追踪算法概述
  • 基于 BoT-SORT 的目标追踪
  • 基于 ByteTrack 的目标追踪
  • 目标追踪算法实战