当前位置: 首页 > 内训课程 > 课程内容
广告1
相关热门公开课程更多 》
相关热门内训课程更多 》
相关最新下载资料

多模态大模型原理与实践提纲

课程编号:59100

课程价格:¥25000/天

课程时长:1 天

课程人气:400

行业类别:不限行业     

专业类别:人工智能 

授课讲师:叶梓

  • 课程说明
  • 讲师介绍
  • 选择同类课
【培训对象】
相关从业者

【培训收益】
拓展对多模态AI应用领域的视野,聚焦AI赋能创新突破,提升对AI服务的技术认知与理解。

 

1部分:多模态学习概述

多模态学习的定义

多模态学习的意义

多模态数据类型:文本、图像、视频、音频等

多模态学习的应用领域(自然语言处理、计算机视觉、推荐系统等)

 

2部分:ViTBeitCLIP/BLIP

ViT模型架构概述

Patch EmbeddingPositional Encoding

BeitViT的比较

Beit在自监督学习中的应用

Beit在多模态任务中的优势

实践演示:利用ViTBeit进行图文转化的效果

CLIP模型介绍:从图像到文本的跨模态嵌入

BLIP模型架构:结合CLIP的多模态模型

CLIP/BLIP在多模态任务中的应用:图像-文本匹配、图像标注等

实践演示:使用CLIP进行图像-文本匹配任务

 

3部分:Stable DiffusionSD XL

Stable Diffusion模型概述:生成模型在图像生成中的应用

SD的原理推导

SD模型的架构

Stable Diffusion XL:扩展的Stable Diffusion模型

微调扩散模型:DreamBooth

微调扩散模型:Textual-Inversion

微调扩散模型:LoRA

微调扩散模型:Hypernetworks

Stable Diffusion在艺术创作和设计中的应用

实践演示:使用Stable Diffusion生成图像

 

4部分:微调与RLHF方法

微调的基本概念

SFT:监督微调方法

PEFT的概念

P-tuning v2 / LoRA / Freeze

微调方法在多模态学习中的应用

实践演示:对多模态大模型进行微调

 

5部分:与人类偏好对齐

强化学习基础概述

DPO:直接偏好优化

PPO:近端策略优化

llama-factory简介

实践演示:利用llama-factory对大模型进行RLHF

 

6部分:多模态大模型

qwen_vl_chat

Yi_vl_chat

LLaVa

open-sora

chatTTS

实践演示:使用qwen_vlYi_vl_chat进行视觉问答任务

 

 

咨询电话:
0571-86155444
咨询热线:
  • 微信:13857108608
联系我们