ERNIE-4.5-VL-28B-A3B-Paddle 模型部署教程ERNIE 4.5 亮点
ERNIE 4.5 模型的高级功能,特别是基于 MoE 的 A47B 和 A3B 系列,由以下几个关键技术革新支持:
在视觉-语言模型的微调阶段,视觉与语言之间的深度整合在复杂任务如理解、推理和生成中起着决定性作用。为了增强模型在多模态任务上的泛化能力和适应性,我们专注于三个核心能力——图像理解、任务特定微调以及多模态链式思维推理,并进行了系统性的数据构建和训练策略优化。此外,我们使用 RLVR(可验证奖励的强化学习)进一步提高了对齐度和性能。经过 SFT 和 RL 阶段后,我们得到了 ERNIE-4.5-VL-28B-A3B。
模型概述
ERNIE-4.5-VL-28B-A3B 是一个多模态 MoE 聊天模型,总参数为 28B,每个 token 激活参数为 3B。以下是模型配置详情:
| 键 | 值 |
|---|---|
| 模态 | 文本与视觉 |
| 训练阶段 | 后训练 |
| 参数(总/激活) | 28B / 3B |
| 层数 | 28 |
| 头(Q/KV) | 20 / 4 |
| 文本专家(总/激活) | 64 / 6 |
| 视觉专家(总/激活) | 64 / 6 |
| 共享专家 | 2 |
| 上下文长度 | 131072 |
基础环境最低要求说明:
| 环境名称 | 版本信息 1 |
|---|---|
| Ubuntu | 22.04.4 LTS |
| Cuda | V12.6 |
| Python | 3.10~3-12 |
| NVIDIA Corporation | A100 SXM4*1 |

# 克隆ERNIE-4.5-VL-28B-A3B-Paddle项目
git clone https://github.com/PaddlePaddle/ERNIE.git

# 创建一个名为 ernie4.5的新虚拟环境,并指定 Python 版本为 3.10
conda create -n ernie4.5 python=3.10 -y

激活ernie4.5,并进入到 ERNIE目录中,安装 requirements.txt 依赖。
# 切换到项目工作目录
cd ERNIE/requirements/gpu/
# 激活 Qcoder 虚拟环境
conda activate ERNIE_4.5
# 在 ERNIE_4.5 环境中安装 requirements.txt 依赖
pip install -r requirements.txt
预训练模型太大需要放到数据网盘sj-fs里面。从huggingface中下载模型
1.返回到ERNIE目录下
cd ERNIE
2.执行以下代码下载预训练权重
huggingface-cli download baidu/ERNIE-4.5-0.3B-Paddle --local-dir baidu/ERNIE-4.5-0.3B-Paddle

3.模型下载完成后,依次执行以下代码安装所需框架
python -m pip install fastdeploy-gpu -i https://www.paddlepaddle.org.cn/packages/stable/fastdeploy-gpu-80_90/ --extra-index-url https://mirrors.tuna.tsinghua.edu.cn/pypi/web/simple
python -m pip install fastdeploy-gpu -i https://www.paddlepaddle.org.cn/packages/stable/fastdeploy-gpu-86_89/ --extra-index-url https://mirrors.tuna.tsinghua.edu.cn/pypi/web/simple
# 切换到项目目录
cd /ERNIE
# 激活虚拟环境
conda activate ernie4.5
# 启动 api_server 服务到后台
python -m fastdeploy.entrypoints.openai.api_server \
--model baidu/ERNIE-4.5-VL-28B-A3B-Paddle \
--port 8180 \
--metrics-port 8181 \
--engine-worker-queue-port 8182 \
--max-model-len 32768 \
--enable-mm \
--reasoning-parser ernie-45-vl \
--max-num-seqs 32
# 设置环境变量并启动 WebUI 到后台
cd /ERNIE/cookbook
python conversation_demo.py \
--model_map '{"ERNIE-4.5-VL-28B-A3B": "http://localhost:8180/v1"}' \
--server-port 8080 \
--server-name 0.0.0.0 \
--max_char 32768 \
--max_retry_num 3
出现以下页面,即是模型已搭建完成。

点击此处,立即体验ERNIE-4.5-VL-28B-A3B-Paddle!
