表1 盘古NLP大模型规格
模型支持区域
模型名称
可处理最大上下文长度
可处理最大输出长度
说明
西南-贵阳一
Pangu-NLP-N1-Chat-32K-20241130
32K
4K
2024年11月发布的版本,支持8K序列长度训练,4K/32K序列长度推理。全量微调、LoRA微调8个训练单元起训,1个推理单元即可部署。
Pangu-NLP-N1-Chat-128K-20241130
128K
4K
2024年11月发布的版本,仅支持128K序列长度推理。
Pangu-NLP-N1-32K-3.1.34
32K
4K
2024年11月发布的版本,支持8K序列长度训练,4K/32K序列长度推理。全量微调、LoRA微调8个训练单元起训,1个推理单元即可部署,4K支持256并发,32K支持256并发。
Pangu-NLP-N1-32K-3.2.36
32K
4K
2025年1月发布的版本,支持32K序列长度训练,4K/32K序列长度推理。全量微调、LoRA微调8个训练单元起训,1个推理单元即可部署,4K支持256并发,32K支持256并发。
Pangu-NLP-N1-128K-3.1.34
128K
4K
2024年11月发布的版本,仅支持128K序列长度推理,4卡2并发。
Pangu-NLP-N1-128K-3.2.36
128K
4K
2025年1月发布的版本,仅支持128K序列长度推理,4个推理单元8并发。
Pangu-NLP-N2-Base-20241030
-
4K
2024年11月发布的版本,仅支持模型增量预训练。32个训练单元起训,预训练后的模型版本需要通过微调之后,才可支持推理部署。
Pangu-NLP-N2-Chat-32K-20241030
32K
4K
2024年10月发布版本,支持8K序列长度训练,4K/32K序列长度推理。全量微调32个训练单元起训,LoRA微调8个训练单元起训,4个推理单元即可部署。此模型版本差异化支持预训练特性、INT8量化特性。
Pangu-NLP-N2-4K-3.2.35
4K
4K
2025年1月发布的版本,支持4K序列长度训练,4K序列长度推理。全量微调32个训练单元起训,LoRA微调8个训练单元起训,4个推理单元即可部署,支持192并发。此模型版本差异化支持预训练特性、INT8量化特性。
Pangu-NLP-N2-32K-3.1.35
32K
4K
2024年12月发布版本,支持8K序列长度训练,4K/32K序列长度推理。全量微调32个训练单元起训,LoRA微调8个训练单元起训,4个推理单元即可部署,4K支持64并发,32K支持64并发。此模型版本差异化支持预训练特性、INT8量化特性。
Pangu-NLP-N2-32K-3.1.35
32K
4K
2025年1月发布的版本,支持32K序列长度训练,32K序列长度推理。全量微调32个训练单元起训,LoRA微调8个训练单元起训,4个推理单元即可部署,支持128并发。此模型版本差异化支持预训练特性、INT8量化特性。
Pangu-NLP-N2-128K-3.1.35
128K
4K
2024年12月发布的版本,仅支持128K序列长度推理部署,8个推理单元64并发。
Pangu-NLP-N2-256K-3.1.35
256K
4K
2024年12月发布的版本,仅支持256K序列长度推理部署,8个推理单元64并发。
Pangu-NLP-N4-Chat-4K-20241130
32K
4K
2024年11月发布的版本,支持4K序列长度训练,4K序列长度推理。全量微调64个训练单元起训,LoRA微调32个训练单元起训,8个训练单元即可部署。此模型版本差异化支持预训练、INT8/INT4量化特性。
Pangu-NLP-N4-Chat-32K-20241130
32K
4K
2024年11月发布的版本,仅支持32K序列长度推理部署。
Pangu-NLP-N4-4K-2.5.32
4K
4K
2024年11月发布的版本,支持4K序列长度训练,4K序列长度推理。全量微调64个训练单元起训,LoRA微调32个训练单元起训,8个推理单元即可部署,支持64并发。此模型版本差异化支持预训练、INT8/INT4量化特性。
Pangu-NLP-N4-4K-2.5.35
4K
4K
2025年1月发布的版本,支持4K序列长度训练,4K序列长度推理。全量微调64个训练单元起训,LoRA微调32个训练单元起训,8个推理单元即可部署,支持128并发。此模型版本差异化支持预训练、INT8/INT4量化特性。
Pangu-NLP-N4-32K-2.5.32
32K
4K
2024年11月发布的版本,仅支持32K序列长度推理部署,8个推理单元64并发。
Pangu-NLP-N4-32K-2.5.35
32K
4K
2025年1月发布的版本,仅支持32K序列长度推理部署,8个推理单元128并发。