服务部署计费

用户使用 VastTrain 平台时,针对已编译完成的模型,用户可以部署为服务,以便在实际应用场景中对服务进行调用。服务启动后,平台会根据推理算力使用时长进行计费,详细计费规则如表 21所示。

表 21 服务部署计费规则

计费项

说明

计费规则

服务部署

对已编译的模型进行部署,以便在实际应用场景中进行调用。

根据推理算力使用时长进行计费。计费周期为每 6分钟扣一次费用,不满6分钟时按6分钟扣费。不同模型计费规则不同,详细可参考表 22

表 22 模型服务计费规则

模型

计费说明(积分/小时)

LLaMA2-7B

7.76

LLaMA2-7B-Chat

7.76

LLaMA2-13B

15.52

LLaMA2-13B-Chat

15.52

LLaMA2-70B

31.04

LLaMA2-70B-Chat

31.04

ChatGLM2-6B

7.76

Baichuan2-7B-Base

7.76

Baichuan2-7B-Chat

7.76

Baichuan2-13B-Base

15.52

Baichuan2-13B-Chat

15.52

Qwen1.5-7B

7.76

Qwen1.5-7B-Chat

7.76

Qwen-7B

7.76

Qwen-7B-Chat

7.76

Qwen2-7B-Chat

7.76

Qwen2-7B

7.76