服务部署计费
用户使用 VastTrain 平台时,针对已编译完成的模型,用户可以部署为服务,以便在实际应用场景中对服务进行调用。服务启动后,平台会根据推理算力使用时长进行计费,详细计费规则如表 21所示。
计费项 |
说明 |
计费规则 |
---|---|---|
服务部署 |
对已编译的模型进行部署,以便在实际应用场景中进行调用。 |
根据推理算力使用时长进行计费。计费周期为每 6分钟扣一次费用,不满6分钟时按6分钟扣费。不同模型计费规则不同,详细可参考表 22。 |
模型 |
计费说明(积分/小时) |
---|---|
LLaMA2-7B |
7.76 |
LLaMA2-7B-Chat |
7.76 |
LLaMA2-13B |
15.52 |
LLaMA2-13B-Chat |
15.52 |
LLaMA2-70B |
31.04 |
LLaMA2-70B-Chat |
31.04 |
ChatGLM2-6B |
7.76 |
Baichuan2-7B-Base |
7.76 |
Baichuan2-7B-Chat |
7.76 |
Baichuan2-13B-Base |
15.52 |
Baichuan2-13B-Chat |
15.52 |
Qwen1.5-7B |
7.76 |
Qwen1.5-7B-Chat |
7.76 |
Qwen-7B |
7.76 |
Qwen-7B-Chat |
7.76 |
Qwen2-7B-Chat |
7.76 |
Qwen2-7B |
7.76 |