浪潮信息元腦R1推理服務(wù)器已完成對開源框架SGLang最新版本的深度適配,成功實現(xiàn)在單機高性能運行DeepSeek R1 671B模型時可最大支持超過1000路的用戶并發(fā)訪問。元腦R1推理服務(wù)器NF5688G7搭載FP8計算引擎,針對DeepSeek R1 671B模型部署速度快且無精度損失,顯存帶寬高達(dá)4.8TB/s,完美契合模型技術(shù)特征,實現(xiàn)推理解碼階段極致加速。GPU P2P帶寬達(dá)900GB/s,保障最佳通訊性能。(美通社)