京东云今日推出 MiniMax M3 模型,优化推理

据 JD Cloud 称,MiniMax M3 于今日正式上线(6 月 1 日),该公司用于 JoyBuilder 的模型开发平台已立即与新模型集成。借助 JD Cloud 的自有推理框架和优化技术,包括 PD 分离部署、KV Cache 和推测采样,该平台在推理吞吐量和响应效率方面取得了显著提升。
免责声明:本页面信息可能来自第三方,仅供参考,不代表 Gate 的观点或意见,亦不构成任何财务、投资或法律建议。数字资产交易风险较高,请勿仅依赖本页面信息作出决策。具体内容详见声明
评论
0/400
暂无评论